编辑 | 宋慧
出品 | CSDN
近年来,生成式人工智能(Generative AI,简称“生成式 AI”或“GenAI”)迅猛发展,在自然语言处理、图像生成等领域接连实现重大突破。生成式 AI 之所以能取得这般进展,归根结底得益于以下两大技术基石:
首先是计算能力的指数级增长。GPU、TPU 等专用芯片的出现大幅提升了深度学习的训练和推理速度。同时,云计算平台也提供了弹性的算力资源进行模型训练,降低了大模型的训练成本。这些硬件条件为大模型提供强大的算力支持,成就了数百亿参数量级的庞大深度神经网络。
其次是算法架构的不断优化。从早期的 Seq2Seq,到 BERT 的 Transformer,再到 GPT-3 的 Decoder-only 语言模型,生成式 AI 的算法框架不断升级,模型也日益庞大。大量参数带来更强的表达能力和内容理解能力。较之早期局限于特定领域的 AI,生成式 AI 基于通用算法框架,正在应用到各行各业。
随着算力和算法发展,生成式 AI 的应用范围还将不断扩大,带来生产力的极大提升,甚至重构所有软件和应用,成为企业数字化转型的新引擎。在这个前所未有的变革浪潮中,如何利用生成式 AI,将 AI 技术应用于业务创新,是所有企业关注的重要话题。CSDN 近期专访了德勤中国管理咨询的三位合伙人韩光辉、徐凯波与管延放,三位合伙人为 CSDN 带来了宏观和专业的生成式 AI 技术洞察。
降本增效的生成式 AI 与行业模型,正在用于三大场景
AI 大模型在今年取得了快速发展。相比以往的 AI 技术,生成式 AI 最大的特点是运用巨大的神经网络模型主动理解并涌现出新的内容。这种能力源自模型训练使用的海量多样化数据,以及模型本身的架构设计。韩光辉表示 ,AI 其实已经经过了几十年的发展,近年来借由用户侧的生成式 AI 应用而爆火;不过企业想要发挥生成式 AI 的作用和价值,还需要用生成式 AI 形成对外服务的产品,以及在企业内部管理中将生成式 AI 用于降本增效。
管延放总结了生成式 AI 正在展现出效率提升、成本降低、质量改善、业务创新、洞察广度等核心价值。和人类相比,生成式 AI 可以全天不间断执行任务,提升内容整体质量与质量基线(不过高质量任务目前仍由人类创造);生成式 AI 也实现了千人千面的服务能力与发散性能力,促进新的业务场景和业务创新的加速产生;海量数据支撑也让生成式 AI 可提供更全面和广泛覆盖的数据与洞察,这些都将为企业提升效率,最终降低整体成本。
对于目前“千模大战”、行业模型涌现的情况,德勤认为生成式 AI 应用场景大体可以分为三个方向。第一个方向是基于问答形式的知识获取,这类场景将突破传统检索的局限,提供更智能、更便捷的知识获取体验。第二个方向是内容自动化生成,用户只需提供关键词或思路,生成式 AI 系统即可自动生成文案、代码、设计作品等多种形式的内容。不过管延放也提到,尽管现阶段生成式 AI 在固定模板内容上已经可实现较好效果,但自动化生成可靠长文本内容还面临挑战,需要继续优化。第三个方向是利用生成式 AI 实现思考与计划协作,例如让AI 扮演虚拟助手,协助人类进行方案思考、计划制定。相较于直接输出结果,此场景更强调人机互动式协作,目前还处于初期探索阶段,有待技术进一步突破。德勤专家也表示,短期内,知识获取和内容自动化将是企业较易实现商业化的领域;而协同思考和计划还要经过一段技术迭代的过程。未来,这三个方向上,各类场景都将持续渗透到更多垂直领域,如客户服务、医疗健康、交通运输等,从而重塑行业工作模式,甚至未来将成为机器和人共同工作的模式。
另外,对企业来说,拥有生成式 AI 算法和模型还不够,数据和云计算作为基础资源也至关重要。在数据方面,需要重点关注数据质量和数据治理,例如构建单一可靠的数据来源,对现有数据进行有效的组织和治理,实现不同系统之间的数据互通,这可大幅提升模型的运行准确性,另外还需要准备大量标注数据进行模型训练。在云计算方面,企业可通过 IaaS 和 PaaS 等服务,提供海量的算力支持模型训练和服务部署,不过需要注意不同的云架构和配置对成本及运行效果带来的影响。因此,企业需要评估自身的数据资产现状,制定数据治理策略;同时根据企业在AI领域的整体策略和应用需求,选择云服务商和方案。
生成式 AI 技术演进方向:强化学习、向量数据库、多模态、模型压缩、道德隐私
在企业积极探索和践行应用方向和应用场景的同时,生成式 AI的技术也在高速演进过程中,新架构、新服务能力和新模式也在持续涌现。徐凯波分享了目前生成式 AI 技术发展的五个方向。
- 强化学习的应用。强化学习可训练 AI Agent(人工智能代理)更好地完成特定任务,实现流程自动化。若与生成式 AI 技术结合,可获得更智能的决策空间。
- 向量数据库的兴起。相较于传统关系型数据库,向量数据库使用向量而非关系型方式存储数据,这不仅压缩了存储空间,也更适合向量搜索和生成式 AI 的对抗训练。因此向量数据库被视为支持生成式 AI 的更优数据库解决方案。
- 多模态技术的进步。文本和图像等单一数据模态已无法满足模型训练的需要。多模态技术可统一处理不同类型的数据,以提供更丰富的训练样本。这将极大拓展生成式 AI 的应用范围,例如营销机器人、医疗/零售图像分析、广告素材的语义理解、广告监测等。
- 模型压缩和瘦身。目前边缘计算、端侧推理需求旺盛,但大规模预训练模型体量庞大,端侧环境部署性能与效果无法保证。而模型压缩技术如知识蒸馏可减小模型大小,使其可快速载入各类智能设备,这也将推动生成式 AI 向端侧应用渗透。
- 与大模型道德隐私相关的可控生成发展。为避免生成有害内容,新的监督机制加入生成过程,提升输出的安全性和可控性,这是确保生成式 AI 实际应用的重要一环。
除了这些生成式 AI 技术的发展方向,德勤中国在今年发布的 《2023 年技术趋势》报告中,也提出了对于如何利用好 AI 的一个重要建议,那就是需要建立完善的可信 AI 治理体系,以加强其应用的合法性、合规性和伦理性。在实际应用中,不少大模型也暴露出了算法歧视、数据偏差等风险。要实现生成式 AI 的安全、可控、负责任的应用,仅具备核心技术还不够,还需建立完备的 AI 治理体系。据介绍,德勤全球提出了完整的可信治理框架体系,即“Trustworthy AI”治理体系,包含公平/公正、透明/可解释、尽职/尽责、鲁棒/可靠、隐私和安全/稳固六大方面。该框架旨在支撑客户搭建能够满足当局法律法规要求的 AI 治理工程能力,也有助于企业更好地管理和使用 AI 技术,提高产品和服务质量的可信度,降低包括算法目标歧视、算法样本偏差、算法处理缺陷与算法结论的不可解释性等风险。
可靠、安全——生成式 AI 落地的关键所在
对于使用生成式 AI 的用户来说,德勤专家建议从四个层面去治理,以提升模型的效率。首先是加强数据管理,监测并消除数据集中的偏见,保证训练数据的样本分布均衡,避免模型学习到的数据歧视。其次是评估算法本身的公平性、透明度和稳健性,采用更加严格的算法审查流程,避免算法漏洞导致的风险。再次是利用技术手段如加密和联邦学习等对关键数据和知识产权进行保护,避免数据泄露和被恶意利用的问题。最后是制定明确、可操作的 AI 伦理规范,使 AI 系统的决策结果具备可解释性和可追溯性,持续优化监管流程以降低道德风险。
之所以德勤能够分享以上这些重要的生成式 AI 技术发展趋势,是因为其在 AI 战略规划和技术应用方面拥有丰富的咨询服务经验,不仅从基础设施层面为企业使用生成式 AI 奠定硬件基础支持,包括 AI 战略规划、云计算平台搭建、算力资源整合等,同时也为企业提供平台层面的支撑,即根据不同行业和应用场景,进行系统设计和平台搭建,例如面向数字化转型、工业互联网等领域提供专业咨询服务;还可以提供应用开发和企业服务,提供从生成式 AI 模型训练、调优到软件产品研发和系统集成的全链路支持,并已为多家客户实现智能检索、智能客服等应用的开发;自行开发的先进的 AI 试验平台,可以帮助客户快速评估不同技术方案。而支撑这些能力的,就是德勤所拥有的优秀 AI 科研人才和丰富的行业经验,能提供针对生成式 AI 的定制化解决方案。此外,从分享中我们也可以看到,德勤中国管理咨询重视数据治理和 AI 伦理规范,追求解决方案的可靠性和安全性。
生成式 AI 仍在快速发展,AI 应用在行业落地创新也需要允许经历一个试错的过程。韩光辉表示 AI 时代的企业需要做好完整的体系化革新,例如行业或企业内部知识积累的变化,企业团队技能、组织架构的调整,以及服务模式的创新和转型。而作为具备全球视野与本地执行能力的专业服务机构,德勤中国的管理咨询团队可为企业提供从顶层设计到实施落地的全面支持,助力客户构建符合业务需求的可靠可控的生成式 AI 解决方案,实现数字化转型目标。
原文链接:https://blog.csdn.net/csdnnews/article/details/134447317?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170018760316800188537820%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=170018760316800188537820&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-28-134447317-null-null.nonecase&utm_term=AI%E6%B3%95%E5%BE%8B%E5%92%A8%E8%AF%A2