德勤近期发布报告《 How AI agents are reshaping the future of the work》,重点阐述了Generative AI的扩展功能、应用场景和对企业影响。报告关键要点:
- AI agents正在通过扩展Generative AI和典型语言模型的潜在应用来重塑行业。
- Multiagents AI Systems(多代理人工智能系统)可以显著提高单个AI agents的输出质量和工作复杂性。
- 具有前瞻性思维的企业和政府已经在一系列用例中实施了AI agents和Multiagents AI Systems。
- 高管们现在应该采取行动,为下一个智能组织转型时代做好准备并拥抱它。
如何利用GenAI重新设计业务流程
目前,Generative AI使企业能够在一系列业务任务中显著提高速度和生产力,但大多数组织所使用的大型语言模型(LLM)和基于Generative AI的工具扮演的是辅助角色,即人类提供提示,Generative AI迅速生成响应。但这种互动大多是事务性的,且在范围上有所限制。
在这个人工智能快速发展的时代,是时候考虑更大的目标了:从简化日常工作到重新设计整个工作流程。
设想如果Generative AI能像一个熟练的合作伙伴,不仅能响应请求,还能规划整个流程以解决复杂问题,那会怎样?如果Generative AI能够利用必要的数据、数字工具和上下文知识,自主地端到端地编排流程呢?
随着AI agents和Multiagents AI Systems的发展,这一愿景正逐渐成为现实,这是人类与人工智能合作的巨大飞跃。领先的企业和政府机构已经开始认识到人工智能代理的价值,并将其投入实际应用。
AI agents为什么如此重要
要充分利用AI agents的潜力,并理解它们在扩展自动化方面的作用,关键在于区分它们与传统LLM和Generative AI应用的不同之处。
AI agents作为推理引擎,不仅能够理解上下文,还能规划工作流程、接入外部工具和数据,并执行必要的动作以实现目标。
尽管AI agents听起来与独立的大型语言模型(LLM)或生成式人工智能(GenAI)应用相似,但它们之间存在一些关键差异,使得AI agents更为强大。
例如,传统的LLM驱动的聊天机器人在处理多步提示时往往理解有限,更不用说从单一提示中规划和执行整个工作流程了。
本质上,它们遵循传统应用程序的“输入-输出”模式,面对需要分解为多个小任务的请求时,可能会感到困惑。它们也很难进行序列推理,尤其是在需要考虑时间和文本背景的组合任务上。
当使用小型语言模型(SLM)时,这些限制更加明显,因为它们通常在较小的数据集上训练,可能会牺牲知识深度和/或输出质量,以降低计算成本和提高速度。
早期的GenAI应用主要局限于单一任务,例如根据用户搜索历史生成个性化广告、审查合同和法律文件以识别潜在的监管问题,或是预测药物研究中的分子行为和药物相互作用。
相比之下,AI agents能够克服这些限制,并且能够利用特定领域和任务的数字工具来高效完成更为复杂的任务。
例如,具备长期记忆的AI agents可以持续追踪客户与数字渠道的互动,包括电子邮件、聊天和电话,从而不断学习和优化个性化推荐。这与通常只处理会话内信息的LLM和SLM形成鲜明对比。此外,AI agents能够自动化整个端到端的流程,特别是那些需要复杂推理、规划和执行的流程。
AI agents正在为企业开辟新的可能性,通过自动化业务流程来提升生产力和程序交付的效率。过去那些被认为对GenAI来说过于复杂的应用场景,现在可以大规模、安全且高效地实施。
换句话说,AI agents不仅仅是进行交互,它们还能更有效地代表用户进行推理和采取行动。
人机协作的新范式
AI agents通过其推理、规划、记忆和执行的能力,解决了传统语言模型所面临的主要局限。
Multiagents AI Systems增强了AI agents的潜力
尽管单个AI agent能够提供更多的价值,但AI agent的真正变革性力量体现在它们与其他agents的协作中。这种Multiagents AI Systems通过发挥各自的专长,使得组织能够自动化和优化那些单个agent难以独立处理的复杂流程。
Multiagents AI Systems通过集合具有特定角色的AI agent来理解请求、规划工作流程、协调特定角色的代理、简化操作、与人类协作以及验证输出。
这些系统通常包括标准任务agent(例如用户界面和数据管理agent)与专业技能和工具agent(如数据提取器或图像解释器agent)的协同工作,共同实现用户设定的目标。
每个AI agent的核心都是一个语言模型,它能够提供对语言和上下文的深层语义理解。根据不同的应用场景,系统中的AI agent可能会使用相同或不同的语言模型。这种设计允许一些AI agents之间共享知识,而其他AI agents则可以验证跨agent的输出,从而提升流程的质量和一致性。通过为agent提供共享的短期和长期记忆资源,可以进一步增强这种能力,减少在项目或应用场景规划、验证和迭代阶段对人工提示的需求。
这一理念将单个AI agent的潜力扩展到了团队协作的层面。通过将复杂的流程分解为多个任务,将任务分配给优化以执行任务的agent,并在工作流的每个阶段协调agent和人工协作,这种系统已被证实能够更有效地产出高质量、迅速且值得信赖的结果。
换句话说,Multiagents AI Systems不仅能推理并代表用户行动,它们还能在几分钟内编排复杂的工作流程。
AI agents和Multiagents AI Systems的主要优势
能力——AI agents可以自动与多种工具交互,完成单一语言模型无法单独实现的任务,例如浏览网页和进行定量分析。
生产力——相较于需要持续人工指导和交互的独立大型语言模型,AI agents能够根据简单的提示规划并执行复杂的工作流程,大幅提高工作效率。
自我学习——AI agents能够利用短期和长期上下文记忆资源,从而随着时间推移迅速提升其输出质量,通常预训练语言模型没法提供这种资源。
适应性——随着需求的演变,AI agents能够推理并规划新策略,快速接入新的实时数据源,并与其他代理协作以协调和执行输出。
准确性——Multiagents AI Systems的关键优势之一是它们能够通过“Validator”agents来测试和提升“Creator”agents的输出质量与可靠性,这是自动化流程中的一个重要环节。
智能——当专注于特定任务的AI agents协同工作时,每个AI agent都运用自己的工具和推理能力,并结合各自的记忆资源,从而实现机器智能的新高度。
透明度——Multiagents AI Systems通过展示AI agents之间的沟通和推理过程,增强了对人工智能输出的解释能力,为集体决策和共识建立过程提供了更清晰的视角。