亿迅智能制造网
工业4.0先进制造技术信息网站!
首页 | 制造技术 | 制造设备 | 工业物联网 | 工业材料 | 设备保养维修 | 工业编程 |
home  MfgRobots >> 亿迅智能制造网 >  >> Manufacturing Technology >> 自动化控制系统

技术星期二:为什么编排是有效 AI 代理部署的关键

刚接触代理编排? 从这里开始 .

让我们面对现实吧——人工智能代理并不容易构建或部署。但一旦它们被嵌入,其影响是令人难以置信的。我喜欢听到 UiPath 客户的意见,比如 Lantik 数字服务主管 Ainara Etxeandia Sagasti,她“将 RPA、生成式 AI 和代理技术相结合,使公共服务比以往任何时候都更容易获得、更高效、更以公民为中心”。 UiPath Platform™ 上已经构建了超过 10,000 个人工智能代理。代理可以提高流程效率和盈利能力,但他们需要强大的编排以及自动化和人员参与的帮助。

在这篇博文中,我将介绍大规模构建、测试或部署人工智能代理时最常见的痛点。我还将解释基于受控机构和互操作性构建的精心策划的方法如何缓解这些问题。

1。代理的性能和可靠性

开发人员和用户经常将人工智能代理的不可靠性视为生产的障碍。大型语言模型 (LLM) 使代理变得灵活且适应性强,但这也会导致输出不一致。这可能会阻碍开发和测试。正如一位工程师所说,“我的代理有时工作得很好,然后在类似的输入上完全失败。我们需要更好的方法来模拟边缘情况并一致地重现故障......随着时间的推移监控代理的‘漂移’确实令人头痛。”

另一个挑战是幻觉——代理编造事实或工具输入——这可能会使流程陷入停顿。一位构建人工智能工作流程的用户分享道:“我们发现的最大痛点是可重复性和幻觉……确保对于相同或相似的查询,LLM 代理不会偏离轨道并幻觉到其他工具的输入。”这种不可预测性需要大量的测试和验证,但代理测试工具还不成熟。当错误发生时,由于模型推理不透明,可能很难诊断。这导致团队对变化非常谨慎:“我们现在对系统提示的变化非常警惕,因为我们已经因为告诉代理不要做某事而被烧伤了,然后它开始表现得很奇怪......很多次。”

底层人工智能模型的性能是另一个问题。大型模型可能会占用大量资源或速度较慢,而较小的模型可能性能不佳。找到正确的平衡点具有挑战性。

由于缺乏一致、可靠的输出,在没有广泛保障措施的情况下,很难信任人工智能代理来执行关键任务或面向客户的任务。在实践中,实现高可靠性通常需要简化代理行为、引入严格的约束或有后备措施(例如不断的人工干预)。然而,这些措施往往会损害代理的自主权、效率,从而损害增值企业场景中的效用。

2。受控机构和人机交互

虽然人工智能代理可以自动执行复杂的任务,但开发人员发现人类监督和协作至关重要,而且很难取得适当的平衡。完全不干涉的自主权通常是不切实际的,因为代理可能会犯错误或做出不明确的决定。企业需要控制代理程度,随着代理变得更加准确和可靠,这种程度会随着时间的推移而增加。

一种常见的方法是在某些批准或处理边缘情况时保持“人在循环”,但如果没有精心策划,这可能会减慢流程。然后,需要“人在环”来进行某些批准、关键决策并处理异常情况。一位人工智能工程师指出,限制智能体并让人类参与会带来更好的结果:“在人类监督下,严格约束的法学硕士可以在中等复杂的任务中取得良好的结果……[完全]自主、通用的智能体[大规模]”尚不现实。

另一方面,如果人工智能控制得太严格或需要不断检查,它就不会创造投资回报率。有时,代理可能会中断工作流程或造成的工作量超过其节省的工作量。例如,一位开发人员解释了 Copilot 编码如何通过强制手动更正来破坏生产力:“它开始了一些事情,但未能完成它......我必须将注意力转移到检查和关闭标签、括号等上。它扰乱了我的流程,减慢了我的速度。”

挑战在于设计混合工作流程,让代理处理工作,但无缝地移交给人类进行判断,而不会产生额外的摩擦。

3。成本和投资回报率问题

人工智能代理的投资回报率是一个反复出现的问题,尤其是随着使用规模的扩大。大型语言模型 API(以及运行它们的基础设施)可能很昂贵。如果不优化代理,团队就会担心成本井喷。一位用户声称,目前的代理商对于他们所取得的成就来说“太昂贵”。当可靠性较低时,投资回报率可能很难衡量。如果代理仅在部分时间取得成功,则其失败(和手动修复)的成本可能会超过收益。

企业试图通过模型优化、使用策略等方法来控制成本。一位用户描述了实施缓存以减少重复调用,并仔细采购高质量数据以提高输出效率。其他人专注于为工作选择正确的模型:“我会[喜欢]一个可以让我的提示的框架......在所有不同的模型上运行它,[并]找到最好和最便宜的。现在我的人工智能代理使用超过200个提示模板,测试和重新测试它们都是昂贵的。”最终,及时的工程和模型实验会产生实际成本。

供应商定价模型(每个代币、每个调用等)也发挥着作用。例如,对所有事情都使用 GPT-4 可能有点大材小用,但使用更便宜的模型可能会降低质量。团队必须取得平衡以证明投资回报率的合理性。此外,如果代理项目需要在云人工智能服务或专业基础设施上持续投入大量资金,管理层可能会质疑代理项目的商业价值。如果没有明显的胜利(无论是收入增长还是自动化节省成本),投资就很难捍卫。因此,优化成本和展示投资回报率是首要任务——团队希望通过混合和匹配模型,同时专注于高价值用例,通过人工智能代理“获得最便宜的收益”。

4。治理、安全和隐私问题

组织必须对人工智能代理实施安全、合规和道德准则,但这说起来容易做起来难。数据隐私是最受关注的问题——许多公司禁止或限制云人工智能服务,直到他们确信敏感数据不会泄露。一位开发人员分享说,他们的工作场所禁止使用像 ChatGPT 这样的工具,因为存在知识产权风险:“不。它被认为具有太大的知识产权风险,[担心]它可能会泄露我们的秘密或侵犯他人的版权。”当使用第三方人工智能 API 时,从业者担心客户数据会无意中发送到这些服务。

安全性是另一个问题:如果没有正确沙箱化,自主代理会带来风险。有报告称,团队在代理平台之上添加了额外的保护措施,例如,在部署潜在客户开发代理时,“我们必须在顶部添加[一个]安全层……[并]使用缓存 (Redis) 来优化成本”。开箱即用的解决方案通常缺乏企业级安全控制或成本管理,公司必须依靠自己的治理。此外,如果代理框架不提供监督钩子,那么确保代理遵守法规(GDPR、HIPAA 等)并遵循组织政策就很困难。

这些担忧让利益相关者变得谨慎:他们希望人工智能代理功能强大,但透明且受控制,“使用中立的、普遍接受的协议,而不是隐藏数据使用方式的专有系统”。简而言之,如果没有强大的治理功能(审核日志、权限控制、人工覆盖等),许多组织在更广泛的代理部署中就会遇到困难。

5。部署和扩展困难

将人工智能代理从概念验证转移到生产可能会带来许多问题。用户报告说,在受控演示中运行的内容常常难以应对现实世界的规模、体积和复杂性。常见的问题包括延迟和吞吐量(LLM 驱动的代理对于高流量或实时应用程序来说可能太慢)以及可靠运行系统的操作开销。正如 Kadoa 联合创始人兼首席执行官 Adrian Krebs 所说,“如果根本问题是人工智能代理太慢、太昂贵且太不可靠,那么即使你使用编排框架也没关系。”团队经常需要重新架构以提高效率——使用缓存、交换模型或简化代理逻辑——只是为了满足性能要求。

在保持一致性的同时跨环境(云、本地、边缘设备)进行部署还面临着挑战。在企业环境中,并非所有部门都希望使用相同的工具,这使得标准化部署变得更加困难。现场监控、日志记录和更新代理等操作扩展问题同样不发达。一位 Reddit 用户指出,即使是基本的调试也可能是“一场噩梦……错误日志通常很神秘,没有明确的故障排除指南。”当部署许多代理时,这只会变得更加困难。所有这些都会减缓代理的采用。甚至主要供应商也承认,客户“才刚刚开始”,有意义的大规模结果仍在不断出现。

6。多代理编排复杂性

构建多个人工智能代理协作的系统是很棘手的。开发人员努力协调代理角色、管理共享状态以及防止代理陷入循环或相互冲突。即使使用编排框架,一个代理输出中的失误也可能会破坏整个工作流程。正如一位开发人员声称的那样,“人们只是在试验。不可靠性仍然是一个主要问题:自回归生成过程中的任何脱轨对于代理来说都可能是致命的。”其他人则强调创建自我修复或弹性工作流程的难度 - 例如,添加逻辑以重试失败的步骤或人为干预。

这些编排挑战意味着团队通常最终只能解决一个问题,但其他问题却出现了:“有时甚至感觉就像打地鼠。通过一些即时工程解决一个问题,然后再创建三个问题。”

7。模型兼容性和集成挑战

没有任何一个人工智能代理在市场上占据主导地位。组织可能有一天会使用 OpenAI,第二天就会转向开源模型,并集成各种第三方工具。但兼容性和平滑集成是一个重大挑战。工具和模型集成通常需要自定义适配器或粘合代码。例如,如果框架的设计没有考虑到这一点,那么将代理连接到专有数据库或内部 API 可能需要付出巨大的努力。开发人员认为,许多框架都很“笨重”,并且带有不适合所有用例的假设:“不幸的是,如果您只需要基础知识,那么这些框架中的许多框架都相当沉重。”

相反,“与框架无关”通常意味着从头开始编写大量样板文件。用户希望避免重新发明轮子而不被锁定。一位开发人员描述了专门为了最大限度地提高兼容性而选择更灵活的库:“我​​尝试了很多......最终我决定使用 [Instructor],因为我可以在 LLM 之间快速切换 - 本地/操作系统和专有 - 并且我可以在任何地方拥有相同的结构化输入/输出。”这凸显了对能够轻松交换人工智能模型或服务的代理的需求,以满足不断变化的需求。

另一个常见需求是将代理与现有软件堆栈和工作流程集成。缺乏标准接口意味着每个新代理可能需要新的集成工作。如前所述,缺少示例和高级设置可能会阻碍这一点。此外,当一个组件的更新(例如 LLM API 更改)破坏了代理的逻辑时,就会出现兼容性问题——团队必须积极管理这一点。简而言之,从业者希望即插即用的互操作性:无需大量定制工程即可与各种模型、数据源和系统连接的人工智能代理。

8。供应商锁定和互操作性问题

人工智能模型和框架正在快速变化。许多团队想要最好的产品,并担心选择单一供应商的人工智能代理解决方案可能会让他们变得不灵活。代理框架呈爆炸式增长,每个框架都有自己的 API 和注意事项。一位开发人员将其与 JavaScript 框架热潮进行了比较:“几个月后,我们可能会推出‘100 个不同 JS Web 框架中的 TODO 应用程序’版本……即使只是理解它们也是一项艰巨的任务。”

致力于一个生态系统可能意味着灵活性有限。某些图书馆偏爱特定的提供商。例如,一位沮丧的用户警告他们选择的框架“主要是破坏”,强调一些工具如何隐式地将您锁定在特定的模型或服务中。风险在于供应商的愿景,后来发现自己“被锁定——依赖于其更新、定价和政策,没有可行的替代方案”。互操作性也是将代理集成到现有软件堆栈中的一个问题。开发人员经常发现“没有明确的例子”来将代理与他们已经使用的语言和云服务挂钩,这使得在不同的团队中采用这些工具变得更加困难。

代理编排的机会

其中许多挑战表明需要灵活、可互操作且以人为中心的代理编排解决方案。代理编排根据人员、机器人和人工智能代理的能力,在人员、机器人和人工智能代理之间有效管理、分配任务和责任,确保运营平稳、高效,并与业务的战略成果保持一致。

有效集成可靠的人工智能代理、确定性自动化和人工输入的编排层具有以下几个优势:

阅读“代理编排权威指南”。

总之,经过验证且值得信赖的代理编排层直接解决了许多痛点:

通过从现实世界的困境(重复性问题、集成难题、安全担忧、成本超支)中学习,这样的解决方案可以使从业者能够以更少的摩擦和风险来利用人工智能代理。结果是一个更可靠、适应性更强、更符合业务需求的人工智能代理生态系统,使团队能够专注于解决问题,而不是与基础设施作斗争。

下一个:


自动化控制系统

  1. UiPath MD EMEA:自动化如何帮助行业缓解 Covid-19 的直接威胁
  2. UiPath 通过全球远程工作和自动化节省了超过 700,000 个小时
  3. 声音优先方法如何让商业领袖无言以对
  4. 制造业中的数字技能危机迫在眉睫——但可能会有改变游戏规则的解决方案
  5. Elementary Robotics 推出“业界首个”基于云的 AI 摄像头系统
  6. 机加工车间应该知道的关于料条直线度的知识
  7. 台达电子在荷兰开工建设新办公楼
  8. 实时企业互操作性
  9. USAL 测试 Car Delivery Network 的新电子记录设备
  10. 帮助大规模解锁智能自动化的 6 个关键
  11. ABB收购自主移动机器人制造商ASTI
  12. Epicor Software 任命新 CEO