技术星期二：为什么编排是有效 AI 代理部署的关键

刚接触代理编排？ 从这里开始 .

让我们面对现实吧——人工智能代理并不容易构建或部署。但一旦它们被嵌入，其影响是令人难以置信的。我喜欢听到 UiPath 客户的意见，比如 Lantik 数字服务主管 Ainara Etxeandia Sagasti，她“将 RPA、生成式 AI 和代理技术相结合，使公共服务比以往任何时候都更容易获得、更高效、更以公民为中心”。 UiPath Platform™ 上已经构建了超过 10,000 个人工智能代理。代理可以提高流程效率和盈利能力，但他们需要强大的编排以及自动化和人员参与的帮助。

在这篇博文中，我将介绍大规模构建、测试或部署人工智能代理时最常见的痛点。我还将解释基于受控机构和互操作性构建的精心策划的方法如何缓解这些问题。

1。代理的性能和可靠性

开发人员和用户经常将人工智能代理的不可靠性视为生产的障碍。大型语言模型 (LLM) 使代理变得灵活且适应性强，但这也会导致输出不一致。这可能会阻碍开发和测试。正如一位工程师所说，“我的代理有时工作得很好，然后在类似的输入上完全失败。我们需要更好的方法来模拟边缘情况并一致地重现故障......随着时间的推移监控代理的‘漂移’确实令人头痛。”

另一个挑战是幻觉——代理编造事实或工具输入——这可能会使流程陷入停顿。一位构建人工智能工作流程的用户分享道：“我们发现的最大痛点是可重复性和幻觉……确保对于相同或相似的查询，LLM 代理不会偏离轨道并幻觉到其他工具的输入。”这种不可预测性需要大量的测试和验证，但代理测试工具还不成熟。当错误发生时，由于模型推理不透明，可能很难诊断。这导致团队对变化非常谨慎：“我们现在对系统提示的变化非常警惕，因为我们已经因为告诉代理不要做某事而被烧伤了，然后它开始表现得很奇怪......很多次。”

底层人工智能模型的性能是另一个问题。大型模型可能会占用大量资源或速度较慢，而较小的模型可能性能不佳。找到正确的平衡点具有挑战性。

由于缺乏一致、可靠的输出，在没有广泛保障措施的情况下，很难信任人工智能代理来执行关键任务或面向客户的任务。在实践中，实现高可靠性通常需要简化代理行为、引入严格的约束或有后备措施（例如不断的人工干预）。然而，这些措施往往会损害代理的自主权、效率，从而损害增值企业场景中的效用。

2。受控机构和人机交互

虽然人工智能代理可以自动执行复杂的任务，但开发人员发现人类监督和协作至关重要，而且很难取得适当的平衡。完全不干涉的自主权通常是不切实际的，因为代理可能会犯错误或做出不明确的决定。企业需要控制代理程度，随着代理变得更加准确和可靠，这种程度会随着时间的推移而增加。

一种常见的方法是在某些批准或处理边缘情况时保持“人在循环”，但如果没有精心策划，这可能会减慢流程。然后，需要“人在环”来进行某些批准、关键决策并处理异常情况。一位人工智能工程师指出，限制智能体并让人类参与会带来更好的结果：“在人类监督下，严格约束的法学硕士可以在中等复杂的任务中取得良好的结果……[完全]自主、通用的智能体[大规模]”尚不现实。

另一方面，如果人工智能控制得太严格或需要不断检查，它就不会创造投资回报率。有时，代理可能会中断工作流程或造成的工作量超过其节省的工作量。例如，一位开发人员解释了 Copilot 编码如何通过强制手动更正来破坏生产力：“它开始了一些事情，但未能完成它......我必须将注意力转移到检查和关闭标签、括号等上。它扰乱了我的流程，减慢了我的速度。”

挑战在于设计混合工作流程，让代理处理工作，但无缝地移交给人类进行判断，而不会产生额外的摩擦。

3。成本和投资回报率问题

人工智能代理的投资回报率是一个反复出现的问题，尤其是随着使用规模的扩大。大型语言模型 API（以及运行它们的基础设施）可能很昂贵。如果不优化代理，团队就会担心成本井喷。一位用户声称，目前的代理商对于他们所取得的成就来说“太昂贵”。当可靠性较低时，投资回报率可能很难衡量。如果代理仅在部分时间取得成功，则其失败（和手动修复）的成本可能会超过收益。

企业试图通过模型优化、使用策略等方法来控制成本。一位用户描述了实施缓存以减少重复调用，并仔细采购高质量数据以提高输出效率。其他人专注于为工作选择正确的模型：“我会[喜欢]一个可以让我的提示的框架......在所有不同的模型上运行它，[并]找到最好和最便宜的。现在我的人工智能代理使用超过200个提示模板，测试和重新测试它们都是昂贵的。”最终，及时的工程和模型实验会产生实际成本。

供应商定价模型（每个代币、每个调用等）也发挥着作用。例如，对所有事情都使用 GPT-4 可能有点大材小用，但使用更便宜的模型可能会降低质量。团队必须取得平衡以证明投资回报率的合理性。此外，如果代理项目需要在云人工智能服务或专业基础设施上持续投入大量资金，管理层可能会质疑代理项目的商业价值。如果没有明显的胜利（无论是收入增长还是自动化节省成本），投资就很难捍卫。因此，优化成本和展示投资回报率是首要任务——团队希望通过混合和匹配模型，同时专注于高价值用例，通过人工智能代理“获得最便宜的收益”。

4。治理、安全和隐私问题

组织必须对人工智能代理实施安全、合规和道德准则，但这说起来容易做起来难。数据隐私是最受关注的问题——许多公司禁止或限制云人工智能服务，直到他们确信敏感数据不会泄露。一位开发人员分享说，他们的工作场所禁止使用像 ChatGPT 这样的工具，因为存在知识产权风险：“不。它被认为具有太大的知识产权风险，[担心]它可能会泄露我们的秘密或侵犯他人的版权。”当使用第三方人工智能 API 时，从业者担心客户数据会无意中发送到这些服务。

安全性是另一个问题：如果没有正确沙箱化，自主代理会带来风险。有报告称，团队在代理平台之上添加了额外的保护措施，例如，在部署潜在客户开发代理时，“我们必须在顶部添加[一个]安全层……[并]使用缓存 (Redis) 来优化成本”。开箱即用的解决方案通常缺乏企业级安全控制或成本管理，公司必须依靠自己的治理。此外，如果代理框架不提供监督钩子，那么确保代理遵守法规（GDPR、HIPAA 等）并遵循组织政策就很困难。

这些担忧让利益相关者变得谨慎：他们希望人工智能代理功能强大，但透明且受控制，“使用中立的、普遍接受的协议，而不是隐藏数据使用方式的专有系统”。简而言之，如果没有强大的治理功能（审核日志、权限控制、人工覆盖等），许多组织在更广泛的代理部署中就会遇到困难。

5。部署和扩展困难

将人工智能代理从概念验证转移到生产可能会带来许多问题。用户报告说，在受控演示中运行的内容常常难以应对现实世界的规模、体积和复杂性。常见的问题包括延迟和吞吐量（LLM 驱动的代理对于高流量或实时应用程序来说可能太慢）以及可靠运行系统的操作开销。正如 Kadoa 联合创始人兼首席执行官 Adrian Krebs 所说，“如果根本问题是人工智能代理太慢、太昂贵且太不可靠，那么即使你使用编排框架也没关系。”团队经常需要重新架构以提高效率——使用缓存、交换模型或简化代理逻辑——只是为了满足性能要求。

在保持一致性的同时跨环境（云、本地、边缘设备）进行部署还面临着挑战。在企业环境中，并非所有部门都希望使用相同的工具，这使得标准化部署变得更加困难。现场监控、日志记录和更新代理等操作扩展问题同样不发达。一位 Reddit 用户指出，即使是基本的调试也可能是“一场噩梦……错误日志通常很神秘，没有明确的故障排除指南。”当部署许多代理时，这只会变得更加困难。所有这些都会减缓代理的采用。甚至主要供应商也承认，客户“才刚刚开始”，有意义的大规模结果仍在不断出现。

6。多代理编排复杂性

构建多个人工智能代理协作的系统是很棘手的。开发人员努力协调代理角色、管理共享状态以及防止代理陷入循环或相互冲突。即使使用编排框架，一个代理输出中的失误也可能会破坏整个工作流程。正如一位开发人员声称的那样，“人们只是在试验。不可靠性仍然是一个主要问题：自回归生成过程中的任何脱轨对于代理来说都可能是致命的。”其他人则强调创建自我修复或弹性工作流程的难度 - 例如，添加逻辑以重试失败的步骤或人为干预。

这些编排挑战意味着团队通常最终只能解决一个问题，但其他问题却出现了：“有时甚至感觉就像打地鼠。通过一些即时工程解决一个问题，然后再创建三个问题。”

7。模型兼容性和集成挑战

没有任何一个人工智能代理在市场上占据主导地位。组织可能有一天会使用 OpenAI，第二天就会转向开源模型，并集成各种第三方工具。但兼容性和平滑集成是一个重大挑战。工具和模型集成通常需要自定义适配器或粘合代码。例如，如果框架的设计没有考虑到这一点，那么将代理连接到专有数据库或内部 API 可能需要付出巨大的努力。开发人员认为，许多框架都很“笨重”，并且带有不适合所有用例的假设：“不幸的是，如果您只需要基础知识，那么这些框架中的许多框架都相当沉重。”

相反，“与框架无关”通常意味着从头开始编写大量样板文件。用户希望避免重新发明轮子而不被锁定。一位开发人员描述了专门为了最大限度地提高兼容性而选择更灵活的库：“我尝试了很多......最终我决定使用 [Instructor]，因为我可以在 LLM 之间快速切换 - 本地/操作系统和专有 - 并且我可以在任何地方拥有相同的结构化输入/输出。”这凸显了对能够轻松交换人工智能模型或服务的代理的需求，以满足不断变化的需求。

另一个常见需求是将代理与现有软件堆栈和工作流程集成。缺乏标准接口意味着每个新代理可能需要新的集成工作。如前所述，缺少示例和高级设置可能会阻碍这一点。此外，当一个组件的更新（例如 LLM API 更改）破坏了代理的逻辑时，就会出现兼容性问题——团队必须积极管理这一点。简而言之，从业者希望即插即用的互操作性：无需大量定制工程即可与各种模型、数据源和系统连接的人工智能代理。

8。供应商锁定和互操作性问题

人工智能模型和框架正在快速变化。许多团队想要最好的产品，并担心选择单一供应商的人工智能代理解决方案可能会让他们变得不灵活。代理框架呈爆炸式增长，每个框架都有自己的 API 和注意事项。一位开发人员将其与 JavaScript 框架热潮进行了比较：“几个月后，我们可能会推出‘100 个不同 JS Web 框架中的 TODO 应用程序’版本……即使只是理解它们也是一项艰巨的任务。”

致力于一个生态系统可能意味着灵活性有限。某些图书馆偏爱特定的提供商。例如，一位沮丧的用户警告他们选择的框架“主要是破坏”，强调一些工具如何隐式地将您锁定在特定的模型或服务中。风险在于供应商的愿景，后来发现自己“被锁定——依赖于其更新、定价和政策，没有可行的替代方案”。互操作性也是将代理集成到现有软件堆栈中的一个问题。开发人员经常发现“没有明确的例子”来将代理与他们已经使用的语言和云服务挂钩，这使得在不同的团队中采用这些工具变得更加困难。

代理编排的机会

其中许多挑战表明需要灵活、可互操作且以人为中心的代理编排解决方案。代理编排根据人员、机器人和人工智能代理的能力，在人员、机器人和人工智能代理之间有效管理、分配任务和责任，确保运营平稳、高效，并与业务的战略成果保持一致。

有效集成可靠的人工智能代理、确定性自动化和人工输入的编排层具有以下几个优势：

通过确定性支持提高可靠性：精心策划的方法的理想最终状态是受控机构，无需过多的人工干预即可实现最佳效率。这取决于专门的人工智能代理的编排，这些代理在流程中受到企业级工具、确定性机器人和舒适水平的人工审查的仔细约束。通过将人工智能代理与确定性自动化脚本或规则相结合，编排层可确保始终存在后备路径。例如，如果人工智能代理的输出不满足特定的准确度阈值，预定义的规则可能会处理这种情况（或至少标记它）。这种混合方法利用了人工智能的创造力，但在一定范围内。随着时间的推移，编排平台甚至可以了解哪个代理对于哪个任务最可靠（通过监控结果）并相应地路由任务，从而优化成功率。与单个黑盒代理相比，最终效果是工作流程的整体可靠性更高。正如一位开发人员指出的那样，“在人工监督下受到严格约束的[代理]”和明确定义的流程可以产生可靠的良好结果——这正是编排所能够实现的。
人机循环集成：精心设计的编排层的一个主要好处是易于编织人工检查点。例如，如果代理的信心较低或其决策风险较高，则可以将编排层配置为暂停并请求人工批准。这提供了在关键工作流程中部署代理所需的“安全网”。通用平台无需为每个代理单独进行硬编码人工监督，而是可以提供一致的界面来升级给人工，甚至可以随着时间的推移从人工纠正中学习。人工智能+人类工作流程的这种结合有助于在适当的情况下利用人工智能的速度，但始终有人类的支持，以确保可靠性和信任。
集中治理和安全性：与供应商无关的编排层可以在所有人工智能活动中统一实施安全性和合规性。它可以充当网关，监控发送给每个代理的数据、清理或匿名化敏感信息，并记录所有代理决策以用于审计目的。这通过为组织提供单点控制来解决治理问题：例如，管理员可以配置允许哪些人工智能模型处理某些数据，或者根据隐私政策要求某些查询始终由本地模型处理。这样的系统还可以与身份和访问管理（IAM）集成，以对代理操作进行基于角色的控制。政策（如费率限制或成本预算）可以在全球范围内应用。所有这些功能意味着企业可以更加自信地采用人工智能代理，因为知道有一个监督层可以防止不必要的数据泄露或恶意行为。
互操作性和避免锁定：中立的编排层让团队可以根据需要插入不同的人工智能模型或服务，而无需依赖于某个供应商的生态系统。这减轻了您在更换提供商时必须重建一切的恐惧。正如一位工程师所主张的那样，目标是让最终用户“不必担心供应商锁定……确保人工智能系统跨平台无缝工作，而不是将用户困在单一供应商的生态系统中。”通过与多个人工智能后端（OpenAI、Anthropic、开源模型等）使用“通用语言”，编排层可确保您始终可以选择最适合工作的工具，并在技术或价格发生变化时进行调整。
多代理协调和专业化：编排平台可以管理一组代理，每个代理专门负责一个子任务，并确定性地协调它们的交互。这降低了从业者的复杂性——编排层可以跨代理处理任务路由、状态管理和错误恢复。您可以使用更简单的代理来专注于特定角色，并通过编排层将它们链接起来，而不是让一个整体代理尝试所有事情（并且经常会意外失败）。这样的设置还可以包括基于规则的自动化或传统软件组件，用于不需要人工智能的任务，确保人工智能仅在能增加价值的地方使用。结果是一个更强大的系统，如果一个组件发生故障或产生不确定的输出，编排平台可以捕获它（例如通过验证、重试或回退）。
成本优化和资源灵活性：与供应商无关的平台可以在不同的模型或路线之间动态选择，以最大限度地降低成本，同时满足性能需求。例如，它可能会使用更便宜的本地模型进行简单查询，并仅针对复杂情况调用更昂贵的 API，这对最终用户是透明的。它还可以批量请求、缓存结果或调整代理运行的频率。一个团队报告手动执行此操作（添加缓存并为某些任务使用更便宜的模型）；智能编排平台可以自动处理此类优化。此外，由于不依赖于某一供应商，组织可以利用价格竞争——如果供应商提高价格，则可以转向更具成本效益的服务。这种灵活性 提高投资回报率，因为编排可确保您以最有效的方式使用资源（按照用户的期望，为每个作业提供“最佳且最便宜”的模型）。

阅读“代理编排权威指南”。

总之，经过验证且值得信赖的代理编排层直接解决了许多痛点：

它通过提高代理可靠性来提供受控代理，而不会影响自主性或实用性
将人工智能与人类和机器人融合以获得更好的结果
将多代理复杂性抽象为可管理的框架
避免单一供应商限制
提供企业规模部署所需的治理

通过从现实世界的困境（重复性问题、集成难题、安全担忧、成本超支）中学习，这样的解决方案可以使从业者能够以更少的摩擦和风险来利用人工智能代理。结果是一个更可靠、适应性更强、更符合业务需求的人工智能代理生态系统，使团队能够专注于解决问题，而不是与基础设施作斗争。

下一个：

AI 代理在 Microsoft Build 2025 上领跑智能文档处理：构建与购买——选择正确的策略

自动化控制系统