只需一步,快速开始
短信验证,便捷登录
军衔等级:
四级军士长
工作流是通过预定义的代码路径来调用LLM和工具的系统; 而智能体则是LLM动态引导自己的流程和使用工具,控制完成任务方式的系统。
LangChain的LangGraph; 亚马逊 Bedrock的AI Agent框架 Rivet,拖放式GUI LLM工作流构建器; Vellum,用于构建和测试复杂工作流的GUI工具
生成市场营销策略,然后将其翻译成不同的语言。 编写文档的大纲,检查大纲是否满足特定条件,然后根据大纲编写文档。
将不同类型的客户服务查询(一般问题、退款请求、技术支撑)引导到不同的下游流程、提示和工具中。 将简单常见的问题路由到较小的模型(如Claude 3.5 Haiku),将困难的问题路由到功能更强大的模型(如Claude 3.5 Sonnet),以优化成本和速度。
分段(Sectioning):将任务分解可以为并行运行的独立子任务。 投票(Voting):多次运行同一任务,获得不同的输出。
一个模型实例处理用户查询,另一个模型实例筛选用户查询是否存在不适当的内容。这往往比使用相同的LLM同时处理安全校验和核心响应的性能要好。 自动评估LLM的性能:每个LLM调用都会评估模型在给定提示符下性能的不同方面。 检查一段代码是否存在漏洞,如果发现问题,则触发不同的提示来检查并标记代码。 评估给定的内容是否合适:多个提示用来评估不同的方面或使用不同的投票阈值来平衡误报和漏报。
每次对多个文件进行复杂更改的编码任务。 从多个来源收集和分析相关信息的搜索任务。
文学翻译中,译者LLM最初可能无法捕捉到一些细节,但评估者LLM可以提供有用的批评反馈。 复杂的搜索任务中,需要多轮搜索和分析以收集全面的信息,评估者LLM决定是否需要进一步搜索。
保持智能体设计的简单性 ; 明确显示智能体的规划步骤; 提供全面的工具文档和测试,作为智能体和计算机之间的接口
举报本楼
发表回复 回帖后跳转到最后一页
版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图
GMT+8, 2024-12-25 14:32 , Processed in 0.246629 second(s), 17 queries , Gzip On.
Copyright © 1999-2023 C114 All Rights Reserved
Discuz Licensed