在 LLM 语境下,Agent 可以理解为某种能自主理解、规划决策、执行复杂任务的智能体。Agent 并非 ChatGPT 升级版,它不仅告诉你 “如何做”,更会帮你去做。如果 CoPilot 是副驾驶,那么 Agent 就是主驾驶。
这里有必要延伸下AI Agent 能力等级划分
AI Agent能力划分:
翻译过来就是:
框架结构简单,但其设计理念具有重要意义,后续框架设计的思路都有这个的影子
创建一个初始的计划,然后进入主循环
系统会让模型判断在当前计划下该进行何种行动,接着会执行行动
执行完毕后,结果会写入下一次循环中
如此,每次决策都会基于之前的结果、记忆和计划,从而制定出新的行动方案
优点:
缺点:
AutoGen
论文链接:https://arxiv.org/abs/2308.08155
项目链接:https://github.com/microsoft/autogen
项目链接:https://github.com/OpenBMB/XAgent
官方博文:https://blog.x-agent.net/blog/xagent/
总结:
论文链接:https://arxiv.org/abs/2308.00352
GitHub地址:
适合人群:需要复杂的多代理交互和预定义复杂行为的项目。非常适合网络密集型异步操作和需要高级协作功能而无需大量定制的项目
对AI Agent感兴趣的同学可以查看原文:
AI Agent技术的最新进展与改变世界的典型项目巡礼
Agent Hot
学习了。
Popular Ranking
Popular Events
一、什么是 AI Agent
这里有必要延伸下AI Agent 能力等级划分
AI Agent能力划分:
在这一级别,Agent并不具备人工智能特性,只能执行预定或固定的任务,没有感知、决策或学习的能力。
Agent开始具备基于规则的决策能力,能够根据预设的规则和符号进行简单的判断和执行。这种智能体通常只能处理特定情境下的任务,且缺乏灵活性和适应性。
Agent能够利用逻辑推理能力来解决问题,不再仅仅依赖于预设的规则。它能够根据当前的环境信息和目标,进行一定程度的推理和决策,以选择最合适的行动方案。
在L3级别,Agent不仅具备推理决策能力,还开始拥有记忆和反思的能力。它能够记住过去的经验和教训,并在未来的决策中加以利用。这种智能体能够自我优化和改进,以适应不断变化的环境和任务。
自主学习是L4级别Agent的主要特征。它能够自主地从数据中学习新知识和技能,无需人类的明确指导。这种智能体能够处理更复杂的问题,并在面对新情境时展现出更强的适应性和创造力。
在最高级别,Agent不仅具备高度自主的学习和决策能力,还展现出个性化的特征。它能够根据自身的特点和偏好来执行任务,并与其他Agent进行协作和沟通。此外,L5级别的Agent还能够理解和适应人类社会的复杂性和多样性,与人类实现更加紧密和自然的交互。
二、AI Agent 系统结构
翻译过来就是:
三、知名的Agent项目
AUTO-GPT
框架结构简单,但其设计理念具有重要意义,后续框架设计的思路都有这个的影子
创建一个初始的计划,然后进入主循环
系统会让模型判断在当前计划下该进行何种行动,接着会执行行动
执行完毕后,结果会写入下一次循环中
如此,每次决策都会基于之前的结果、记忆和计划,从而制定出新的行动方案
优点:
缺点:
AutoGen
论文链接:https://arxiv.org/abs/2308.08155
项目链接:https://github.com/microsoft/autogen
XAgent
项目链接:https://github.com/OpenBMB/XAgent
官方博文:https://blog.x-agent.net/blog/xagent/
总结:
OPENAI Assistants
论文链接:https://arxiv.org/abs/2308.00352
GitHub地址:
丰富的库:它还附带一个丰富的预定义代理库,无需进行大量自定义开发即可实现一系列功能。
适合人群:需要复杂的多代理交互和预定义复杂行为的项目。非常适合网络密集型异步操作和需要高级协作功能而无需大量定制的项目
对AI Agent感兴趣的同学可以查看原文:
AI Agent技术的最新进展与改变世界的典型项目巡礼