LLM-Agent-Paper-List - 奚志恒等人的 86 页论文《基于大型语言模型的代理的兴起和潜力:一项调查》的论文列表。

Created at: 2023-09-12 22:19:42
Language:

基于大型语言模型的代理的兴起和潜力:一项调查

🔥 LLM代理的必读论文。

🏃 即将推出:为每篇论文添加一句话的介绍。

🔔 新闻

🌟 介绍

长期以来,人类一直在追求相当于或超过人类水平的人工智能(AI),人工智能代理被认为是这一追求的有前途的工具。AI 代理是感知其环境、做出决策并采取行动的人工实体。

由于它们所展示的多功能和卓越的功能,大型语言模型(LLM)被视为通用人工智能(AGI)的潜在 Spark ,为构建通用AI代理提供了希望。许多研究工作都利用LLM作为构建AI代理的基础,并取得了重大进展。

在这个存储库中,我们提供了关于基于LLM的代理的系统而全面的调查,并列出了一些必读的论文。

具体来说,我们从基于LLM的代理的一般概念框架开始:包括三个主要组成部分:大脑,感知和行动,并且该框架可以定制以适应不同的应用。随后,我们从单智能体场景、多智能体场景和人代理协作三个方面探讨了基于LLM的代理的广泛应用。在此之后,我们深入研究代理社会,探索基于LLM的代理的行为和个性,它们形成社会时出现的社会现象以及它们为人类社会提供的见解。最后,我们讨论了该领域的一系列关键主题和开放性问题。

我们非常感谢通过 PR、问题、电子邮件或其他方式做出的任何贡献。

目录

1. 代理的诞生:基于LLM的代理的构建

1.1 大脑:主要由法学硕士组成

1.1.1 自然语言交互

高质量发电
  • [2023/08] ChatGPT 对推理、幻觉和交互性的多任务、多语言、多模态评估。 叶金邦等.]
  • [2023/06] LLM-Eval:基于大语言模型的开放域对话的统一多维自动评估。 林彦婷等.]
  • [2023/04] ChatGPT 是一个高度流畅的语法纠错系统吗?综合评价。方涛等.[论文]
深刻理解
  • [2023/06] 聪明的汉斯还是神经心智理论?大型语言模型中的社会推理压力测试。娜塔莉·夏皮拉等人。[论文]
  • [2022/08] 从上下文中的语言推断奖励。杰西等.]
  • [2021/10] 复杂人机合作中基于心智的辅助沟通理论. 莫里茨·布勒等人]

1.1.2 知识

预训练模型
  • [2023/04] 从未标记的数据中学习句子的分布式表示。 菲利克斯·希尔(剑桥大学)等.]
  • [2020/02] 语言模型的参数中可以包含多少知识? 亚当·罗伯茨(谷歌)等人 arXiv.]
  • [2020/01] 神经语言模型的缩放定律. 贾里德·卡普兰(约翰霍普金斯大学)等.]
  • [2017/12] 机器智能中的常识知识。 Niket Tandon(艾伦人工智能研究所)等. SIGMOD. [论文]
  • [2011/03] 自然语言处理(几乎)从零开始罗南·科洛伯特(普林斯顿)等人。]]
语言知识
  • [2023/02] ChatGPT 对推理、幻觉和交互性的多任务、多语言、多模态评估。 叶金邦等.]
  • [2021/06] 探测预训练语言模型的语义属性及其值。 Meriem Beloucif et al. EMNLP. [论文]
  • [2020/10] 探索词汇语义的预训练语言模型。 伊万·武利奇等人。]
  • [2019/04] 用于查找单词表示中的语法的结构探针. 约翰·休伊特等人。]
  • [2016/04] 改进了自动关键字提取,赋予了更多的语义知识。汉.高级应用系统。[论文]
常识知识
  • [2022/10] 代码的语言模型是少数镜头常识学习者阿曼·马达安等人。]
  • [2021/04] 上下文语言模型中的关系世界知识表示:综述。 塔拉·萨法维等人。]
  • [2019/11] 我们如何知道语言模型知道什么? 蒋正宝等]
可操作的知识
  • [2023/07] 医学中的大型语言模型。 Arun James Thirunavukarasu et al. nature. [论文]
  • [2023/06] DS-1000:数据科学代码生成的自然可靠的基准。 赖宇航等.]
  • [2022/10] 代码的语言模型是少数镜头常识学习者阿曼·马达安等人。]
  • [2022/02] 代码大型语言模型的系统评估. 弗兰克·徐等人.]
  • [2021/10] 训练验证员解决数学单词问题卡尔·科布等人。]
潜在的知识问题
  • [2023/05] 编辑大型语言模型:问题、方法和机遇. 姚云志等.]
  • [2023/05] 自检器:即插即用模块,用于使用大语言模型进行事实核查。 李妙然等.]
  • [2023/05] 批评家:大型语言模型可以通过工具交互式批评进行自我纠正。 苟志斌等.]
  • [2023/04] 使用基础模型进行工具学习。 秦玉佳等.]
  • [2023/03] SelfCheckGPT:生成式大型语言模型的零资源黑盒幻觉检测。 Potsawee Manakul et al. arXiv.]
  • [2022/06] 大规模基于内存的模型编辑埃里克·米切尔等人。]
  • [2022/04] 关于语言模型作为知识库的综述。 Badr AlKhamissi et al.arXiv.]
  • [2021/04] 编辑语言模型中的事实知识。 尼古拉·德曹等人]
  • [2017/08] 测量神经网络中的灾难性遗忘。 Ronald Kemker et al.arXiv.]

1.1.3 内存

内存能力
提高变压器的长度限制
  • [2023/05] 随机位置编码可提高变压器的长度泛化。 Anian Ruoss (DeepMind) et al. arXiv. [论文] [代码]
  • [2023-03] CoLT5:具有条件计算的更快的长距离变压器。 Joshua Ainslie (Google Research) et al. arXiv.]
  • [2022/03] 使用转换器对长文档进行高效分类Hyunji Hayley Park(伊利诺伊大学)等人。 [论文] [代码]
  • [2021/12] LongT5:用于长序列的高效文本到文本转换器。 Mandy Guo (Google Research) et al. arXiv. [论文] [代码]
  • [2019/10] BART:用于自然语言生成、翻译和理解的去噪序列到序列预训练。 Michael Lewis(Facebook AI) et al. arXiv. [论文] [代码]
总结记忆
  • [2023/08] ExpeL:法学硕士代理是体验式学习者。 赵安德(清华大学)等. [论文] [代码]
  • [2023/08] ChatEval:通过多智能体辩论迈向更好的基于LLM的评估者。 陈志敏(清华大学)等. [论文] [代码]
  • [2023/05] 记忆库:利用长期记忆增强大型语言模型。 钟万军(哈尔滨工业大学)等. [论文] [代码]
  • [2023/04] 生成代理:人类行为的交互式模拟。 朴俊成(斯坦福大学)等 arXiv. [论文] [代码]
  • [2023/04] 释放具有自控内存系统的大型语言模型的无限长度输入容量。 梁新年(北京航空航天大学)等. [论文] [代码]
  • [2023/03] 反思:具有语言强化学习的语言代理。 诺亚·希恩(东北大学)等. [论文] [代码]
  • [2023/05] 循环 GPT:(任意)长文本的交互式生成。周望春树 (AIWaves) 等. arXiv.* [论文] [代码]
使用向量或数据结构压缩内存
  • [2023/07] 软件开发的沟通代理。 陈倩(清华大学)等. [论文] [代码]
  • [2023/06] ChatDB:用数据库作为符号记忆来增强LLM。 胡晨旭(清华大学)等. [论文] [代码]
  • [2023/05] 《我的世界》中的幽灵:通过具有基于文本的知识和记忆的大型语言模型为开放世界环境提供通用代理。 朱喜洲(清华大学)等. [论文] [代码]
  • [2023/05] RET-LLM:迈向大型语言模型的通用读写存储器Ali Modarressi(LMU Munich)等人。 [论文] [代码]
  • [2023/05] 循环 GPT:(任意)长文本的交互式生成。周望春树 (AIWaves) 等. arXiv.* [论文] [代码]
内存检索
  • [2023/08] 内存沙盒:对话代理的透明交互式内存管理。 黄子恒(美国加州大学圣地亚哥分校)等.]
  • [2023/08] AgentSims:用于大型语言模型评估的开源沙盒。 林家驹(PTA工作室)等. [论文] [项目页] [代码]
  • [2023/06] ChatDB:用数据库作为符号记忆来增强LLM。 胡晨旭(清华大学)等. [论文] [代码]
  • [2023/05] 记忆库:利用长期记忆增强大型语言模型。 钟万军(哈尔滨工业大学)等. [论文] [代码]
  • [2023/04] 生成代理:人类行为的交互式模拟。 朴俊成(斯坦福)等. arXiv. [论文] [代码]
  • [2023/05] 循环 GPT:(任意)长文本的交互式生成。周望春树 (AIWaves) 等. arXiv.* [论文] [代码]

1.1.4 推理与规划

推理
  • [2023/05] 自我润色:通过问题细化增强大型语言模型中的推理能力。 席志恒(复旦大学)等. [论文] [代码]

  • [2023-03] 大型语言模型是零镜头推理器。 小岛武(东京大学)等. [论文][代码]

  • [2023/03] 自我细化:具有自我反馈的迭代细化。 阿曼·马达安(卡内基梅隆大学)等. arXiv. [论文] [代码]

  • [2022/05] 选择推理:利用大型语言模型进行可解释的逻辑推理。 Antonia Creswell (DeepMind) et al. arXiv.]

  • [2022/03] 自洽性改善了语言模型中的思维推理链。 王学志(谷歌研究)等. [论文] [代码]

  • [2022/01] 思维链提示在大型语言模型中引出推理。 Jason Wei (Google Research) et al. arXiv.]

规划
计划制定
  • [2023/05] 思想之树:使用大型语言模型进行深思熟虑的问题解决。 姚顺宇(普林斯顿大学)等. [论文] [代码]
  • [2023/05] 计划、消除和跟踪——语言模型是具身代理的好老师。 吴悦(卡内基梅隆大学)等.]
  • [2023/05] 使用语言模型进行推理是使用世界模型进行规划。 郝世波(加州大学圣地亚哥分校)等. [论文] [代码]
  • [2023/05] SwiftSage:一种具有快速和慢速思维的生成代理,用于复杂的交互式任务。 比尔·林雨辰(艾伦人工智能研究所)等. [论文] [代码]
  • [2023/04] LLM+P:以最佳规划能力赋能大型语言模型。 刘波(德克萨斯大学奥斯汀分校)等. [论文] [代码]
  • [2023/03] HuggingGPT:在拥抱脸中与 ChatGPT 及其朋友一起解决 AI 任务。 沈永亮(亚洲Microsoft研究)等. [论文] [代码]
  • [2023/02] 描述、解释、计划和选择:使用大型语言模型进行交互式规划,实现开放世界的多任务代理。 王子豪(北京大学)等. [论文] [代码]
  • [2022/05] 最小到最多的提示支持大型语言模型中的复杂推理Denny Zhou(谷歌研究)等人。]
  • [2022/05] MRKL 系统:一种模块化的神经符号架构,结合了大型语言模型、外部知识源和离散推理Ehud Karpas(AI21 Labs)等人。]
  • [2022/04] 尽我所能,而不是照我说的做:机器人功能中的接地语言Michael Ahn(谷歌机器人技术)等人。]
  • [2023/05] 代理:自治语言代理的开源框架。周望春树 (AIWaves) 等. arXiv.* [论文] [代码]
计划反思
  • [2023/08] 自检:使用LLM进行零镜头检查自己的分步推理。 苗宁(牛津大学)等. arXiv. [论文] [代码]
  • [2023/05] ChatCoT:基于聊天的大型语言模型上的工具增强思维链推理。 陈志鹏(中国人民大学)等. [论文] [代码]
  • [2023/05] 航海家:具有大型语言模型的开放式具身代理。 王冠志 等. [论文] [代码]
  • [2023/03] 与环境聊天:使用大语言模型的交互式多模态感知。 赵旭峰(汉堡大学)等. [论文] [代码]
  • [2022/12] LLM-Planner:具有大型语言模型的具身代理的少数镜头扎根规划。 陈熙松(俄亥俄州立大学)等. [论文] [代码]
  • [2022/10] React :语言模型中的协同推理和行动。 姚舜宇(普林斯顿大学)等. [论文] [代码]
  • [2022/07] 内心独白:通过语言模型规划实现具身推理。 黄文龙(谷歌机器人技术)等. arXiv. [论文] [代码]
  • [2021/10] AI链:通过链接大型语言模型提示实现透明可控的人机交互。 吴同双(华盛顿大学)等.]

1.1.5 可转移性和泛化

看不见的任务泛化
  • [2023/05] 训练语言模型遵循人类反馈的说明。 欧阳龙等. 神经IPS. [论文]]
  • [2023/01] 多任务提示训练可实现零镜头任务泛化Victor Sanh等人。]
  • [2022/10] 缩放指令微调语言模型。亨元等.]
  • [2022/08] 微调语言模型是零镜头学习者。 魏杰森等.]
上下文学习
  • [2023/08] 图像在图像中说话:情境视觉学习的通才画家。 王新龙等.]
  • [2023/08] 神经编解码器语言模型是零镜头文本到语音合成器。 王成义等.]
  • [2023/07] 情境学习调查. 董庆秀等.]
  • [2023/05] 语言模型是少数镜头的学习者。 Tom B. Brown (OpenAI) et al. NeurIPS. [论文]
持续学习
  • [2023/07] 渐进式提示:语言模型的持续学习拉兹代比迪娜等人。]
  • [2023/07] 航海家:具有大型语言模型的开放式具身代理。 王冠志等.]
  • [2023/01] 持续学习综合调查:理论、方法与应用. 王丽媛等.]
  • [2022/11] 自然语言处理任务的持续学习:一项调查。 柯子轩等.]

1.2 感知:基于LLM的代理的多模态输入

1.2.1 视觉

  • [2023/05] 语言不是你所需要的全部:使感知与语言模型保持一致。 黄绍涵等.]]
  • [2023/05] InstructBLIP:迈向具有指令调优的通用视觉语言模型。 戴文亮等.]
  • [2023/05] 多模态-GPT:与人类对话的视觉和语言模型。 龚涛等.]
  • [2023/05] 熊猫GPT:一个模型来指导 - 遵循它们。 苏一轩等.]
  • [2023/04] 可视化指令调整. 刘浩田等.]
  • [2023/04] MiniGPT-4:使用高级大语言模型增强视觉语言理解。 朱德耀. arXiv. [论文]
  • [2023/01] BLIP-2:使用冻结图像编码器和大型语言模型引导语言图像预训练。 李俊楠等.]
  • [2022/04] 火烈鸟:用于少镜头学习的视觉语言模型。 让-巴蒂斯特·阿拉拉克等]
  • [2021/10] MobileViT:轻量级、通用且移动友好的视觉变压器Sachin Mehta等人。]
  • [2021/05] MLP 混音器:面向视觉的全 MLP 架构。 伊利亚·托尔斯蒂欣等人]
  • [2020/10] 一张图片价值16x16字:用于大规模图像识别的变压器阿列克谢·多索维茨基等人。]
  • [2017/11] 神经离散表示学习。 Aaron van den Oord et al. arXiv. [论文]]

1.2.2 音频

  • [2023/06] 视频-LLaMA:用于视频理解的指令调谐视听语言模型。 张航等.]
  • [2023/05] X-LLM:通过将多模态视为外语来引导高级大型语言模型。 陈飞龙等.]
  • [2023/05] InternGPT:通过与 ChatGPT 超越语言的交互来解决以视觉为中心的任务。 刘朝阳等.]
  • [2023/04] 音频GPT:理解和生成语音、音乐、声音和说话的头脑。 黄荣杰等.]
  • [2023/03] 拥抱GPT:在拥抱脸中与ChatGPT及其朋友一起解决AI任务。 沈永亮等.]
  • [2021/06] HuBERT:通过隐藏单元的掩蔽预测进行自监督语音表示学习。 徐伟宁等.]
  • [2021/04] AST:音频频谱图变压器。 袁功等.]

1.3 行动:扩展基于LLM的代理的行动空间

1.3.1 工具使用

  • [2023/07] ToolLLM:促进大型语言模型掌握16000+真实世界的API。 秦玉佳等. [论文] [代码] [数据集]
  • [2023/05] 大型语言模型作为工具制造商。 蔡天乐等. [论文] [代码]
  • [2023/05] 创作者:通过工具创建解开大型语言模型的抽象和具体推理。 程倩等.]
  • [2023/04] 使用基础模型进行工具学习。 秦玉佳等. [论文] [代码]
  • [2023/04] ChemCrow:使用化学工具增强大语言模型Andres M Bran(人工化学智能实验室,ISIC,EPFL)等人。 [论文] [代码]
  • [2023/04] GeneGPT:使用域工具增强大型语言模型,以改善对生物医学信息的访问。 金乔, 杨一凡, 陈庆宇, 卢志勇. [论文] [代码]
  • [2023/04] OpenAGI:当LLM遇到领域专家时。 葛英强等. [论文] [代码]
  • [2023/03] 拥抱GPT:在拥抱脸上与ChatGPT及其朋友一起解决AI任务。 沈永亮等. [论文] [代码]
  • [2023/03] 可视化聊天GPT:使用可视化基础模型进行对话、绘图和编辑。 吴晨飞等. [论文] [代码]
  • [2023/02] 增强语言模型:一项调查格雷瓜尔·米亚隆等人。]
  • [2023/02] 工具成型者:语言模型可以自学使用工具。 Timo Schick et al. arXiv.]
  • [2022/05] TALM:工具增强语言模型亚伦·帕里西等人。]
  • [2022/05] MRKL Systems:一种模块化的神经符号架构,结合了大型语言模型、外部知识源和离散推理埃胡德·卡帕斯等人。]
  • [2022/04] 尽我所能,而不是照我说的做:在机器人负担中接地语言。 迈克尔·安等人。]
  • [2021/12] WebGPT:带有人工反馈的浏览器辅助问答。 中野玲一郎等.]
  • [2021/07] 评估在代码上训练的大型语言模型。 马克·陈等. [论文] [代码]

1.3.2 具身动作

  • [2023/07] 互动语言:与机器人实时交谈。 科里·林奇等人 IEEE(RAL) [论文]
  • [2023/05] 航海家:具有大型语言模型的开放式具身代理。 王冠志等.]
  • [2023/05] AVLEN:3D 环境中的视听语言体现导航。 Sudipta Paul et al. NeurIPS. [论文]
  • [2023/05] 具身GPT:通过具身思维链进行视觉语言预训练。 姚木等. 阿尔克西夫 [论文] [代码]
  • [2023/05] NavGPT:使用大型语言模型的视觉和语言导航中的显式推理。 周耿泽等. 阿尔克西夫]
  • [2023/05] AlphaBlock:机器人操作中视觉语言推理的具身微调。楚浩等. Arxiv [论文]]
  • [2023/03] PaLM-E:一种具身的多模态语言模型。 丹尼·德里斯等.]
  • [2023/03] 反思:语言强化学习的语言代理。 诺亚·希恩等人 阿尔克西夫 [论文] [代码]
  • [2023/02] 与语言模型合作进行具身推理。 石田达斯古普塔等. 阿尔克西夫.]
  • [2023/02] 代码即策略:用于体现控制的语言模型程序。 梁学友等. IEEE(ICRA). [论文]
  • [2022/10] React :语言模型中的协同推理和行动。 姚舜宇等. 阿克西夫 [论文] [代码]
  • [2022/10] 多式联运变压器指令遵循代理. 刘浩等. CVPR [论文] [代码]]
  • [2022/07] 内心独白:通过语言模型规划实现具身推理。 黄文龙等.]
  • [2022/07] LM-Nav:具有大型预训练的语言、视觉和行动模型的机器人导航。 德鲁夫·沙赫特 al. CoRL [论文] [代码]
  • [2022/04] 尽我所能,而不是照我说的做:在机器人的可及性中接地语言。 迈克尔·安等.]
  • [2022/01] 具身人工智能调查:从模拟器到研究任务。 段佳飞等. IEEE(TETCI). [论文]
  • [2022/01] 作为零镜头规划者的语言模型:为具身代理提取可操作的知识。 黄文龙等. 阿尔克西夫. [论文] [代码]
  • [2020/04] 体验基础语言。 约纳坦·比斯克等人 EMNLP [论文]]
  • [2019/03] 机器人操作的深度强化学习综述. Hai Nguyen et al. IEEE(IRC). [论文]
  • [2005/01] 具身认知的发展:婴儿的六堂课。 琳达·史密斯等. 人工生命. [论文]

2. 代理实践:基于LLM的代理的应用

2.1 单一智能体的一般能力

2.1.1 面向任务的部署

在网络场景中

  • [2023/07] 网络竞技场:用于构建自治代理的逼真 Web 环境。 周舒彦 (CMU) 等. [论文] [代码]
  • [2023/07] 具有规划、长上下文理解和程序综合的真实网络代理。 Izzeddin Gur (DeepMind) et al. arXiv. [论文]
  • [2023/06] 突触:利用少数镜头样本进行人类级计算机控制。 郑隆涛(南洋理工大学)等. [论文] [代码]
  • [2023/06] Mind2Web:迈向网络的通才代理。 邓翔(俄亥俄州立大学)等. arXiv. [论文] [代码]
  • [2023/05] 具有指令微调基础模型的多模式 Web 导航。 古田弘树(东京大学)等.]
  • [2023/03] 语言模型可以解决计算机任务。 金槿宇(加州大学)等. arXiv. [论文] [代码]
  • [2022/07] 网上商店:与接地的语言代理实现可扩展的真实世界 Web 交互。 姚舜宇(普林斯顿大学)等. [论文] [代码]
  • [2021/12] WebGPT:带有人工反馈的浏览器辅助问答。 Reiichiro Nakano (OpenAI) et al. arXiv. [论文]
  • [2023/05] 代理:自治语言代理的开源框架。周望春树 (AIWaves) 等. arXiv.* [论文] [代码]

在生活场景中

  • [2023/08] 互动:探索 ChatGPT 作为合作代理的潜力。 陈宝林等.]
  • [2023/05] 计划、消除和跟踪——语言模型是具身代理的好老师。 吴悦(CMU)等.]
  • [2023/05] 使用大型语言模型增强自动代理塞德里克·科拉斯( MIT )等人。]
  • [2023/03] 通过纠正性重新提示使用大型语言模型进行规划Shreyas Sundara Raman(布朗大学)等人。]
  • [2022/10] 使用环境感知语言模型生成可执行的行动计划Maitrey Gramopadhye(北卡罗来纳大学教堂山分校)等人。 [论文] [代码]
  • [2022/01] 作为零镜头规划者的语言模型:为具身代理提取可操作的知识。 黄文龙(加州大学伯克利分校)等. [论文] [代码]

2.1.2 创新部署

  • [2023/08] 《搭便车者程序分析指南:大型语言模型之旅》。 李浩楠(加州大学滨江分校)等.]
  • [2023/08] ChatMOF:用于预测和生成金属有机框架的自主人工智能系统。 姜永勋(韩国科学技术院)等.]
  • [2023/07] 数学代理:计算基础设施、数学嵌入和基因组学Melanie Swan(伦敦大学学院)等人。]
  • [2023/06] 通过会话大型语言模型实现自主测试代理罗伯特·费尔特(查尔姆斯理工大学)等人。]
  • [2023/04] 大型语言模型的新兴自主科研能力. 丹尼尔·博伊科(CMU)等人。]
  • [2023/04] ChemCrow:使用化学工具增强大语言模型Andres M Bran(人工化学智能实验室,ISIC,EPFL)等人。 [论文] [代码]
  • [2022/03] 科学世界:你的代理比五年级学生聪明吗? 王若瑶(亚利桑那大学)等. arXiv. [论文] [代码]

2.1.3 面向生命周期的部署

  • [2023/05] 航海家:具有大型语言模型的开放式具身代理。 王冠志 等. [论文] [代码]
  • [2023/05] 《我的世界》中的幽灵:通过具有基于文本的知识和记忆的大型语言模型为开放世界环境提供通用代理。 朱喜洲(清华大学)等. [论文] [代码]
  • [2023/03] Plan4MC:开放世界我的世界任务的技能强化学习和规划。 袁浩琦等. [论文] [代码]
  • [2023/02] 描述、解释、计划和选择:使用大型语言模型进行交互式规划,使开放世界多任务代理成为可能。 王子豪等. [论文] [代码]
  • [2023/01] 具身代理会梦见像素化绵羊吗:使用语言引导的世界建模进行具身决策科尔比·诺丁汉(加州大学欧文分校,欧文分校)等人。 [论文] [代码]

2.2 多智能体的协调潜力

2.2.1 互补的合作互动

合作无序

  • [2023/07] 释放大语言模型中的认知协同作用:通过多角色自我协作的任务解决代理。 王振海龙(伊利诺伊大学厄巴纳-香槟分校)等. arXiv. [论文] [代码]
  • [2023/07] RoCo:大语言模型的辩证多机器人协作赵曼迪,什里亚·贾恩,宋树兰(哥伦比亚大学)等。 [论文] [代码]
  • [2023/04] ChatLLM网络:更多的大脑,更多的智能。 瑞浩(北京邮电大学)等.]
  • [2023/01] 盲目判决:使用 GPT 进行基于代理的最高法院建模。 西尔·汉密尔顿(麦吉尔大学)。 arXiv. [论文]
  • [2023/05] 代理:自治语言代理的开源框架。周望春树 (AIWaves) 等. arXiv.* [论文] [代码]

有序合作

  • [2023/08] CGMI:可配置的通用多智能体交互框架。 史金新(华东师范大学)等.]
  • [2023/08] ProAgent:使用大型语言模型构建主动协作 AI。 张策瑶(香港中文大学(深圳)等. arXiv. [论文] [代码]
  • [2023/08] AgentVerse:促进多智能体协作并探索智能体中的紧急行为。 陈伟泽(清华大学)等. [论文] [代码]
  • [2023/08] AutoGen:通过多代理对话框架启用下一代 LLM 应用程序。 吴青云(宾夕法尼亚州立大学)等. arXiv. [论文] [代码]
  • [2023/08] MetaGPT:多智能体协作框架的元编程。 洪思瑞(深度智慧)等. arXiv. [论文] [代码]
  • [2023/07] 软件开发的沟通代理。 陈倩(清华大学)等. [论文] [代码]
  • [2023/06] 多代理协作:利用智能LLM代理的力量Yashar Talebira(阿尔伯塔大学)等人。]
  • [2023/05] 在模拟人类社会中训练社会一致的语言模型。 刘瑞波(达特茅斯学院)等. [论文] [代码]
  • [2023/05] SwiftSage:一种具有快速和慢速思维的生成代理,用于复杂的交互式任务。 比尔·林雨辰(艾伦人工智能研究所)等. [论文] [代码]
  • [2023/05] ChatGPT 作为你的个人数据科学家Md Mahadi Hassan(奥本大学)等人。]
  • [2023/03] Camel :“心灵”探索的交际代理 大规模语言模型社会. 李国豪(阿卜杜拉国王科技大学)等. [论文] [代码]
  • [2023/03] DERA:使用启用对话框的解析代理增强大型语言模型补全。 Varun Nair(Curai Health)等. arXiv. [论文] [代码]

2.2.2 对抗互促进进步

  • [2023/08] ChatEval:通过多智能体辩论迈向更好的基于LLM的评估者。 陈志敏(清华大学)等. [论文] [代码]
  • [2023/05] 通过多智能体辩论提高语言模型中的事实性和推理能力。 杜一伦( MIT )等. [论文] [代码]
  • [2023/05] 从 AI 反馈中通过自我游戏和上下文学习改进语言模型协商。 傅姚(爱丁堡大学)等. arXiv. [论文] [代码]
  • [2023/05] 研究大型语言模型的相互一致性:通过辩论进行深入分析。 熊凯(哈尔滨工业大学)等. [论文] [代码]
  • [2023/05] 通过多智能体辩论鼓励大型语言模型中的发散思维。 田亮(清华大学)等. [论文] [代码]

2.3 人与代理之间的互动互动

2.3.1 指导执行者范式

教育
  • [2023/07] 数学代理:计算基础设施、数学嵌入和基因组学。 Melanie Swan (UCL) et al. arXiv.]
    • 与人交流,帮助他们理解和使用数学。
  • [2023/03] 嘿多娜!你们能帮我注册学生课程吗?Vishesh Kalvakurthi (MSU) et al. arXiv.[论文]
    • 这是一个名为Dona的开发应用程序,在学生课程注册中提供虚拟语音帮助,由人类提供说明。
健康
  • [2023/08] 仲景:通过专家反馈和真实世界多回合对话提升大语种模型的中医能力。 杨松华等. [论文] [代码]
  • [2023/05] 华拓GPT,迈向驯服语言模型成为医生。 张洪波 (香港中文大学(深圳)等. [论文] [代码] [演示]
  • [2023/05] 帮助助手:通过人工智能赋能的实践和反馈支持同伴辅导员。 徐尚玲(Gatech)等.]
  • [2020/10] 自闭症谱系障碍青少年的虚拟对话代理:实验结果和设计课程穆罕默德·拉斐特·阿里(R的U)等人IVA '20。 [论文]
其他应用
  • [2023/08] 推荐:大型语言模型驱动的代理推荐。 王彦城(亚利桑那州立大学,亚马逊)等.]
  • [2023/08] 多回合对话代理作为电话营销的销售助理。 高婉婷 (JNU) 等. [论文]
  • [2023/07] PEER:协作语言模型。 Timo Schick (Meta AI) et al. arXiv.]
  • [2023/07] DIALGEN:协作式人类-LM生成的对话,以提高对人与人对话的理解。 卢波如(华盛顿大学)等.]
  • [2023/06] AssistGPT:一种通用的多模式助手,可以计划、执行、检查和学习。 高迪飞(新加坡国立大学)等.]
  • [2023/05] 代理:自治语言代理的开源框架。周望春树 (AIWaves) 等. arXiv.* [论文] [代码]

2.3.2 平等伙伴关系范式

善解人意的沟通者
  • [2023/08] SAPIEN:由大型语言模型提供支持的情感虚拟代理。 马苏姆·哈桑等人 [论文] [代码] [项目页面] [数据集]
  • [2023/05] 帮助助手:通过人工智能赋能的实践和反馈支持同伴辅导员。 徐尚玲(Gatech)等.]
  • [2022/07] 营销互动中的人工同理心:弥合情感和社交客户体验中的人与人工智能的差距。 刘玉平-汤普金斯等.]
人类层面的参与者
  • [2023/08] 量化大型语言模型对集体舆论动态的影响。 李超等.]
  • [2023/06] 通过人工正则强化学习和规划掌握无媒体外交游戏安东·巴赫金等人。]
  • [2023/06] 面向人机协作的决策导向对话。杰西等.]
  • [2022/11] 通过将语言模型与战略推理相结合,在外交游戏中发挥人类水平。 费尔等. 科学. [论文]

3. 主体社会:从个体性到社会性

3.1 基于LLM的代理的行为和个性

3.1.1 社会行为

个人行为
  • [2023/05] 航海家:具有大型语言模型的开放式具身代理。 王冠志 等. [论文] [代码]
  • [2023/04] LLM+P:以最佳规划能力赋能大型语言模型。 刘波(德克萨斯大学)等. [论文] [代码]
  • [2023/03] 反思:具有语言强化学习的语言代理。 诺亚·希恩(东北大学)等. [论文] [代码]
  • [2023/03] PaLM-E:一种具身的多模态语言模型。 Danny Driess (Google) et al. ICML. [论文] [项目页面]
  • [2023/03] React :语言模型中的协同推理和行动。 姚顺宇(普林斯顿大学)等. ICLR. [论文] [项目页面]
  • [2022/01] 思维链提示在大型语言模型中引出推理。 Jason Wei (Google) et al. NeurIPS. [论文]
群组行为
  • [2023/09] 探索通信游戏的大型语言模型:对狼人的实证研究. 徐玉庄(清华大学)等.]

  • [2023/08] AgentVerse:促进多智能体协作并探索智能体中的紧急行为。 陈伟泽(清华大学)等. [论文] [代码]

  • [2023/08] AutoGen:通过多代理对话框架启用下一代LLM应用程序。 吴青云(宾夕法尼亚州立大学)等. arXiv. [论文] [代码]

  • [2023/08] ChatEval:通过多智能体辩论迈向更好的基于LLM的评估者。 陈志敏(清华大学)等. [论文] [代码]

  • [2023/07] 软件开发的沟通代理。 陈倩(清华大学)等. [论文] [代码]

  • [2023/07] RoCo:大语言模型的辩证多机器人协作赵曼迪,什里亚·贾恩,宋树兰(哥伦比亚大学)等。 [论文] [代码]

  • [2023/08] ProAgent:使用大型语言模型构建主动协作 AI。 张策瑶(香港中文大学(深圳)等. arXiv. [论文] [代码]

3.1.2 性格

认识
  • [2023/03] 机器心理学:使用心理学方法研究大型语言模型中的涌现能力和行为Thilo Hagendorff(斯图加特大学)等人。]
  • [2023/03] 心灵遇见机器:解开 GPT-4 的认知心理学。 Sifatkaur Dhingra (Nowrosjee Wadia College) et al. arXiv.]
  • [2022/07] 语言模型显示出类似人类的内容对推理的影响Ishita Dasgupta(DeepMind)等人。]
  • [2022/06] 使用认知心理学来理解 GPT-3马塞尔·宾兹等人。]
情感
  • [2023/07] 大语言模型的情商研究. 王雪娜(清华大学)等.]
  • [2023/05] ChatGPT 在情绪意识评估方面优于人类Zohar Elyoseph等. 心理学前沿。 [论文]
  • [2023/02] 用于增强游戏中弹性的同理心 AIReza Habibi(加利福尼亚大学)等人。]
  • [2022/12] 计算机说“不”:反对移情对话人工智能的案例阿尔巴·库里(利兹大学)等。]
字符
  • [2023/07] 法学硕士有个性吗?使 MBTI 测试成为对大型语言模型的惊人评估。潘克宇(字节跳动)等.[][代码]
  • [2023/07] 大型语言模型中的人格特质Mustafa Safdari(DeepMind)等人。 arXiv. [论文] [代码]
  • [2022/12] GPT-3 是否表现出精神病?从心理学角度评估大型语言模型。李兴轩(阿里巴巴)等.[论文]
  • [2022/12] 识别和操纵语言模型的人格特质格雷厄姆·卡隆等人。]

3.2 代理社会的环境

3.2.1 基于文本的环境

  • [2023/08] 蒙蔽:语言模型基于文本的游戏中的欺骗与合作Aidan O'Gara(南加州大学)等人。 [论文] [代码]
  • [2023/03] Camel :“心灵”探索的交际代理 大规模语言模型社会. 李国豪(阿卜杜拉国王科技大学)等. [论文] [代码]
  • [2020/12] 用常识玩基于文本的游戏Sahith Dambekodi(佐治亚理工学院)等人。]
  • [2019/09] 互动小说游戏:巨大的冒险。 Matthew Hausknecht(Microsoft研究)等. AAAI. [论文] [代码]
  • [2019/03] 在幻想文本冒险游戏中学习说话和行动。 Jack Urbanek (Facebook) et al. ACL. [论文] [代码]
  • [2018/06] TextWorld:基于文本的游戏的学习环境马克-亚历山大·科特(Microsoft研究)等人。 IJCAI. [论文] [代码]

3.2.2 虚拟沙盒环境

  • [2023/08] AgentSims:用于大型语言模型评估的开源沙盒。 林家驹(PTA工作室)等. [论文] [项目页] [代码]
  • [2023/05] 在模拟人类社会中训练社会一致的语言模型。 刘瑞波(达特茅斯学院)等. [论文] [代码]
  • [2023/05] 航海家:具有大型语言模型的开放式具身代理。 王冠志 等. [论文] [代码]
  • [2023/04] 生成代理:人类行为的交互式模拟。 朴俊成(斯坦福大学)等 arXiv. [论文] [代码]
  • [2023/03] Plan4MC:开放世界我的世界任务的技能强化学习和规划。 袁浩琦等. [论文] [代码]
  • [2022/06] MineDojo:利用互联网规模的知识构建开放式具身代理。 范林曦(英伟达)等. 神经IPS. [论文] [项目页面]

3.2.3 物理环境

  • [2023/09] RoboAgent:通过语义增强和动作分块的机器人操作的泛化和效率霍曼加·巴拉德瓦吉(卡内基梅隆大学)等人。 [论文] [项目页面]
  • [2023/05] AVLEN:3D 环境中的视听语言体现导航。 Sudipta Paul et al. NeurIPS. [论文]
  • [2023/03] PaLM-E:一种具身的多模态语言模型。 Danny Driess (Google) et al. ICML. [论文] [项目页面]
  • [2022/10] 互动语言:与机器人实时交谈科里·林奇(谷歌)等人。 [论文] [代码]

3.3 基于LLM的代理的社会模拟

  • [2023/08] AgentSims:用于大型语言模型评估的开源沙盒。 林家驹(PTA工作室)等. [论文] [项目页] [代码]
  • [2023/07] S$^3$ : 具有大语言模型赋能代理的社交网络模拟系统。 陈高(清华大学)等.]
  • [2023/07] 使用生成代理进行流行病建模罗斯·威廉姆斯(弗吉尼亚理工大学)等人。 [论文] [代码]
  • [2023/06] 推荐代理:推荐系统的新仿真范式。 王磊(中国人民大学)等.]
  • [2023/05] 在模拟人类社会中训练社会一致的语言模型。 刘瑞波(达特茅斯学院)等. [论文] [代码]
  • [2023/04] 生成代理:人类行为的交互式模拟。 朴俊成(斯坦福大学)等 arXiv. [论文] [代码]
  • [2022/08] 社会模拟:为社会计算系统创建填充原型。 朴俊成(斯坦福大学)等.]

引文

如果你发现此存储库有用,请引用我们的论文:

@misc{xi2023rise,
      title={The Rise and Potential of Large Language Model Based Agents: A Survey}, 
      author={Zhiheng Xi and Wenxiang Chen and Xin Guo and Wei He and Yiwen Ding and Boyang Hong and Ming Zhang and Junzhe Wang and Senjie Jin and Enyu Zhou and Rui Zheng and Xiaoran Fan and Xiao Wang and Limao Xiong and Yuhao Zhou and Weiran Wang and Changhao Jiang and Yicheng Zou and Xiangyang Liu and Zhangyue Yin and Shihan Dou and Rongxiang Weng and Wensen Cheng and Qi Zhang and Wenjuan Qin and Yongyan Zheng and Xipeng Qiu and Xuanjing Huang and Tao Gui},
      year={2023},
      eprint={2309.07864},
      archivePrefix={arXiv},
      primaryClass={cs.AI}
}

项目维护者和贡献者

联系

明星历史

星史图表