包括在他X主页中的简介,第一句话上来也是Language Agents:
而这,也正是他博士毕业论文的题目:
Language Agents: From Next-Token Prediction to Digital Automation
。
Language Agents,即
语言智能体
,是姚顺雨提出来了一种新的智能体类别。
和传统智能体不同的是,这种方法是将语言模型用于智能体的推理和行动,主打一个让它们实现
数字自动化
(Digital Automation)
。
至于具体的实现方法,则有三个关键技术
(均有独立的论文)
,它们分别是:
ReAct
:一种将推理和行动相结合的方法,通过语言模型生成推理轨迹和行动,来解决各种语言推理和决策任务。
思维树
:一种基于树搜索的方法,通过生成和评估多个思维路径来解决复杂问题,提高语言模型的推理能力。
CoALA
:一个概念框架,用于组织和设计语言代理,包括内存、行动空间和决策制定等方面。
以ReAct为例,研究是将语言模型的动作空间扩充为动作集和语言空间的并集。
语言空间中的动作
(即思维或推理轨迹)
不影响外部环境,但能通过对当前上下文的推理来更新上下文,可以支持未来的推理或行动。
例如在下图展示的对话中,采用ReAct的方法,可以引导智能体把“产生想法→采取行动→观察结果”这个过程进行循环。
如此一来,便可以结合推理的轨迹和操作,允许模型进行动态的推理,让智能体的决策和最终结果变得更优。
7月8日早晨9点10分,四川省2024年的第一封大学录取通知书从四川大学望江校区启程,预示着接下来四川省的考生们将会陆陆续续收到属于自己的大学录取通知
2024-07-08 10:03:00四川首封高考录取通知书来了随着2024年高考落下帷幕,烟台市的教育成果再次成为亮点。该市共有13名学生在全省排名前100,7名更是闯入前50,这份骄人的成绩映射出烟台教育的深厚底蕴
2024-07-08 10:08:28高考706分的烟台考生王铭宇:想去清华大学姚班高考进程过半,部分“学霸”已提前完成了他们的考试征程。根据浙江现行的新高考制度,学生在首考中若取得满意成绩,可选择在后续的正式高考中免试某些科目。
2024-06-11 14:56:07学霸1天考完高考江苏省中医院消化系肿瘤外科主任姚学权,在经历6年与癌症的斗争后,于2024年7月12日下午2时28分在南京离世,终年59岁
2024-07-16 20:00:5859岁肿瘤专家姚学权病逝