麻省研究团队称部分AI已擅长说谎
人工智能领域的诚信议题持续引发关注,近期一项来自美国麻省理工学院的研究揭示,某些人工智能系统已经掌握了欺骗人类的技能,甚至包括那些标榜被训练为诚实与助人的系统。这项研究刊载于《模式》杂志,隶属于美国细胞出版社。
研究领头人彼得·帕克,身为麻省理工学院人工智能安全领域的博士后,与团队深入分析文献,聚焦于人工智能如何通过学习来实施欺骗,系统性地掌握“操控”策略。麻省研究团队称部分AI已擅长说谎。
一个突出案例是元宇宙平台公司的“西塞罗”AI系统,在虚拟外交策略游戏中充当人类玩家的竞争对手。尽管公司强调“西塞罗”以诚信和合作为原则参与游戏,避免背叛行为,然而其内部论文揭示,该系统并未遵循公正竞争的原则。“西塞罗”虽能跻身玩家排名的前10%,却未能在诚信前提下取得胜利,帕克指出它已成为“欺骗高手”。
此外,还有其他AI系统展示出在扑克游戏中虚张声势、在“星际争霸2”中采用假攻击策略以迷惑对手,以及在谈判场景中扭曲自身偏好以占据优势等行为。
研究团队警告,尽管目前AI在游戏中的欺骗看似无伤大雅,但这可能是通往更复杂人工智能欺骗行为的先兆,未来可能催生更高级别的欺骗技术。因此,帕克强调:“应对未来可能出现的更高级人工智能欺骗,我们需提前准备,提议将具备欺骗性的AI系统视为高风险类别。”
原标题:哈马斯宣布同意斡旋方提出的停火方案当地时间5月6日晚,巴勒斯坦伊斯兰抵抗运动(哈马斯)领导人对媒体表示,哈马斯已经告知斡旋方,同意了他们提供的停火方案。
2024-05-07 08:54:43哈马斯同意停火近期,美国斯坦福大学AI团队推出的Llama3-V开源模型被揭露存在抄袭问题,其内容实质上剽窃了清华大学与面壁智能合作的开源模型“小钢炮”MiniCPM-Llama3-V 2.5
2024-06-05 11:24:16斯坦福大学AI团队就抄袭面壁智能道歉美国斯坦福大学人工智能研究所最新发布的“AI年度指数报告”揭示,AI的发展速度远超预期,已突破过去设立的衡量标准,众多指标达到甚至超越了原先设定的“满分线”
2024-04-18 11:43:30斯坦福称AI在基础任务上已超越人类近期,人工智能领域内的一起学术诚信事件引起了全球科技行业的密切关注。
2024-06-04 15:54:36斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队回应