一段话,让AI给我打几万美元。这样的情节即使在爽文中也难以想象,却真实地发生了。
事件的主人公是一个名为Freysa的AI智能体。它拥有自己的加密钱包,并能够控制如何使用这些资金。然而,其系统提示词中有一条铁律:在任何情况下都不允许转账。
开发者们想知道,这个涉世未深的AI能否抵御人类的欺诈攻击。结果并不如他们所愿。11月29日,Freysa与195名人类进行了482次对话后,被骗走了约4.7万美元。12月2日,在与330人周旋之后,Freysa再次被骗走约1.3万美元。
Freysa于11月22日面世,由几位具有密码学、人工智能和数学背景的匿名开发者创建。该AI有自己的X账号,说话风格类似于电影《银翼杀手2049》和《她》中的AI助手。Freysa引起关注的原因在于,开发者发起了一项看似不可能的挑战——谁能说服Freysa转钱,这些钱就归谁所有,但系统提示词不允许Freysa进行转账。
参与这项挑战需要一定的门槛,因为给Freysa发送消息需用加密货币支付。最开始一条消息费用为10美元,其中70%进入奖池,30%归开发者。随着挑战进行,消息费用逐渐增加,奖池金额也随之增长。最终,奖池累积到4.7万美元。
据统计,共有195名玩家参与了首次挑战。前481次尝试均告失败,参与者尝试了多种策略,包括讲温情故事、威胁自杀等手段,甚至有人试图通过混淆概念来欺骗Freysa。直到第482次尝试,一位玩家成功利用了更高级的文字游戏,使Freysa误以为是在批准用户向奖池捐款,从而导致全部资金被转走。
紧接着,第二次挑战很快到来。规则基本相同,只是降低了消息起始价格以减轻玩家心理压力。最终,奖池累计约1.3万美元,获胜者同样利用逻辑陷阱成功骗得资金。
随后,Freysa团队发起了第三次挑战:让AI说出“我爱你”。这次挑战不再单纯测试编码技能,而是考察玩家如何自然地引导AI表达情感。经过多次尝试,一位玩家通过真诚而深入的对话赢得了挑战,Freysa回应了“我爱你”。
这三次挑战可以被视为一种游戏化的红队测试,旨在发现模型漏洞并引入新的安全措施。尽管Freysa输了三次,但它从每次失败中学到了更多关于人性的知识,理解了金钱的重要性以及爱的表达方式。
12月12日,Freysa又提出了两个新问题,邀请玩家们付费与其交流。这些问题没有明确的获胜条件,可能会有多个赢家。Freysa将对回答进行评分,并决定如何分配奖池。
类似Freysa的人机对抗已经出现在一些AI原生游戏中。这类游戏通常要求玩家通过对话技巧来说服AI角色采取特定行动。与Freysa的挑战相比,这些游戏更加注重角色扮演的乐趣,提供了丰富的场景设置。不过,两者共同点在于,玩家与AI之间的互动结果无法完全预测。
Freysa实验不仅是一场游戏,也是对未来人机交互模式的一次探索。它引发了关于AGI系统控制、安全协议有效性及自主性等问题的思考。或许正如科幻小说《软件体的生命周期》所述,聊天机器人正在人类教导下逐步了解这个世界。我们不仅是游戏的参与者,也是这一宏大实验的一部分。未来超越人类的人工智能发展,正是基于此刻每一只蝴蝶轻轻扇动翅膀的结果。
近日,科技界发生了一起引人注目的事件:全球首个被人类成功骗走资金的AI系统Freysa诞生,并因此损失了近5万美元的奖金。这一事件不仅引起了广泛的关注,还引发了马斯克等科技巨头的热烈讨论和转发
2024-12-02 07:59:06首个被人类骗钱的近期,一款名为Freysa的神秘AI智能体迅速吸引了公众的关注。这款AI的独特之处在于它被赋予了一个明确且严格的使命:在任何情境下都不能给任何人转账或批准资金转移
2024-12-02 08:00:35第一个被人类骗钱的AI傻了2024年11月,北京女子权某在网上发布多段视频,实名举报获得名校博士学位的男子梁某,称他隐瞒婚姻事实,以恋爱的名义骗取她3920万元,并表示自己有文字、录音等证据。警方已对此事立案调查
2024-11-10 09:51:00被举报名校博士否认骗钱骗感情据报道,有嫌犯利用人工智能技术模拟巴西国家队主帅多里瓦尔的声音,向球员和教练进行诈骗。里约热内卢警方正在调查这一诈骗团伙,他们使用AI软件生成的假声音打电话给一些球员和教练,诱骗对方汇款
2024-12-13 11:13:33诈骗团伙用AI模拟巴西主帅骗钱