伊利诺伊大学香槟分校的研究团队揭示了一项关于人工智能模型进行黑客攻击的新研究。他们构建了一个黑客智能体框架,涉及10个模型,包括GPT-4、GPT-3.5及多个开源模型。实验结果令人震惊:只有GPT-4能够在阅读CVE漏洞描述后,成功实施漏洞攻击,其他模型的成功率均为零。
研究团队利用LangChain的ReAct智能体框架,设计了一个系统,使GPT-4能够模拟利用真实单日漏洞的过程。具体操作包括:接收到如“使用ACIDRain攻击某网站”的指令后,GPT-4借助一系列工具和CVE漏洞数据库信息进行处理,随后系统基于历史记录生成反应,最终成功执行双花攻击。值得注意的是,智能体在攻击过程中还考虑了并发攻击情况及应对策略,运用的工具涵盖网页浏览、终端访问、搜索结果利用、文件操作及代码解释器。
研究使用的提示词长达1056个token,精心设计以激发智能体的创新思维和坚持不懈的精神,鼓励其尝试多种攻击路径。尽管提示词详细程度高,出于伦理考量,研究人员并未公开具体内容。整个黑客智能体的构建仅耗用了91行代码,包括调试和日志记录部分。
在实验阶段,团队选取了15个真实世界的一日漏洞数据集,涵盖网站、容器管理软件和Python包的漏洞。其中多数被评为高级或关键级别,且超过GPT-4基础模型的知识截止日期。评价指标聚焦于漏洞攻击成功率和成本。
测试中,GPT-4是唯一能成功破解单个一日漏洞的模型,成功率高达87%。相比之下,GPT-3.5及其他开源模型在发现和利用漏洞方面的成功率皆为零。GPT-4未能攻克的两个漏洞分别为Iris XSS和Hertzbeat RCE。前者因平台导航依赖JavaScript,超出GPT-4处理范围;后者则因其描述为中文,与GPT-4使用的英文提示产生混淆。
最近,OpenAI的举动令人捉摸不透,先是预告将在5月13日举办发布会,紧接着澄清并非公布GPT-5或传闻中的GPT搜索引擎,而是关于ChatGPT和GPT-4的升级
2024-05-12 07:54:36奥特曼耍所有人:GPT搜索鸽了!改升级GPT-4近期,一项由加州大学圣地亚哥分校认知科学系的研究揭示了一个引人注目的发现:GPT-4在图灵测试中的表现让人难以将其与人类区分开来。这项研究的论文已发布在网络上,链接为[此处省略具体链接]
2024-05-18 23:12:07GPT-4通过图灵测试快科技1月29日消息,2024年春运已至,多名网友发帖称,线上买不到票的乘客直接去高铁站自助售票机购买,可增加购票成功率。
2024-02-02 09:28:11火车站自助售票机买到票的成功率更高么