中华网 china.com

新闻

斯坦福称AI在基础任务上已超越人类 多项功能展现超人实力

关键词:
2024-04-18 11:43:30  红星新闻

美国斯坦福大学人工智能研究所最新发布的“AI年度指数报告”揭示,AI的发展速度远超预期,已突破过去设立的衡量标准,众多指标达到甚至超越了原先设定的“满分线”。在图像识别、阅读理解、简单运算、多语言互译等基础任务方面,AI的性能已全面超越人类,实现大规模应用。斯坦福大学学者呼吁,AI应接受更具挑战性的任务,进一步挖掘其潜力。

当前,尽管AI在竞赛级别数学问题及更高难度的抽象推理演绎上尚未超越顶尖人类智力,但科学家认为这是AI未来研发的重要方向。

斯坦福大学自2017年起每年发布的人工智能指数,由学术界和工业界的专家共同编制,旨在评估AI的技术能力、成本、伦理等多方面因素,为研究者、决策者及公众提供参考。报告主编内斯特·马斯雷指出,AI正快速打破原有的基准线,导致衡量标准需频繁更新。报告强调,AI在“语言”和“数学”等基础学科已超越人类,但在“视觉空间的常识推理”和“竞赛级数学解题”方面仍有待提升。马斯雷建议,AI的下一步发展应聚焦于增强更高层面的抽象推理能力,以实现性能跃升。

纽约大学机器学习研究员大卫·莱恩领导的团队设计的“GPQA测试”,被公认为衡量AI综合能力的标准。数据显示,人类博士生在其专业领域的GPQA测试得分率为约65%,而在其他领域则降至平均34%。相比之下,截至2023年底,各AI模型得分率普遍位于30%至40%区间。然而,今年推出的Claude 3大模型得分率已达约60%,接近博士生在其专业领域的知识水平,展现出惊人的进步速度。

AI领域的快速发展始于2011年,以GitHub平台上相关项目数量从当年的800个激增至现在的180万为标志。科技企业预见AI的广阔商业前景,大量投资推动科研进程加速。据统计,全球51个主流AI大模型中,仅15个出自学术团队,其余大部分由企业开发。

斯坦福称AI在基础任务上已超越人类 多项功能展现超人实力

AI模型训练成本显著攀升,如OpenAI的GPT-4训练成本估算为7800万美元,谷歌Gemini Ultra更是高达1.91亿美元,相比之下,2017年Transformer模型训练成本仅900美元,2019年RoBERTa Large为约16万美元。

随着版权纠纷、隐私安全等问题日益突出,AI行业亟待建立统一的安全评估标准。目前,OpenAI、谷歌、Anthropic等领先企业各自采用不同测试评估模型安全性,导致难以横向比较AI模型的风险和局限性,增加了监管难度。

面对AI的迅猛发展,公众的担忧情绪上升。根据皮尤研究中心数据,52%的美国人对AI持“忧大于喜”的态度,较2022年的38%有所增加。

(责任编辑:张佳鑫)
关闭

暴雨+大风+强对流三预警齐发!涉及全国多地

暴雨+大风+强对流三预警齐发!涉及全国多地2024-07-02 11:12:17

年轻人网贷8千债务变8万 近一半年轻人都在花着明天的钱

年轻人网贷8千债务变8万2024-07-02 11:11:41

瑞幸称凯旋麦麦酒精度低于0.5度 喝完勿开车

瑞幸称凯旋麦麦酒精度低于0.5度2024-07-02 11:10:38

“买家秀”!塞尔维亚首次公开展示红旗-17AE防空系统

“买家秀”!塞尔维亚首次公开展示红旗-17AE防空系统2024-07-01 10:04:00

高三女生卖游戏ID反被骗900元

高三女生卖游戏ID反被骗900元2024-07-02 11:03:44

当27岁的阿斯塔纳遇上23岁的上合,一起找寻青春的气息!

当27岁的阿斯塔纳遇上23岁的上合2024-07-02 11:09:23

国会请愿网站一度瘫痪!80万韩国网民要求“弹劾尹锡悦”

国会请愿网站一度瘫痪!80万韩国网民要求“弹劾尹锡悦”2024-07-02 10:19:06

议起复盘 马刺童话过于美好 勇士三叉戟解体终究未能复制传奇

议起复盘 马刺童话过于美好 勇士三叉戟解体终究未能复制传奇2024-07-02 11:00:19

160万房降到39万可以不还房贷吗?楼市寒冬下的购房者困境

160万房降到39万可以不还房贷吗2024-07-02 11:03:43

菲律宾,又传来一个坏消息

菲律宾,又传来一个坏消息2024-07-02 09:39:24

卫星影像显示山东舰抵菲附近海域,外媒猜测有“威慑”之意?军事专家解读

卫星影像显示山东舰抵菲附近海域,外媒猜测有“威慑”之意?军事专家解读2024-07-01 09:53:57

暴雨+大风+强对流三预警齐发!涉及全国多地

暴雨+大风+强对流三预警齐发!涉及全国多地2024-07-02 11:12:17

湖南一工作人员防汛时被水冲走失联

湖南一工作人员防汛时被水冲走失联2024-07-02 11:01:36

“宁愿死也不参军!”以色列极端正统派上街抗议征兵

“宁愿死也不参军!”以色列极端正统派上街抗议征兵2024-07-02 10:03:15

大选辩论后,拜登陷入“劝退”漩涡!美媒刊文:“他已不是4年前的他了”

大选辩论后,拜登陷入“劝退”漩涡!美媒刊文:“他已不是4年前的他了”2024-07-01 09:56:21

瑞幸称凯旋麦麦酒精度低于0.5度 喝完勿开车

瑞幸称凯旋麦麦酒精度低于0.5度2024-07-02 11:10:38

美媒炒作:盟友不是信不过拜登,质疑声太多恐“便宜”了中俄

美媒炒作:盟友不是信不过拜登,质疑声太多恐“便宜”了中俄2024-07-01 10:09:25

美国究竟有多少核弹头?最新数据

美国究竟有多少核弹头?最新数据2024-07-01 10:06:48

限制北约收集情报,威胁击落美无人机!俄军考虑在黑海设立禁飞区

限制北约收集情报,威胁击落美无人机!俄军考虑在黑海设立禁飞区2024-07-01 10:05:32

泽连斯基称不排除与俄“迂回”谈判,乌媒:谈判态度发生“180度大转弯”!

泽连斯基称不排除与俄“迂回”谈判,乌媒:谈判态度发生“180度大转弯”!2024-07-02 10:20:00

上海空港口岸入境旅客数量持续增长 外籍旅客增幅显著

上海空港口岸入境旅客数量持续增长2024-07-02 11:00:02

法国“屏住呼吸”举行议会选举!美媒:此次选举可能“撼动欧盟与北约”

法国“屏住呼吸”举行议会选举!美媒:此次选举可能“撼动欧盟与北约”2024-07-01 09:57:53

高校回应开设"导弹维修技术"专业:是真的

高校回应开设导弹维修技术专业2024-07-02 11:04:09

什么是住房公积金年度结息?

什么是住房公积金年度结息2024-07-02 11:07:47

党内盟友涌向媒体,千方百计转移话题,拜登开展危机公关救选情!

党内盟友涌向媒体,千方百计转移话题,拜登开展危机公关救选情!2024-07-02 10:15:18

以色列在加沙试点逐渐取代哈马斯,被哈马斯武力挫败

以色列在加沙试点逐渐取代哈马斯,被哈马斯武力挫败2024-07-02 09:56:55

张志杰母亲听闻噩耗病倒入院 家庭支柱骤失引悲痛

张志杰母亲听闻噩耗病倒入院2024-07-02 11:03:27

中企高管菲律宾被撕票 疑受邀前去考察

中企高管菲律宾被撕票 疑受邀前去考察2024-07-02 11:06:39

中国一个“管理条例”,又让西方破了大防

中国一个“管理条例”,又让西方破了大防2024-07-02 09:43:29

新华社谈张志杰离世:生命至上应是赛场的最高规则

新华社谈张志杰离世:生命至上2024-07-02 11:05:12

年轻人网贷8千债务变8万 近一半年轻人都在花着明天的钱

年轻人网贷8千债务变8万2024-07-02 11:11:41

匈牙利接任欧盟轮值主席国前夕,欧尔班发文:欧盟领导层想与俄开战

匈牙利接任欧盟轮值主席国前夕,欧尔班发文:欧盟领导层想与俄开战2024-07-01 10:10:32

炒作所谓“间谍”风险,白宫欲对中国起重机加税,美港口群起反对!

炒作所谓“间谍”风险,白宫欲对中国起重机加税,美港口群起反对!2024-07-02 10:11:08

央行今年多次提示长债风险 债市"纠偏"行动升级

央行今年多次提示长债风险2024-07-02 10:59:42

相关新闻