北京时间12月6日凌晨,OpenAI举办了“12天12场直播”活动的首秀,推出了推理大模型o1的满血版本和进阶模式,以及每月收费200美元(约合人民币1450元)的ChatGPT Pro订阅服务。该套餐用户可以大规模访问OpenAI的最佳模型和工具,包括无限制使用最智能的模型o1、较小的模型o1-mini、GPT-4o及类人的ChatGPT高级语音模式Advanced Voice。
ChatGPT Pro还提供名为o1 pro mode的新o1版本,这是ChatGPT Pro独有的。新版本使用更多的计算资源,能够更深入地思考并为复杂问题提供更佳答案。未来计划为ChatGPT Pro添加更多强大的计算密集型生产力功能。
与预览版相比,当前的o1模型在回答困难现实问题时,出现重大错误的概率减少了34%,并且处理速度提高了约50%。例如,在回答“列出2世纪罗马皇帝的名字、任期和主要成就”的问题时,o1模型用时14秒,而预览版则需要34秒。此外,能力较弱的GPT-4o在回答这个问题时会出错。
o1模型现在支持图片输入,用户可以在询问太空数据中心散热问题时附上手绘示意图。OpenAI计划在未来几个月内增加网页浏览和文件上传等功能的支持。
在数学、科学和编码等具有挑战性的机器学习基准测试中,o1 pro mode表现优于o1和o1-preview。具体来说,在数学方面,o1 pro mode得分为86,而o1和o1-preview分别为78和50;在编码方面,o1 pro mode得分为90,o1和o1-preview分别为89和62;在问答博士级别的科学问题方面,o1 pro mode得分为79,后两者分别为76和74。
为了强调o1 pro mode的可靠性,OpenAI提高了评估标准,要求模型必须在四次尝试中全部正确才能算作解决了问题。即使在这种高标准下,o1 pro mode的表现依然明显优于o1和o1-preview。在四次答问都必须正确的标准下,o1 pro mode在数学方面得分为80,o1和o1-preview分别为67和37;在编码方面,o1 pro mode得分为75,o1和o1-preview分别为64和26;在问答博士级别的科学问题方面,o1 pro mode得分为74,o1和o1-preview分别为67和58。
近日,有网友发现12306上线了车内换座功能,即乘坐同一车次时,分段购票,中途乘客无需下车,直接在车内更换座位
2024-09-24 15:40:1912306增加新服务证券时报提供的信息仅供参考,不构成实质性投资建议,据此操作风险自担。下载“证券时报”官方APP或关注官方微信公众号,可随时了解股市动态,洞察政策信息,把握财富机会。AI领域持续火热
2024-11-28 08:48:05集体大涨!AI华尔街策略师的观点是,即便共和党总统候选人唐纳德·特朗普表达了他对美元贬值的偏好,他的连任实际上可能促使美元走强
2024-07-23 10:26:13特朗普抱怨美元太强作为上个月宣布的里程碑式协议的一部分,苹果公司将获得OpenAI董事会观察员职位,进一步加强了这对曾经不太可能合作的伙伴之间的关系。
2024-07-03 10:24:34苹果将获OpenAI董事会观察员职位