一夜之间,OpenAI和Claude母公司Anthropic对DeepSeek发起了指责。据《金融时报》报道,OpenAI声称发现证据,证明DeepSeek利用其模型进行训练,涉嫌侵犯知识产权。具体而言,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象,即使用更大模型的输出来提高较小模型的性能,以较低成本在特定任务上取得类似结果。微软也开始调查DeepSeek是否使用了OpenAI的API。
消息一出,引来了一波嘲讽。纽约大学教授马库斯表示,OpenAI需要免费使用所有艺术家和作家的作品训练模型,然后用省下的钱去起诉DeepSeek。知名技术媒体404 Media创始人及主编Jason也讽刺OpenAI只许州官放火。
另一方面,Anthropic创始人Dario Amodei发表长文称,说DeepSeek构成威胁太夸张了,只是达到了他们7-10个月前的水平,Claude 3.5 Sonnet在许多评估中依然领先。不过,为了保持领先,他建议设置更多限制。
相比之下,微软的做法显得耐人寻味。就在指控DeepSeek涉嫌侵权后不久,微软的AI平台上接入了DeepSeek模型。网友调侃道,否认是接受的第一步。
目前,微软和OpenAI对DeepSeek的质疑仍处于调查阶段。根据微软工作人员的说法,DeepSeek可能在去年秋天调用了OpenAI的API,导致数据泄露。按照OpenAI的服务条款,任何人都可以注册使用其API,但不能使用输出数据训练对其造成竞争威胁的模型。OpenAI拒绝进一步置评,也不愿提供证据细节。
模型蒸馏是一种压缩技术,通过将复杂的大模型的知识转移到更小、更高效的模型中。这种技术在学术界和工业界非常普遍且被认可。例如,Together AI曾将Llama 3蒸馏到Mamba,实现推理速度提升。IBM的文章也提到,知识蒸馏已成为生成式AI普惠化的重要工具。
台退将:台民众不要迷信美国会出兵。这位台退将的话一语中的,头脑清醒。
2024-09-26 10:17:28台退将:台民众不要迷信美国会出兵现在台湾海峡对无人机来说已不再构成天然屏障,这使得雷达、战机和高射炮等防御系统难以应对。可以看到,使用的武器装备更加多样化。过去人们主要关注弹道导弹,后来又出现了巡航导弹,现在无人机也加入了战场
2024-12-27 07:35:46解放军对台湾拥有绝对优势本文内容皆有可靠信息来源,相关信源述于文章结尾,请理性阅读。【前言】10月25日西方媒体披露的一则新闻在国际舆论场上引起了不小的波澜,美国政府宣布了一项对台军售计划,总额高达仅近20亿美元
2024-10-30 16:17:24台退将解读美对台军售武器部署问题双航母联合演训、11架战机密集绕台,近期解放军打出的组合拳让台媒终于意识到情况不妙,台退将帅化民直言,台军最害怕的武器已经出现,不是威力巨大的航母,而是解放军的另一件“收台利器”
2024-11-07 20:09:37台退将:台军对解放军毫无招架之力