DeepSeek宣布在开源周第三天开源了DeepGEMM。这是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,具备细粒度缩放功能。DeepGEMM支持普通和混合专家(MoE)分组的GEMM,采用CUDA编写,在安装过程中无需编译,而是通过轻量级的即时编译(JIT)模块在运行时编译所有内核。该库为V3/R1训练和推理提供了支持。
北京时间2月27日10点5分,DeepSeek发布了其“开源周”第四日的内容,包括优化的并行策略
2025-02-27 14:05:06DeepSeek宣布开源优化并行策略每经AI快讯,2月28日,DeepSeek开源周第五天,DeepSeek在官方X账号宣布开源3FS,它是所有Deepseek数据访问的助推器
2025-02-28 11:52:14DeepSeek开源周第五天吉利与阶跃星辰合作研发的两款多模态大模型已正式开源。这两款模型分别是开源视频生成模型Step-Video-T2V和业内首款产品级开源语音交互大模型Step-Audio
2025-02-19 08:09:19DeepSeek后又一大模型向全球开源DeepSeek发布了新一代开源大模型DeepSeek-R1。该模型在数学、代码、自然语言推理等任务上的性能与美国OpenAI公司的最新o1大模型相当
2025-01-21 22:05:22DeepSeek又有重大突破