4月28日上午,DeepSeek多模态团队研究员陈小康在X账号@PKUCXK上发布了一条推文:“Soon, we see you. ?”,配图是两只蓝色的小鲸鱼,左边那只戴着画有“XX”的黑色眼罩,右边那只没戴眼罩、正常露出眼睛。尽管这条推文很快被删除,但可能暗示DeepSeek的多模态功能即将上线。
此外,有用户截图显示,chat.deepseek.com输入框上方曾出现过三个并列的标签——除了原有的“快速模式”和“专家模式”,还多出了一个“识图模式”,鼠标悬停后提示“图片理解功能内测中”。这是DeepSeek出圈以来第一次在主线产品里把视觉理解作为独立模式呈现。不过这个标签并不是所有用户都能看到,目前也无法确认它是常态化的灰度内测还是短暂开放后又被回收,官方至今没有对外说明。
根据该用户的测试信息,在试图模式里,用户上传了一张人物照片并提问“这是什么动作姿势”。DeepSeek思考8秒后,先按位置、手臂、头部、头发、着装、光影逐项拆解了画面,再给出最终判断:这是摄影和社交媒体语境里的“慵懒风躺姿”或“清冷氛围感姿势”,常出现在小红书、抖音的“宅家”、“慵懒风”、“清冷感”等标签下。值得注意的是,这段思考过程中有一步明确的“自我修正考虑”,模型先列出其他可能的解读,再判断“慵懒氛围感姿势”是最能涵盖所有细节的描述,最后输出。这种结构化拆解、自我复核加文化语境识别的组合,已经超出DeepSeek过去主线产品上的“图片识文字”能力层次。
V2EX网友MichaelBitzo 4月29日下午发帖称DeepSeek API已经返回“识图模式”字段,但其他用户实测反馈仍不可用。这意味着接口侧的字段已经存在,但调用尚未对外开放。
DeepSeek正在进行一项名为“识图模式”的灰度测试。这项新功能与现有的“快速模式”和“专家模式”并列,具备多模态识别能力,而不仅仅是OCR文字识别
2026-04-30 08:25:15DeepSeek灰测识图模式技术人员的新闻圈「极客头条」来啦,快来看看今天值得关注的重要新闻。DeepSeek 计划融资 500 亿人民币,创始人兼 CEO 梁文锋个人出资 200 亿
2026-05-09 13:51:53DeepSeek正式跨入图文交互时代4月8日,DeepSeek上线了专家模式。在最新版本中,DeepSeek输入框上方新增了“快速模式”与“专家模式”,这是自DeepSeek走红以来首次在产品端引入模式分层设计
2026-04-08 11:45:16DeepSeek上线专家模式