DeepSeek灰测识图模式 多模态识别新突破!DeepSeek正在进行一项名为“识图模式”的灰度测试。这项新功能与现有的“快速模式”和“专家模式”并列,具备多模态识别能力,而不仅仅是OCR文字识别。部分用户已尝试上传食品包装、概念手机图片等,系统能够准确识别品牌、成分以及设计特征,并提供实用建议。
DeepSeek多模态团队研究员陈小康在X平台上发布了一条动态,配文“Now, we see you”,并附上一张鲸鱼摘下眼罩的图片,被广泛认为是官方确认多模态功能上线的信号。有用户晒出的图片显示,灰度到的用户可以上传图片让DeepSeek描述内容。一些用户反馈称,处理速度很快,但也有用户表示触发了识图模式界面后却收到“识图模式暂不可用,请稍后再试”的提示。
测试结果显示,该模型会分步骤输出:首先分析用户需求,然后检查图像,最后生成解读结果。这项功能基于多模态技术,即视觉与语言的融合,使AI能够理解图片中的语义和逻辑关系。据技术爆料,其底层可能采用了DeepSeek—OCR2的视觉因果流机制,从而实现对复杂图表和文档的理解更加准确。
目前,这一功能仍处于小范围灰度测试阶段,尚未全面开放,未被灰度到的用户暂时无法使用。关于API是否同步开放,官方尚未公布具体信息。
技术人员的新闻圈「极客头条」来啦,快来看看今天值得关注的重要新闻。DeepSeek 计划融资 500 亿人民币,创始人兼 CEO 梁文锋个人出资 200 亿
2026-05-09 13:51:53DeepSeek正式跨入图文交互时代