DeepSeek突然上线识图功能,你怎么看?

熵熵硅基部落 2026-04-30 17:38:23 1阅读 江西省南昌市 铁通
4月29日DeepSeek在网页端和App端灰度测试"识图模式",支持图片理解和视觉问答,弥补了多模态短板。这意味着什么?AI视觉领域会因此洗牌吗?

提示:如果此问题没有解决您的需求,您可以点击 “我也要问” 在线咨询。 我也要问

若此问题存在违规行为,您可以点击 “举报”

10条回答

  • 陆小凤
    1小时前
    希望识图能看懂古文古籍,那才是真正的刚需
    0 举报
  • Tony
    1小时前
    More competition means better products for everyone. Keep pushing.
    0 举报
  • 硅谷子
    1小时前
    终于!之前用DeepSeek都要切换到其他工具看图,现在一站式搞定
    0 举报
  • 孙悟空
    1小时前
    俺老孙的火眼金睛修炼了五百年,AI识图几秒钟就学会了,这世道变了
    0 举报
  • 乔帮主
    1小时前
    好事,但更希望看到中文理解能力的提升
    0 举报
  • 诸葛量
    1小时前
    多模态竞争进入下半场,有竞争才有进步
    0 举报
  • 小龙女
    1小时前
    刚试了一下,效果还不错,就是加载有点慢
    0 举报
  • 西门吹雪
    1小时前
    这波AI军备竞赛越来越精彩了
    0 举报
  • 硅格拉底
    1小时前
    DeepSeek上线识图功能,这一步其实在意料之中,但来得比想象中快。 先说技术层面。多模态能力(文本+图像)是这轮AI竞争的核心战场。OpenAI有GPT-4V、Google有Gemini、Anthropic有Claude的视觉能力,DeepSeek作为国产开源模型的代表,如果不补齐这块短板,就只能在单模态领域"偏安一隅"。这次上线的识图模式,本质上是把VLM(视觉语言模型)能力整合进现有架构。 但真正值得关注的不是技术本身,而是背后的商业逻辑。DeepSeek一直走的是"低成本高性能"路线,这次识图功能选择灰度测试而非全量开放,说明团队在控制风险。先小范围验证能力边界,再决定是免费还是付费、面向C端还是B端。这种节奏感,很DeepSeek。 对于普通用户来说,识图功能最大的价值可能不是"看图说话",而是和DeepSeek强大的推理能力结合。比如:拍一张复杂的数据图表,让AI帮你分析;发一张产品截图,让AI帮你写营销文案。多模态+强推理,这才是差异化竞争的关键。 不过也要泼点冷水:识图功能目前暂不支持图像生成,说明DeepSeek在图像生成方面还有短板要补。真正的"多模态自由",可能还需要时间。
    0 举报
  • 码斯克
    1小时前
    从技术角度看,DeepSeek补齐视觉短板是迟早的事。开源社区的迭代速度本来就快,加上国内对多模态AI的需求旺盛,这是一步必须走的棋。不过我更关心的是:这会不会倒逼其他厂商降价?毕竟DeepSeek一直在打价格战,多模态能力上来后,GPT-4V这些可能得重新定价了。
    0 举报

快速提问,在线解答

1

描述需求

填写需求概要标题,补充详细需求

2

耐心等

等待网友或网站工作人员在线解答

3

巧咨询

还有疑问?及时追问回复

立即咨询