DeepSeek终于能看图了!我第一时间用它算命_模式_视觉_能力
智东西
作者 | 陈骏达
编辑 | 云鹏
智东西4月29日报道,刚刚,DeepSeek的多模态能力已经开启灰度测试。现在,被选中的用户会发现,DeepSeek首页多了一个“识图模式”的入口。上传图片后,DeepSeek能像人一样理解画面,不管是物体还是场景,而不是像过去仅能识别文字。
多位DeepSeek研究员第一时间发文宣传了这一新功能。DeepSeek研究员陈德里称,这一功能来自DeepSeek的“天才多模态同事们”,小鲸鱼现在有了看见世界的能力。
▲DeepSeek多位研究员宣布识图模式的灰度上线(图源:X平台)
我们也有幸被灰度到了,并迅速进行了一波测试。
首先是基本的识物能力,我们上传了一张兔子的照片,识图模式下DeepSeek一眼就判断出兔子的品种,并且可以描述这只兔子的姿态。
我们给DeepSeek上了点难度,上传了一张来自它老家杭州知名景点灵隐寺的照片,图中仅有右下角的路灯上有草书写就的“灵隐寺”字样,不过对人类来说这些字样也有点难懂。我们要求DeepSeek判断这是哪里,并报出图城市的经纬度。
根据建筑风格和路灯上的字样,DeepSeek很快判断出这里是灵隐寺,给出的坐标准确无误。其生成速度也很快,未开启思考模式时,一眨眼的功夫就好了。
我们又上传了一张包含视觉陷阱的图片,这张图中几个物品的摆放很容易让人误以为图中有个人坐在椅子上。
这样的题目同样没能难倒DeepSeek,它判断图中有墙面修补痕迹、垃圾收集区、杂物等等,没有被视觉陷阱蒙骗。
DeepSeek的视觉模式支持深度思考,我们上传了一张随手拍的照片,图中没有任何文字参考,看看DeepSeek能否根据蛛丝马迹判断出位置。
开启推理后,DeepSeek的视觉能力明显增强了。它可以分步骤拆解画面信息,能看到前景、中景、背景的所有信息,然后将地标特征与地理区域匹配,直接判断出山脉是燕山山脉、建筑风格在北京昌平等郊区很常见。
最后它直接把范围收窄到北京昌平区或者海淀山后地区,其中某些猜测选项离我的实际距离已经不到10公里。未来如果接入联网搜索,DeepSeek很可能就顺着网线把我家地址给开盒了。
我们还尝试了热门的看手相玩法,上传后,DeepSeek第一眼先把左右手看错了,我们上传的图片是左手,它判断成了右手。
进入实际分析后,DeepSeek对手相形态的描述基本符合事实,分析得也是头头是道,不过具体该相信多少,这就见仁见智了。
结语:DeepSeek多模态拼图,终于补齐
在过去很长一段时间里,DeepSeek多模态能力的缺失一直是一个遗憾。DeepSeek一直维持着多模态的相关研究,并曾在早期发布开源多模态模型Janus等成果。不过,DeepSeek一直未在其产品中向公众提供多模态能力。
AI走向多模态已经成为不可逆转的大趋势。多模态内容所蕴藏的丰富信息可以扩展AI认知这一世界的触角,也更贴近人类本身理解世界的方式。目前,DeepSeek的识图模式还只是一个测试功能,不过它已经让我们看到了其在视觉解析与跨模态推理上的潜力。返回搜狐,查看更多
同类文章排行
- 怎么看待“爸妈也是第一次当父母”这句话?
- 微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?
- 如何看待伊朗国家电视台发文:“今晚,将会发生一件大事,让世界铭记几个世纪。”?
- 鸿蒙电脑会在国内逐渐取代windows电脑吗?
- 以色列摩萨德这么厉害,中国网民为何不害怕?
- 为什么在中国,一间「看起来没什么用」的房间最终都会被装修成书房?
- 如何评价林志玲?
- 你的低成本爱好是什么?
- 网传厦门某国企研发部门要求每日考察后端 400 行,前端 1000 行代码量,如属实,这个考核合理吗?
- 为什么有人打羽毛球会放水?
最新资讯文章
- 明星为什么不低价办演唱会?
- 你见过身边身材最好的女生是什么样子的?
- 李梦被女篮主教练宫鲁鸣官宣弃用,争议很大,怎么看待?
- 为什么全国人民都知道武汉的交通很差,但是武汉人不知道?
- 电影《碟中谍》系列中哪一部最好?
- ***《凡人修仙传》有哪些令人伤感的情节?
- 中年夫妻的婚姻状态是什么样的?
- 有哪些开源web应用漏洞扫描工具?
- 为什么浙江落下的陨石,防空系统没有拦截,它和导弹有什么不同?
- 有没有什么软件是适合老师出题考试用的?
- 鱼缸有哪些寿命比较长的草推荐呢?
- go 有哪些成熟点的后台管理框架?
- 如何看待杨笠2025年6月成都专场取消?
- PHP初学者,我能不能使用PHP来开发桌面应用?
- 为什么Dreamwe***er,FrontPage会被淘汰?
- 为什么腾讯云或者阿里云不让自建dns服务器?
- 如果你是《一帘幽梦》里的绿萍,你会不会最后原谅紫菱?
- 中国的核武库规模为什么那么小?
- 为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云?
- cloudflare的1.1.1.1和warp有什么区别?





