马斯克惊呼太强了!国产0.8B模型开源,网友:已在iPhone上摩拳擦掌_Qwen_版本_运行
智东西
作者 | 李水青
编辑 | 心缘
智东西3月3日报道,昨日晚间,阿里开源4款Qwen3.5小尺寸模型系列:Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B,可部署于笔记本电脑等端侧设备。
▲Qwen3.5社交平台X推文部分截图
模型一发布,不仅开发者圈讨论热烈,连马斯克也空降Qwen社交平台X推文下的评论区,他评价:“令人惊叹的智能密度。”自家Grok4.2发布在即,马斯克对中国大模型同行的关注度不减。
▲埃隆·马斯克在推文下的评论
在指令跟随、多语言、视觉推理等多项基准评测中,Qwen3.5-9B在GPQA Diamond、MMMU-Pro、ERQA、Video-MME等多项评测中拔得头筹,大幅领先GPT-OSS-20B、GPT-5 nano、Gemini 2.5 Flash-Lite以及自家的Qwen3-Next-80B-A3B-Thinking、Qwen3-30B-A3B-2507。
作为小型模型,Qwen3.5-4B的表现已接近Qwen3.5-9B,在多语言知识、视觉推理、文档理解等任务上媲美更大模型,在纯数学推理方面仍有差距,这也是小版本模型的普遍问题。
▲Qwen3.5-9B和Qwen3.5-4B的测评情况
这些小型模型均基于Qwen3.5统一基座,Apache 2.0开源可商用,支持LoRA/全量微调,消费级显卡即可启动任务适配。具体来看:
0.8B/2B版本具备小巧、快速的特点,是端侧首选。这两个模型非常适合移动设备、IoT 边缘设备部署,以及低延时的实时交互场景。
4B版本性能更强劲,具备多模态基座模型。该版本适合作为轻量级智能体的核心大脑,平衡性能与***消耗。
9B版本模型结构紧凑,但性能媲美gpt-oss-120B,适合需要较高智力水平但受限显存***的服务器端部署,是性价比极高的通用模型选择。
目前所有模型均已在魔搭社区和Hugging Face开源,同时小尺寸模型的基座模型也已开源。
自2月中旬Qwen3.5模型正式推出之后,不少海内外开发者一直“催更”小规模版本Qwen3.5。而随着今天小版本模型终于面世,开发者们也立即参与讨论并体验起来。
一位开发者称:“9B在MMMU-Pro测试中以13分的优势击败GPT-5-Nano才是真正的亮点。一个可以在笔记本电脑上运行的模型,性能却超越了云端旗舰级的Nano模型,架构优势远胜于参数数量。”
▲社交平台X网友评论
另一位开发者称:“这比人们想象的要强大得多。一台运行在Mac mini 上的Qwen 3.5加上24hx7全天候运行的OpenClaw,就能打造出一个成本不到一个月初级员工工资的AI员工。”
还有开发者分享,他使用AMD Ryzen AI Max+395处理器和 Q4_K_XL量化算法,并开启完整的256k上下文窗口,处理速度达到了约30个token/s。而且它只需要不到16GB的显存。对此他惊叹:“我的天!Qwen3.5-9B 的体积虽小,但性能却非常强劲:多语言处理能力出色,通用知识储备丰富,视觉输入处理能力也很强。”
▲社交平台X网友评论
值得一提的是,有网友称Qwen 3.5不仅可在任何笔记本电脑上运行,它还能在手机上运行。此话一出,不少人追问:“如何在iPhone上运行?”
▲社交平台X网友评论
不过也有开发者直截了当地说:“4B模型只是一个智能自动补全工具,而不是一个思考伙伴。GPQA Diamond(研究生水平推理)的正确率约为45%,HMMT数学测试的正确率约为15%。这意味着它在难题上超过一半的概率都会出错。”
▲社交平台X网友评论
小型模型的能力固然有限,但其在特定能力维度评测上已达到Gemini 3 Flash等云端部署模型的水平,这意味着其已经能在很多端边侧场景发挥实际效用。
至此,Qwen3.5家族已开源:
1个大尺寸模型:Qwen3.5-3***B-A17B
3个中型尺寸模型:Qwen3.5-122-A10B、Qwen3.5-35B-A3B、Qwen3.5-27B
4个小尺寸模型:Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B、Qwen3.5-9B
Hugging Face地址:
***s://huggingface.co/collections/Qwen/qwen35
魔搭社区地址:
***s://modelscope.cn/collections/Qwen/Qwen35
附Qwen3.5-9B和Qwen3.5-4B完整测评成绩:
返回搜狐,查看更多
同类文章排行
- 国内大厂现在用rust的多吗?
- ros路由系统相比openwrt系统有什么优势?
- 编程语言 MoonBit 发布 Beta 版,正式进入企业场景应用,会带来哪些影响?
- Anthropic 推出的 Claude Code Agent 有哪些亮点值得关注?
- 如何评价vue作者尤雨溪?
- 都是前端框架,为什么用 React 的人会有优越感?
- 华为Pura 80首销遇冷,是否说明消费者已经开始对麒麟芯片性能有所觉醒?
- 如何看待华为Pura80标准版手机接口竟倒退成USB 2.0?要是也烧了WIFI是不是不好备份数据?
- 你最满意的10款 PC 软件是什么?
- 老公想买3w的电脑玩游戏怎么劝说?
最新资讯文章
- 美国B2轰炸机从关岛轰炸伊朗是走的什么路线?
- 为什么 php 可以做到 7 毫秒以内响应,而 .net 做不到?
- 全平台应用框架会是趋势吗?flutter、tauri、maui你更看好哪一个?
- 现今大部分哺乳动物都是六千万年前恐龙灭绝后的同一种哺乳动物的后代吗?
- 为什么有的女生喜欢穿紧身牛仔裤?
- 女生真正的完美身材是什么样子?
- 有一个***约你出去,你会去吗?
- 为什么一谈到Wi-Fi想支持6GHz,总有人说那你可以去国外?
- 雷军为什么不愿意用性价比打法进军NAS?
- 为啥 AMD 的 ROCm 没有被广泛使用,Nvidia 的 CUDA 一家独大?
- 我的世界怎么租一个四个人的服务器?
- 学生校服如何隐藏内衣痕迹?
- 日本真的有些澡堂和温泉是不分男女的吗?有人去过不分男女的那种吗?
- 为什么面对 Adobe 的版权要求下,vposy 大神还能从容不迫?
- 如何说服技术老大用redis?
- 如何高效将 HTML 内容转换成卡片形式?
- 小区不让外卖员骑车进来,只能走进来,每次点外卖,很多人都不接单,我该怎么办?
- 当初中俄为什么不摧毁朝鲜的核设施,让朝鲜拥有了自己的核武器?
- sql in 条件超过 1000 怎么办?
- 在韩国生活有什么体验?





