当前位置:当前位置: 首页 >
如何评价面壁新发布的端侧模型 MiniCPM-4,该模型有哪些技术亮点?
文章出处:网络 浏览次数:发表时间:2025-06-18 00:50:11
最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。
同类文章排行
- 同样是透析,有的透析三年就走了,有的十年20年还好好的,为什么?
- 手机的运行内存真的有必要上16GB吗?
- 特朗普发文要求伊朗无条件投降,并被曝考虑加入对伊空袭,有哪些目的?伊朗会弃核求生吗?
- 为什么有的人一看就是老实人?
- 男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
- 中国的电动汽车是不是发展错方向了?
- 消息称苹果 macOS 26 将不再支持部分旧款英特尔 CPU 机型,这背后原因有哪些?
- 中国军事力量在亚洲能排第一吗?
- 你发生过的最尴尬的事是什么?
- PHP初学者,我能不能使用PHP来开发桌面应用?
最新资讯文章
- 为什么这次以色列打伊朗,网上声讨的人少了,反而都是嘲笑调侃伊朗?
- 你和你老婆是怎么认识的?
- Node.js是谁发明的?
- Flutter 为什么没有一款好用的UI框架?
- 如何评价熊狼狗的《没钱修什么仙?》?
- 谷歌云服务宕机导致 OpenAI、Shopify 等服务中断,此次宕机的具体技术原因是什么?
- 30岁了,你在深圳过着什么样的生活?
- 为什么买了Switch后,却发现它并没有那么好玩?
- 有一个乌克兰的朋友问我,中国人凭什么能享受和平,我该怎么说?
- 网传厦门某国企研发部门要求每日考察后端 400 行,前端 1000 行代码量,如属实,这个考核合理吗?
- 台州和温州,那一座城市潜力大?
- 据报道称“浏览器内核有上千万行代码”,浏览器内核真的很复杂吗?
- 有无爽文推荐看着很爽的?
- 如何看待多地推出升级版「禁酒令」?
- 在NAS上安装了什么应用,让你的生活体验有了巨大的提升?
- 使用J***a开发简单CAD软件?
- 为什么各大 *** 出奇一致地设置了『摇一摇开屏广告』?如何关闭常用 *** 的这些广告?
- 使用J***a开发简单CAD软件?
- Grafana 与 Kibana 有什么区别,Kibana 能做的事情 Grafana 是否也都能做?
- 微信头像会影响第一印象吗?





