老黄秘密武器曝光:AI一夜设计芯片,顶人类顶级工程师10个月!_Nemo_标准单元_逻辑
新智元报道
编辑:Aeneas
【新智元导读】8人团队干10个月,AI只需一夜!英伟达祭出「造芯」神技:芯片设计效率狂飙百倍,非人类直觉的设计方案惊呆工程师。硅基生命开始自进化,人类正退居二线?进来看黄仁勋的秘密武器。
就在今天,这条消息全网刷屏了。
英伟达用AI设计GPU,原本需要8名资深工程师10个月才能完成的任务,一夜就完成了!
在刚刚过去的英伟达GTC大会上,首席科学家Bill Dally与谷歌首席科学家Jeff Dean的一场巅峰对话,揭露了令人震惊的这个事实。
现在,这个Youtube演讲已经有上万人观看,受到网友们的盛赞。
在半导体行业的历史长河中,摩尔定律曾是不可逾越的真理,但随着物理极限的逼近,研发一款旗舰GPU的复杂程度已呈指数级增长。
但现在,英伟达的AI造芯神技,几乎让人类工程师彻底退居二线了?
从「80个人月」到「一块GPU的一夜」
在传统芯片设计流程中,标准单元库(Standard Cell Library)的迁移是一项极度枯燥且耗时的重体力活。
每当台积电或三星推出新的半导体工艺(如从5nm跨越到3nm),英伟达必须将其包含约2500至3000个单元的基础库重新适配新工艺。
Bill Dally透露,过去这项任务需要一个由8名资深工程师组成的团队,连续奋斗10个月才能完成,总计耗费80个人月的人力成本。
但在AI介入后,这一切被彻底颠覆了!
现在,英伟达开发了一款基于强化学习的工具——NB-Cell。只需将需求输入系统,一块GPU在一夜之间即可完成全部迁移工作。
在这个过程中,NB-Cell通过不断的试错和自我优化,在极短时间内探索数以亿计的设计排列组合。
令人震惊的是,AI生成的单元在尺寸(Area)、功耗(Power)和延迟(Delay)等核心指标上,不仅达到了人类水平,甚至在某些案例中优于人类的手工设计。
这种「隔夜交付」的能力,意味着英伟达可以比竞争对手更早地跑通新工艺,从而在硬件竞赛中始终保持身位领先。
AI在芯片设计中的具体应用层次
逻辑重塑:Prefix RL与「非人类直觉」的布局
如果说NB-Cell解决的是重复性劳动,那么Prefix RL则展示了AI在复杂逻辑设计上的创造力。
在芯片的算术逻辑单元(ALU)中,进位前瞻链(Carry Lookahead Chain)的放置是一个研究了几十年的经典难题。
人类工程师凭借经验和直觉进行布局,往往会达到一个性能瓶颈。
但Prefix RL系统给出了一份完全不同的答案。Dally形容,AI生成的布局是「人类永远无法想到的怪异设计」。
这些设计违背了传统电子工程的审美,但在性能表现上,却比人类最优设计提升了约20%到30%。
这标志着一个转折点:AI不再仅仅是人类的助手,它正在突破人类认知的边界,去寻找那些隐藏在数百万维空间中的「最优解」。
硅基导师Chip Nemo,让初级工程师「原地升级」
在英伟达内部,人力***的错配曾是一个很大的隐痛:资深设计师往往需要花费大量时间指导新人,解释某个特定硬件模块(RTL)是如何工作的。
为了释放核心生产力,英伟达开发了内部大语言模型——Chip Nemo和Bug Nemo。
不同于市面上的通用LLM,这些模型基于英伟达数十年积累的专有架构文档、RTL代码和硬件规格进行微调。经过私有化训练,它们是「最懂英伟达GPU」的专家。
初级工程师遇到复杂的模块设计不再需要去打扰忙碌的高级工程师,而是直接询问Chip Nemo。它能像一位极具耐心的导师,条分缕析地解释GPU的工作原理。
Bug Nemo则负责汇总错误报告,自动将Bug分配给最合适的工程师或模块,极大地缩短了芯片验证这一「长跑阶段」的时间。
AI真的能完全自主「造芯」吗?
尽管效率提升了百倍,但Bill Dally在对话中依然保持了极其清醒的克制。
他明确指出,完全端到端的自动化芯片设计(即只需说一句「给我设计一个新GPU」,AI就吐出完整图纸)距离实现还有「很长的路要走」。
目前,AI扮演的角色更像是「增强设计(Augmented Design)」,而非自主造芯。
其中有三大关键限制:
高层级架构决策仍依赖人类专家。
创造性电路设计和复杂逻辑结构仍需人工主导。
设计验证仍是整个流程中最长的「长杆」,AI只能辅助加速,无法完全闭环
也就是说,框架设定的部分,比如顶层的逻辑架构、跨模块的协调以及关键的决策,依然牢牢掌握在人类手中。
另外,虽然AI可以加速验证,但最终的模拟仿真和实际实验依然必不可少,以确保芯片在物理世界中万无一失。
英伟达的实践表明,AI并非淘汰工程师,而是重构工程师的工作方式。
初级工程师需要通过Chip Nemo自主学习复杂模块的工作原理,减少对资深工程师的打断。
资深工程师能从重复性任务中解放,专注于更高价值的创新和决策。
在整体流程上,AI负责大规模搜索、优化、验证,人类负责目标设定、约束定义、创意引导。
只是一种「人类设定框架 + AI极速执行」的协同模式。
而Dally构想的未来,是一个「多智能体(Multi-agent)」模型,不同的专业AI系统处理不同的设计环节,就像现在的各职能团队一样协作。
长期目标仍是端到端自动化设计,但需要克服验证、接口协商、动态调整等难题。
目前的进展已经让英伟达能够 更快地迭代下一代硬件,成为维持摩尔定律的重要支撑。
人类工程师,还不能被替代
当8名工程师10个月的工作被一块GPU的一夜取代时,我们不得不直面一个残酷的现实:平庸的体力型工程劳动正在迅速贬值。
英伟达正在构筑一道由AI驱动的技术壁垒。当竞争对手还在通过增加人力来追赶进度时,英伟达已经进入了「AI设计AI,AI优化AI」的自循环体系。
这种效率上的降维打击,正是其能够一年一更旗舰显卡的核心密码。
对于芯片工程师而言,这既是危机也是机遇。人类正从繁琐的布线、搬运单元中解脱出来,被迫向更高层级的架构思考、更复杂的创造性决策进化。
在硅基造芯的新纪元。在这里,计算不再仅仅是芯片的目的,计算已成为芯片诞生的源头。
参考资料:
***s://***.tomshardware***/tech-industry/artificial-intelligence/nvidia-says-ai-cuts-10-month-eight-engineer-gpu-design-task-to-overnight-job-company-is-still-a-long-way-from-ai-designing-chips-without-human-input
秒追ASI返回搜狐,查看更多
同类文章排行
- 为什么 php 可以做到 7 毫秒以内响应,而 .net 做不到?
- 伊朗这次会崩溃灭亡吗?
- Swift 和同时代的其他语言比起来怎么样?
- 夸克网盘有可能超越百度网盘吗?
- H264和H265谁画质好,求回谢谢!?
- 如何使Windows上安装的Macos虚拟机流畅运行?
- 为什么新流行的开源编辑器都在用Rust开发?
- 为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云?
- 罗马仕宣布召回超 49 万台充电宝,极端场景下可能有燃烧风险,有多危险?为何有安全隐患的产品能够上市?
- 为什么美军“好像”不怕泄密?
最新资讯文章
- 只能选一个,你选谁?
- 关于尼康,大家一致认为尼康***性能拉胯。可是我有一个疑惑是,我们普通人真的需要那些***性能吗?
- 为什么战鹰近期疯狂掉粉?
- 有没有GUI框架开发难度小,***消耗又不多,而且又跨平台?
- 销量爆炸的华为nova14是不是证实华为已经腾出精力来收复中端市场了?
- 为什么 WebStorm 这么好用还会有人去用 VSCode?
- 字节跳动技术副总裁开源了自己与Trae合作的首个项目,如何评价目前AI开发的水平?
- 请问运行windows游戏,steam os和windows哪个效率高?
- HTTP/3 解决了什么问题,又引入了什么新问题?
- 想学编程,该不该买MacBook?
- 同事年过40,不想工作了,想带200万左右存款去鹤岗度余生,下场如何?
- golang和rust你选择哪个?
- 新买的移动硬盘该格式化为 NTFS 还是 exFAT?
- 老公想要买2万左右的相机,我该同意吗?
- 海洋中是否存在可以替代主粮潜力的动植物?
- 如何看待三峡集团总部搬迁至武汉?
- 为何有人说三亚景色不输泰国,中国游客却更爱去泰国?
- 网传《碟中谍 8》亏损可能超 14 亿,是真的吗?这背后的原因是什么?
- 2025年6月了,深圳房价咋样?
- 学完了 前端基础,能看懂一些代码,但是打不出来?要怎么提升?





