令人惊叹的人工智能聊天机器人 ChatGPT 在 Nvidia 超级计算机上接受训练的消息一出,刺激了股市历史上最大的单日涨幅之一。2023 年 5 月 25 日纳斯达克开盘时,英伟达的市值增加了约 2000 亿美元。
几个月前,英伟达首席执行官黄仁勋就告诉投资者,英伟达已向美国百强公司中的 50 家出售了类似的超级计算机。截至交易结束时,英伟达已成为全球第六大最有价值公司,价值超过沃尔玛和埃克森美孚的总和。至此,黄仁勋的商业地位可以与 20 世纪 40 年代末旧金山著名的探矿用品供应商塞缪尔·布兰南 (Samuel Brannan) 相媲美。
“人工智能领域正在发生一场战争,而英伟达是唯一的军火商,”一位华尔街分析师表示。
黄仁勋是一个耐心的垄断者。1993 年,他与另外两个人在加利福尼亚州圣何塞的一家 Denny's 餐厅为 Nvidia 起草了这份“文件”,并从那时起一直负责管理该“文件”。六十多岁的他爱挖苦人、自嘲,有着一张泰迪熊的脸和一头稀疏的灰白头发。英伟达的主要产品是图形处理单元,这是一种以强大的微芯片为核心的电路板。

一开始,Nvidia 将这些 GPU 出售给视频游戏玩家,但在 2006 年,黄仁勋也开始向超级计算社区推销它们。然后,在 2013 年,基于学术计算机科学界有前景的研究,黄把 Nvidia 的未来押在人工智能上。几十年来,人工智能一直让投资者感到失望,当时英伟达首席深度学习研究员布莱恩·卡坦扎罗(Bryan Catanzaro)对此表示怀疑。“我不想让他陷入人工智能行业过去遇到的同样的陷阱,”卡坦扎罗告诉我。“但是,十年后,他是对的。”
在不久的将来,人工智能预计将能够按需制作电影、为儿童提供监护以及教汽车自动驾驶。所有这些进步都将发生在 Nvidia GPU 上,黄仁勋在该公司的股份目前价值超过 400 亿美元。

9 月份,我(指代本文作者:Stephen Witt)在 Nvidia 诞生地 Denny's 餐厅与黄共进早餐。(丹尼餐厅的首席执行官向他颁发了一块牌匾,电视工作人员也到场了。) 黄始终保持着半喜剧般的面无表情的喋喋不休。在与我们的女服务员聊天时,他点了七样东西,包括超级鸟三明治和炸鸡牛排。“你知道,我曾经是这里的洗碗工,”他告诉她。“但是我很努力啊!就像,真的很难。所以我必须成为一名服务员。”
黄先生性格务实,不喜猜测,从未读过科幻小说。他从基本原理出发推论微芯片今天能做什么,然后满怀信心地赌它们明天会做什么。“我尽一切努力不让生意破产,”他在早餐时说道。“我尽我所能,以免失败。”
黄认为,数字计算的基本架构自 20 世纪 60 年代初由 IBM 推出以来几乎没有什么变化,现在正在重新概念化。“深度学习不是一种算法,”他最近说道。“深度学习是一种方法。这是一种开发软件的新方法。”
早餐前一天晚上,我观看了一段视频,其中运行这种新型软件的机器人盯着自己的手,似乎在认出它,然后对一组彩色块进行排序。这段视频让我不寒而栗。我这个物种的消亡似乎已近在眼前。黄用手指将煎饼卷在香肠上,打消了我的顾虑。“我知道它是如何运作的,所以那里什么也没有,”他说。“这与微波炉的工作原理没有什么不同。” 我向黄施压——自主机器人肯定会带来微波炉不会带来的风险。他回答说,他从来没有担心过技术,一次也没有。“它所做的只是处理数据,”他说。“还有很多其他事情需要担心。”今年五月,数百名行业领袖签署了一份声明,将人工智能失控的风险与核战争的风险等同起来。黄没有签字。
一些经济学家观察到,工业革命导致全球马匹数量相对下降,并想知道人工智能是否会对人类做同样的事情。“马的职业选择有限,”黄说。“例如,马不会打字。” 当他吃完饭后,我表达了我的担忧,即不久的将来,我会将我们谈话中的笔记输入智能引擎,然后观察它产生结构化的、优秀的散文。黄并没有排除这种可能性,但他向我保证,距离我的约翰·亨利时刻还有几年时间。“这将首先出现在小说作家身上,”他说。然后他给了女服务员一千美元小费,然后站起来接受奖励。
黄仁勋于 1963 年出生于台湾,但九岁时,他和哥哥作为无人陪伴的未成年人被送往美国。他们首先去到了华盛顿州塔科马,与叔叔住在一起,然后被送往肯塔基州的奥奈达浸信会学院。黄的叔叔认为这是一所著名的寄宿学校。事实上,这是一所宗教改革学院。黄被安排和一位十七岁的室友住在一起。他们在一起的第一个晚上,年长的男孩掀起衬衫,向黄展示他在打架中被刺伤的多处地方。“每个学生都抽烟,我想我是学校里唯一没有小刀的男孩,”黄告诉我。他的室友是文盲,黄仁勋说。作为教他读书的交换条件,“他教我如何卧推。最后我每晚睡觉前都会做一百个俯卧撑。”
虽然黄仁勋住在学校里,但他太小了,无法上学,所以他去了附近的一所公立学校。在那里,他结识了本·贝斯 (Ben Bays),本·贝斯和他的五个兄弟姐妹住在一栋没有自来水的老房子里。“学校里的大多数孩子都是烟农的孩子,”贝斯说,“或者只是生活在喊叫声中的贫困孩子。” 黄到达时,学年已经开始了,贝斯记得校长介绍了一位身材矮小的亚洲移民,长发,英语口音很重。“他是一个完美的目标,”贝斯说。
之后,黄仁勋遭到无情的欺凌。“你当时形容中国人的方式是‘中国佬’(Chinks)”黄告诉我,没有明显的情绪。“我们每天都被这样称呼。” 为了去学校,黄必须穿过河上一座摇摇晃晃的人行天桥。“这些摇摆桥非常高,”贝斯说。“那是旧木板,大部分都不见了。” 有时,当黄过桥时,当地男孩会抓住绳子,试图将他推开。“不知何故,这似乎从未影响到他,”贝斯说。“他只是摆脱了它。” 贝斯告诉我,到学年结束时,黄正带领这些孩子去森林里冒险。贝斯回忆起黄如何小心翼翼地绕过缺失的木板。“事实上,看起来他玩得很开心,”他说。
黄仁勋认为,他在奥奈达的经历增强了其韧性。“那时,没有可以交谈的辅导员,”他告诉我。“那时候,你只需要坚强起来,继续前进。” 2019年,他向学校捐赠了一栋大楼,并深情地谈论了(现已消失的)人行天桥,却没有提及那些试图把他从天桥上扔下来的恶霸。
几年后,黄仁勋的父母成功进入美国,在俄勒冈州定居,兄弟俩与他们团聚。黄在高中时成绩优异,是一名全国排名领先的乒乓球运动员。他加入了学校的数学、计算机和科学俱乐部,跳了两级,并在十六岁时毕业。“我没有女朋友,”他说。
黄先生就读于俄勒冈州立大学,主修电气工程。他在入门课程中的实验室搭档是洛里·米尔斯 (Lori Mills),她是一位认真、书呆子的本科生,有一头棕色卷发。“大约有 250 个电气工程专业的孩子,也许还有 3 个女孩,”黄仁勋告诉我。男本科生之间为了争夺米尔斯的注意力而展开竞争,黄觉得自己处于劣势。“我是班上最小的孩子,”他说。“我看起来大约十二岁。”
每个周末,黄仁勋都会打电话给米尔斯,缠着她和他一起做作业。“我试图给她留下深刻的印象——当然不是用我的外表,而是用我完成作业的强大能力,”他说。米尔斯接受了,经过六个月的功课,黄鼓起勇气约她出去约会。她也接受了这个提议。

毕业后,黄仁勋和米尔斯在硅谷找到了微芯片设计师的工作。(“她实际上赚的比我多,”黄说。)两人结婚了,几年之内米尔斯就离开了工作岗位去抚养孩子。那时,黄仁勋已经开始经营自己的部门,并晚上在斯坦福大学读研究生。他于 1993 年与两位资深微芯片设计师 Chris Malachowsky 和 Curtis Priem 共同创立了 Nvidia。尽管当时三十岁的黄仁勋比Malachowsky 和 Priem年轻,但两人都认为他已经做好了成为首席执行官的准备。“他学得很快,”Malachowsky 说。
Malachowsky 和 Priem 正在寻求设计一种图形芯片,用 Priem 的话说,他们希望这种芯片能让竞争对手“羡慕不已”。他们给自己的公司取名为 NVision,直到他们得知这个名字是由一家卫生纸制造商取的。黄建议使用 Nvidia,借鉴了拉丁词invidia,意思是“envy”。他选择丹尼餐厅作为举办业务的场所,因为这里比家里更安静,而且咖啡便宜,而且还因为他在 19 世纪 80 年代在俄勒冈州的连锁餐厅工作的经历。“我发现当我处于逆境时我的想法最好”黄说。“我的心率实际上下降了。任何在餐馆里经历过高峰时段的人都知道我在说什么。”
黄仁勋喜欢电子游戏,并认为更好的图形芯片有市场。艺术家不再用手绘制像素,而是开始用称为“基元”的形状组装三维多边形,这节省了时间和精力,但需要新的芯片。Nvidia 的竞争对手的基元使用三角形,但黄和他的联合创始人决定使用四边形。这是一个错误,它几乎让公司破产:在 Nvidia 第一个产品发布后不久,微软宣布其图形软件将仅支持三角形。
由于资金短缺,黄决定他唯一的希望是使用传统的三角方法并试图在市场上击败竞争对手。1996 年,他解雇了 Nvidia 一半以上的员工,然后将公司剩余的资金押在了未经测试的微芯片的生产上,但他不确定这些芯片是否有效。“当时是五点半,”黄仁勋告诉我,“但我们无论如何都要倒闭了。”
当这款名为riva 128 的产品上市时,Nvidia 的资金只够支付一个月的工资。但这场赌博得到了回报,Nvidia在四个月内售出了 100 万台riva 。黄鼓励他的员工怀着绝望的心情继续运送产品,在接下来的几年里,他以“我们的公司还有三十天就倒闭了”作为开场白。这句话仍然是非官方的公司座右铭。
位于圣克拉拉的英伟达总部中心有两座巨大的建筑,每座建筑都是修角后的三角形。这种形状在整个建筑内部以微缩形式复制,从沙发和地毯到小便池的防溅板。英伟达员工将这两座建筑称为“宇宙飞船”,它们是巨大的,充满了光线,但很诡异,而且大部分都是空的。新冠疫情结束后,每天只有大约三分之一的员工出现。员工的人口统计数据是“多样化的”——根据午餐时间对自助餐厅的视觉调查,我猜想,大约三分之一的员工是南亚人,三分之一是东亚人,三分之一是白人,工人绝大多数是男性。
甚至在股价上涨之前,员工调查就将英伟达列为美国最佳工作场所之一。每栋大楼的顶部都有一个酒吧,定期举办欢乐时光,并鼓励员工将办公室视为灵活的空间,供他们就餐、变成和社交。尽管如此,建筑物的内部却是完美无缺的——英伟达通过摄像机和人工智能全天跟踪员工。如果员工在会议桌上吃饭,人工智能可以在一小时内派遣清洁工进行清理。在丹尼家,黄告诉我,机器人将像家用电器一样淡出背景。“未来,所有移动的东西都将是自主的,”他说。
我在英伟达看到的唯一看起来不高兴的人是质量控制技术人员。在北校区酒吧下面没有窗户的实验室里,戴着耳塞、穿着 T 恤、脸色苍白的年轻人将 Nvidia 的微芯片推向了失败的边缘。噪音令人难以忍受,高音风扇不断发出呜呜声,试图冷却过热的硅电路,正是这些芯片使人工智能革命成为可能。
在标准计算机架构中,被称为“中央处理单元”的微芯片完成了大部分工作。程序员创建程序,这些程序将数学问题提交给 CPU,CPU 一次产生一个解决方案。几十年来,CPU 的主要制造商是英特尔,英特尔曾多次试图迫使 Nvidia 下台。“我不会接近英特尔,”黄仁勋告诉我,他描述他们的关系有点像汤姆和杰瑞。“每当他们靠近我们时,我就会拿起芯片逃跑。”
英伟达采用了另一种方法。1999 年,该公司上市后不久,推出了一款名为 GeForce 的显卡,该公司营销主管 Dan Vivoli 将其称为“图形处理单元”。(“我们发明了这个类别,因此我们可以成为该领域的领导者,”Vivoli 说。)与通用 CPU 不同,GPU 将复杂的数学任务分解为小型计算,然后以一种称为并行的方法一次性处理所有这些任务。计算。CPU 的功能就像一辆送货卡车,一次投下一个包裹;GPU 更像是遍布城市的摩托车车队。
GeForce 系列取得了成功。它的流行是由雷神之锤视频游戏系列推动的,该系列使用并行计算来渲染怪物,玩家可以用榴弹发射器射击。《雷神之锤》系列还具有多人战斗的“死亡竞赛”模式,而 PC 游戏玩家为了获得优势,购买了新的 GeForce 卡每次升级时。2000 年,斯坦福大学计算机图形学研究生 Ian Buck 将 32 块 GeForce 卡连接在一起,使用八台投影仪玩《雷神之锤》。“这是第一台 8K 分辨率的游戏设备,它占据了一整面墙,”Buck告诉我。“它过去挺美。”
Buck 想知道GeForce 卡对于除了向他的朋友发射手榴弹之外的其他任务是否有用。这些卡附带了一个称为着色器的原始编程工具。在美国国防部研究机构darpa的资助下,Buck 破解了着色器以访问下面的并行计算电路,将 GeForce 重新调整为低成本超级计算机。很快,Buck就为黄仁勋工作了。

Buck性格热情,秃顶,浑身散发着智慧。他是一名计算机科学狂热分子,在过去的 20 年里一直在测试 Nvidia 芯片的极限。人类“线性思考。你向某人指示如何从这里到达星巴克,并给他们单独的步骤,”他说。“你不会向他们提供如何从任何地方前往任何星巴克地点的说明,而且很难同时这样思考。”
自 2004 年以来,Buck 一直负责监督 Nvidia 超级计算软件包(称为cuda )的开发。Huang 的愿景是让cuda能够在每张 GeForce 卡上运行。“我们正在使超级计算民主化,”黄仁勋说。
当Buck开发该软件时,英伟达的硬件团队开始在微芯片上分配空间用于超级计算操作。这些芯片包含数十亿个电子晶体管,它们通过迷宫般的电路传输电力,以惊人的速度完成计算。Nvidia 首席芯片工程师 Arjun Prabhu 将微芯片设计与城市规划进行了比较,芯片的不同区域专用于不同的任务。正如俄罗斯方块玩家处理落下的方块一样,Prabhu有时会在睡梦中看到晶体管。“我经常会在周五晚上想到最好的想法,当时我真的在做梦,”Prabhu说。
2006 年底,当cuda首次发布时,华尔街的反应令人沮丧。黄仁勋正在把超级计算带给大众,但大众并没有表现出他们想要这样的东西。“他们在这种新的芯片架构上花了很多钱,”硅谷热门播客“Acquired”的联合主持人Ben Gilbert说。“他们花费了数十亿美元瞄准学术和科学计算的一个不起眼的角落,这在当时并不是一个大市场——当然少于他们投入的数十亿美元。” 黄认为cuda的简单存在将扩大超级计算领域。这种观点并未得到广泛认可,到 2008 年底,Nvidia 的股价已经下跌了 70%。
黄仁勋在演讲中表示,对台湾大学物理学教授邱廷伟(Ting-Wai Chiu)办公室的访问给了他这段时间的信心。为了模拟大爆炸后物质的演化,邱在他办公室附近的实验室里建造了一台自制的超级计算机。黄到达后发现实验室里到处都是 GeForce 盒子,电脑则靠振荡的台扇进行冷却。“Jenson是一位有远见的人,”邱告诉我。“他让我一生的工作成为可能。”
邱是模范顾客,但像他这样的人并不多。cuda的下载量在 2009 年达到峰值,然后连续三年下降。董事会成员担心英伟达低迷的股价将使其成为企业袭击者的目标。“我们竭尽全力保护公司免受激进股东的侵害,他们可能会介入并试图拆分公司,”长期董事会成员吉姆·盖瑟告诉我。前 NFL 营销主管道恩·哈德森 (Dawn Hudson) 于 2013 年加入董事会。“这是一家明显扁平、停滞不前的公司,”她说。
在营销cuda时,Nvidia 寻求了一系列客户,包括股票交易员、石油勘探者和分子生物学家。有一次,该公司与通用磨坊公司签署了一项协议,模拟烹饪冷冻披萨的热物理。英伟达很少花时间思考的一项应用是人工智能。好像没有太大的市场。
在二十世纪初,人工智能是一门被忽视的学科。图像识别和语音识别等基本任务的进展只是停滞不前。在这个不受欢迎的学术领域中,一个更不受欢迎的子领域使用“神经网络”(受人脑启发的计算结构)解决了问题。许多计算机科学家认为神经网络是不可信的。深度学习研究员Catanzaro告诉我:“我的顾问劝阻我研究神经网络,因为当时人们认为它们已经过时,而且不起作用。”
Catanzaro将继续研究神经网络的研究人员描述为“荒野中的先知”。其中一位预言家是多伦多大学教授杰弗里·辛顿 ( Geoffrey Hinton) 。2009年,Hinton的研究小组使用Nvidia的cuda平台来训练神经网络来识别人类语音。他对研究结果的质量感到惊讶,并于当年晚些时候的一次会议上介绍了这些结果。然后他联系了英伟达。“我发了一封电子邮件说,‘听着,我刚刚告诉一千名机器学习研究人员,他们应该去购买 Nvidia 卡。你能给我免费寄一份吗?”Hinton告诉我。“但他们说不。”
尽管受到冷落,Hinton 仍然鼓励他的学生使用cuda,其中包括他出生于乌克兰的学生Alex Krizhevsky,Hinton 认为他可能是他见过的最优秀的程序员。2012 年,Krizhevsky 和他的研究伙伴 Ilya Sutskever 在预算紧张的情况下从亚马逊购买了两张 GeForce 卡。随后,Krizhevsky开始在 Nvidia 的并行计算平台上训练视觉识别神经网络,在一周内向其提供数百万张图像。“他的卧室里有两块 GPU 板在嗡嗡作响,”Hinton 说。“其实,相当大的电费都是他父母付的。”
Sutskever 和 Krizhevsky 对这些卡的功能感到惊讶。那年早些时候,谷歌的研究人员训练了一个神经网络来识别猫的视频,这项工作需要大约一万六千个 CPU,Sutskever 和 Krizhevsky 仅用两块 Nvidia 电路板就产生了世界一流的结果。“GPU 出现了,感觉就像一个奇迹”Sutskever 告诉我。
AlexNet 是 Krizhevsky 在父母家里训练的神经网络,现在可以与莱特飞行器和爱迪生灯泡一起提及。2012 年,Krizhevsky 带领 AlexNet 参加了年度 ImageNet 视觉识别竞赛;当时神经网络还很不受欢迎,因此他是唯一使用该技术的参赛者。AlexNet 在比赛中得分如此之高,以至于组织者最初怀疑 Krizhevsky 是否作弊。“那是一种大爆炸时刻,”Hinton说。“这就是范式转变。”
自 Krizhevsky 对 AlexNet 架构的长达九页的描述发表以来的十年里,它已被引用超过十万次,使其成为计算机科学史上最重要的论文之一。(AlexNet 正确识别了摩托车、豹子和集装箱船等的照片。)Krizhevsky 开创了许多重要的编程技术,但他的主要发现是专用 GPU 训练神经网络的速度可以提高一百倍“如果没有cuda进行机器学习,那就太麻烦了,”Hinton 说。
几年之内,ImageNet 竞赛的每个参赛者都在使用神经网络。到了 20 世纪 20 年代中期,在 GPU 上训练的神经网络识别图像的准确率达到了 96%,超过了人类。黄仁勋长达十年的超级计算民主化运动取得了成功。“事实上,他们可以解决完全非结构化的计算机视觉问题,这就引出了一个问题:‘你还能教它什么?’ ”黄仁勋对我说。
答案似乎是:一切。黄总结道,神经网络将彻底改变社会,他可以使用cuda垄断必要硬件的市场。他宣布他再次押注该公司。“他在周五晚上发出了一封电子邮件,表示一切都将转向深度学习,我们不再是一家图形公司,”英伟达副总裁Greg Estes告诉我。“到周一早上,我们已经成为一家人工智能公司。从字面上看,就是这么快。”
大约在黄发送电子邮件的时候,他联系了英伟达首席人工智能研究员卡坦扎罗(Catanzaro),做了一个思想实验。“他让我想象一下,他将 Nvidia 的 8000 名员工全部带进了停车场,”卡坦扎罗说。“然后他告诉我,我可以自由地从停车场选择任何人加入我的团队。”
黄仁勋很少接受采访,并且倾向于转移人们对自己的注意力。“我真的不认为我在这里做了什么特别的事情,”他告诉我。“这主要是我的团队。” (“黄仁勋是不可替代的,”董事会成员吉姆·盖瑟告诉我。)“我不确定为什么我被选为首席执行官,”黄说。“我没有什么特别的动力。” (“他决心在三十岁时经营一家企业,”他的联合创始人Chris Malachowsky告诉我。)“我真的不是一个出色的演讲者,因为我很内向,”黄说。(“他是一位伟大的艺术家,”他的朋友Ben Bays告诉我。)“我只有一个超能力——家庭作业,”黄说。(“他可以在一个周末掌握任何科目,”英伟达软件主管德怀特·迪尔克斯说。)
黄仁勋更喜欢灵活的公司结构,没有固定的部门或层级。相反,员工每周提交一份清单,列出他们正在做的五件最重要的事情。当黄仁勋在深夜查看这些电子邮件时,我们鼓励简洁。在英伟达巨大的园区中漫步时,他经常在初级员工的办公桌前停下来,询问他们的工作情况。黄仁勋的来访可以将一间小隔间变成审讯室。“通常情况下,在硅谷,你可以捏造事实,”行业分析师Hans Mosesmann告诉我。“你不能对Jenson这么做。他会有点发脾气。”
黄仁勋每天通过写数百封电子邮件与他的员工进行沟通,通常只有几个字长。一位高管将这些电子邮件比作俳句,另一位则将其比作勒索信。黄还提出了一套他经常引用的管理格言。在安排时间时,黄仁勋要求员工考虑“光速”。这不仅仅意味着快速行动;还意味着行动迅速。相反,员工应该考虑可以想象的最快完成任务的速度,然后向后努力实现可实现的目标。他们还被鼓励去追求“零十亿美元的市场”(zero-billion-dollar market)。这是指探索性产品,比如cuda,它不仅没有竞争对手,甚至没有明显的客户。(黄仁勋有时让我想起凯文·科斯特纳在《梦想之地》中扮演的角色,他在爱荷华州的玉米地中央建造了一个棒球场,然后等待球员和球迷的到来。)
也许黄仁勋最激进的信念是“失败必须被分享”。早在 2000 世纪初,Nvidia 就推出了一款有故障的显卡,其风扇声音大且运转过度。黄仁勋没有解雇该卡的产品经理,而是安排了一次会议,经理们向数百人展示了他们做出的每一个导致惨败的决定。(英伟达还向媒体分发了一段由产品经理主演的讽刺视频,其中卡片被重新用作吹叶机。)向观众展示自己的失败已成为英伟达备受喜爱的仪式,但这种企业斗争会议并不适合每个人。“你马上就能看出谁能留在这里,谁不能留在这里,”Diercks说。“如果有人开始采取防守态度,我知道他们不会成功。”
黄仁勋的员工有时会抱怨他反复无常的性格。“这实际上是关于我的大脑中正在发生的事情与从我嘴里说出的事情,”黄仁勋告诉我。“当这种不匹配严重时,就会表现为愤怒。” 即使黄先生很平静,他的强度也可能令人难以承受。“与他互动有点像将手指插入电源插座,”一名员工说。尽管如此,英伟达的员工保留率仍然很高。负责公司消费者部门的杰夫·费舍尔 (Jeff Fisher) 是第一批员工之一。他现在非常富有,但他仍在继续工作。“目前我们中的许多人都是金融志愿者,”费舍尔说,“但我们相信我们的使命。”
黄的两个孩子在二十多岁的时候就进入了酒店业。经过多年父亲般的威吓,他们现在在英伟达找到了自己的职业生涯。Catanzaro曾一度前往另一家公司。几年后,他回来了。“Jenson不是一个一直容易相处的人,”Catanzaro说。“有时我很害怕 Jensen,但我也知道他爱我。”
AlexNet 取得成功后,风险投资家开始向人工智能领域投入巨资,该公司的马克·安德森 (Marc Andreessen ) 表示:“我们一直在投资许多初创公司,将深度学习应用到许多领域,而每一家公司都有效地建立在 Nvidia 的平台上。” Andreessen Horowitz 于 2016 年表示。大约在那个时候,Nvidia 向 OpenAI 的一个研究小组交付了第一台专用 AI 超级计算机 DGX-1。黄亲自把电脑带到了 OpenAI 的办公室;时任董事长埃隆·马斯克用美工刀打开了包装。
2017 年,谷歌的研究人员推出了一种新的神经网络训练架构,称为 Transformer。第二年,OpenAI 的研究人员使用 Google 的框架构建了第一个“generative pre-trained transformer”(GPT)。GPT 模型在 Nvidia 超级计算机上进行训练,吸收大量文本并学习如何建立类似人类的连接。2022 年末,经过多个版本后,ChatGPT 向公众发布。
从那时起,英伟达就被客户的需求淹没了。该公司最新的人工智能训练模块 DGX H100 是一个重达 370 磅的金属盒子,售价可能高达 50 万美元。目前该产品已延期交货数月。DGX H100 的运行速度是训练 ChatGPT 的硬件的五倍,并且可以在不到一分钟的时间内训练 AlexNet。Nvidia 预计到今年年底将售出 50 万台该设备。
神经网络的处理能力越强,其输出就越复杂。对于最先进的 AI 模型,Nvidia 销售数十个 DGX H100 的机架。如果这还不够,英伟达将像图书馆堆栈一样排列这些计算机,用价值数千万美元的超级计算设备填充数据中心。人工智能的能力没有明显的限制。“如果你让自己相信人工神经元就像生物神经元,那么就像你在训练大脑一样,”Sutskever告诉我。“他们应该做我们能做的一切。” 我最初对Sutskever的说法持怀疑态度——我没有学会通过查看一千万张参考图像来识别猫,我也没有通过扫描人类的完整作品来学会写作。但化石记录表明,神经系统在几亿年前就首次发育出来,并且从那时起就变得越来越复杂。Catanzaro说:“很长一段时间以来,地球上有很多生物,它们学会了很多东西,其中很多都记录在你大脑的物理结构中。”
最新的人工智能拥有连其创造者都感到惊讶的力量,但没有人完全知道它们的能力是什么。(GPT-4,ChatGPT 的后继者,可以将餐巾纸上的草图转变为一个正常运行的网站,并且在 LSAT 中得分达到了百分之八十八。)在接下来的几年中,Nvidia 的硬件将加速进化到一个计算机时钟周期,将训练各种类似的人工智能模型。有些人将管理投资组合;有些会驾驶无人机。有些人会窃取你的肖像并复制它;有些人会模仿死者的声音。有些将充当自主机器人的大脑;有些将充当自主机器人的大脑。有些将创造基因定制药物。有些人会写音乐;有些人会写音乐;有些人会写音乐。有些人会写诗。如果我们不小心,很快有一天,有人会比我们更聪明。
英伟达设备的毛利率接近百分之七十。这个比例就像密友吸引鲨鱼(chum attracts sharks)一样吸引竞争。谷歌和特斯拉以及众多初创公司正在开发人工智能训练硬件。Cerebras 就是其中一家初创公司,该公司生产餐盘大小的“巨型芯片”。“他们只是在勒索客户,只是没有人会大声说出来,”Cerebras 的首席执行官安德鲁·费尔德曼 (Andrew Feldman) 谈到 Nvidia 时说道。(黄反驳说,训练有素的人工智能模型可以减少客户在其他业务领域的开销。“你买的越多,节省的就越多”他说。)
英伟达最激烈的竞争对手是Advanced Micro Devices。自 2014 年以来,AMD 一直由另一位年轻时从台湾移民到美国的天才工程师Lisa Su负责。苏姿丰掌门后的几年里,AMD的股价上涨了三十倍,使她成为仅次于黄的这个时代最成功的半导体CEO。值得一提的是,苏也是黄的远房表亲。
黄仁勋告诉我,他从小不认识苏。他是在她被任命为首席执行官后才认识她的。“她非常棒,”他说。“我们的竞争力不是很强。” (Nvidia的员工可以凭记忆背出Nvidia和AMD显卡的相对市场份额。) 他们的性格不同:苏内向、坚忍;苏是个内向、坚忍的人。黄有气质,善于表达。“她有一张扑克脸,”行业分析师Mosesmann说。“Jenson没有,尽管他仍然能找到击败你的方法。”
苏喜欢跟踪现任者,等待其动摇。与黄不同的是,她并不害怕与英特尔竞争,而且在过去十年中,AMD 占领了英特尔 CPU 业务的很大一部分,分析师曾认为这是不可能的壮举。最近,苏将目光转向了人工智能市场。“詹森不想输。他是一个有进取心的人,”负责监督 AMD 工作的高管福雷斯特·诺罗德 (Forrest Norrod) 说道。“但我们认为我们可以与英伟达竞争。”
9月一个阴沉的周五下午,我开车前往俯瞰太平洋的一家高档度假村,观看黄仁勋接受 Nvidia 总部首席建筑师柯浩 (Hao Ko) 的公开采访。我很早就到了,发现两个人面朝大海,正在安静地交谈。他们的穿着几乎一模一样,都是黑色皮夹克、黑色牛仔裤和黑色鞋子,尽管Ko要高得多。我希望听到一些关于计算未来的坦率陈述;相反,我对Ko的衣柜进行了六分钟的审视。“看看这个家伙!” 黄说。“他的穿着和我一样。他在模仿我——这很聪明——只是他的裤子口袋太多了。” Ko紧张地笑了笑,低头看了看他的名牌牛仔裤,它的拉链口袋确实比功能严格要求的多了几个。“简单点,伙计!” 黄说道,然后转向我。“这就是为什么他穿得像我一样。我教了这个人他所知道的一切。” (黄的着装被广泛模仿,今年早些时候,他还登上了《泰晤士报》的时尚版块。)
此次采访由全球领先的企业设计公司之一 Gensler 赞助,有数百位建筑师参加。随着活动的临近,黄仁勋增加了他的表演强度,讲了一系列弱笑话,并前后摇晃着双脚。黄仁勋每年会进行数十场演讲,并在当天早些时候向不同的观众发表演讲,但我意识到他很紧张。“我讨厌公开演讲,”他说。
但在舞台上,他显得轻松而自信。他解释说,总部起伏的屋顶上的天窗的位置可以照亮建筑物,同时阻挡阳光直射。为了计算设计,Huang 将 Ko 绑在虚拟现实耳机上,然后将耳机连接到 Nvidia GPU 机架上,以便 Ko 可以跟踪光流。“这是世界上第一座需要超级计算机才能建成的建筑,”黄仁勋说。
采访结束后,黄回答了观众的问题,其中包括关于人工智能潜在风险的问题“有一种末日人工智能——这种人工智能以某种方式跳出计算机,消耗大量信息并自行学习,重塑其态度和感性,并开始自己做决定,包括按下各种按钮。”黄说,在空中做了按下按钮的动作。房间变得非常安静。“没有人类参与,任何人工智能都不应该能够学习,”他说。一位建筑师问人工智能什么时候可以开始自己解决问题。“推理能力还需要两到三年的时间,”黄说。人群中响起一阵低沉的议论声。
后来,我追上了Ko。就像黄的许多笑话一样,教Ko“他所知道的一切”的笑话包含了一个尖锐的事实。当黄绕过 Ko 的老板,选择 Ko 担任 Nvidia 总部设计师时,Ko 还没有成为 Gensler 的合伙人。我问Ko为什么黄这样做。“你可能听说过故事,”Ko说。“他可能非常强硬,他会给你灌输他的想法。” 黄没有建筑经验,但他经常告诉Ko,他对建筑设计的看法是错误的。“我想说百分之九十的建筑师都会反击,”柯说。“我更像是一个倾听者。”
Ko 回忆起黄在 VR 耳机的速度上向 Nvidia 的工程人员发起挑战。该耳机最初花了五个小时来渲染设计变更;在黄的敦促下,工程师们把速度降低到了十秒。“他对他们很严厉,但这是有道理的,”高说。“如果耳机需要五个小时,我可能会选择看起来合适的绿色色调。如果需要十秒钟,我会花时间挑选最好的绿色阴影。”
这些建筑的设计赢得了多个奖项,并为Ko的事业奠定了基础。尽管如此,Ko 仍怀着复杂的心情回忆起他参与该项目的时光。“这个地方已经完工了,看起来棒极了,我们正在参观,他正在向我询问喷泉的位置,”Ko 说。“他很沮丧,因为它们就在浴室旁边!这是代码所要求的,而这是一座价值十亿美元的建筑!但他就是放不下。”
“我永远不会满足,”黄告诉我。“不管是什么,我只看到不完美的地方。”
我问黄仁勋,他今天的赌博是否与二十年前的赌博相似。他立即回应了一个词:“Omniverse” 受到 VR 架构策略的启发,Omniverse 是 Nvidia 尝试以非凡的细粒度细节模拟现实世界的尝试。黄将其描述为“工业虚拟宇宙”。
自 2018 年以来,Nvidia 的显卡都采用了“光线追踪”功能,它可以模拟光线从物体反射的方式,从而创造出逼真的效果。在英伟达高管会议中心的一个三角形毛玻璃内,一位产品演示专家向我展示了一家闪闪发光的日本拉面店的三维渲染图。当演示循环通过不同的视角时,光线从金属柜台反射出来,蒸汽从冒泡的汤锅中升起。没有任何迹象表明这不是真的。
然后专家向我展示了“Diane”,一个会说五种语言的超现实数字化身。强大的生成人工智能研究了数以百万计的人的视频,以创建一个复合实体。影响最大的是她的缺陷——Diane鼻子上有黑头,上唇上有细小的毛发。Diane不是真正的人类的唯一线索是她眼白中闪烁着不可思议的光芒。“我们正在努力解决这个问题,”专家说。
黄仁勋的愿景是将 Nvidia 的计算机图形研究与其生成人工智能研究结合起来。在他看来,图像生成人工智能很快就会变得如此复杂,以至于它们将能够渲染三维的、可居住的世界,并在其中填充看起来逼真的人。与此同时,语言处理人工智能将能够立即解释语音命令。(“未来的编程语言将是‘人类’,”黄说。)一旦这些技术与光线追踪相结合,用户将能够用语言表达整个宇宙的存在。黄仁勋希望利用我们自己世界的这种“数字孪生”来安全地训练机器人和自动驾驶汽车。与 VR 技术相结合,Omniverse 还可以让用户生活在定制的现实中。
离开产品演示时我感到头晕。我想到了科幻小说;我想到了创世记。我坐在一张边角修整过的三角形沙发上,努力想象我女儿将居住的未来。
英伟达的高管正在建设计算机科学的曼哈顿计划,但当我向他们询问创造超人智能是否明智时,他们看着我,就好像我在质疑洗衣机的实用性一样。我曾大声地想知道人工智能是否有一天会杀人。“呃,电每年都会导致人员死亡,”Catanzaro 说。我想知道这是否会消除艺术。“这会让艺术变得更好!” Diercks说道。“这会让你的工作做得更好。” 我想知道人工智能是否会在不久的将来变得具有自我意识。“为了成为一个生物,你必须有意识。你总得有点自我认识吧?” 黄说。“我不知道这会发生在哪里。”
评论留言