大约花了 25 年时间,硅谷终于又回到了老派的硅谷。
英伟达公司(Nvidia Corp.)完全主导了人工智能软件芯片市场,其他公司也决定愿意采取设计自己的半导体的做法,这种做法往往是灾难性的。
历史告诉我们,从头开始设计一款芯片需要数年时间,耗资数亿美元,而且通常会以失败告终。然而人工智能的前景是如此巨大,以至于人们决定必须尝试一下。
其中两个勇敢的灵魂是迈克·冈特和雷纳·波普。他们成立了一家名为MatX 的公司,其目标是设计专门用于处理大型语言模型所需数据的芯片。如果你在过去的一年半里一直躲在地堡里, LLM 是OpenAI Inc.的 ChatGPT 和 Google 的 Gemini等技术的基础,它们需要大量非常昂贵的芯片才能运行。
如果一家公司能够制造出更便宜、更快、人工智能友好的芯片,那么它将在人工智能软件不断扩展的世界中表现出色。

Gunter 和 Pope 此前曾在Alphabet Inc.旗下的谷歌工作,Gunter 专注于设计运行 AI 软件的硬件(包括芯片),而 Pope 自己编写 AI 软件。谷歌多年来一直在打造自己的人工智能芯片,称为张量处理单元。不过,MatX 高管表示,这些芯片是在法学硕士真正开始起飞之前首次设计的,对于当前手头的任务来说过于通用。“我们试图让大型语言模型在谷歌运行得更快,并取得了一些进展,但这有点困难,”波普首次公开谈论他的公司时说道。“在谷歌内部,有很多人希望对芯片进行各种改变,但很难只关注法学硕士。出于这个原因,我们选择了离开。”
英伟达在人工智能芯片市场的主导地位有些偶然。该公司最初生产称为图形处理单元 (GPU) 的芯片,以加快视频游戏和某些计算机设计工作的速度。Nvidia 芯片擅长处理大量小型任务,而且碰巧的是,它们运行的人工智能软件在大约十年前开始起飞,比英特尔公司生产的其他类型芯片要好得多。
Nvidia 分割其 GPU 上的空间来处理各种计算工作,包括在芯片上移动数据。它的一些设计选择更多地迎合过去的计算时代,而不是人工智能的繁荣,并且会带来性能权衡。MatX 创始人认为,这种额外的空间增加了人工智能新时代不必要的成本和复杂性。
它采用一种全新的方法,设计具有一个大型处理核心的芯片,其单一目的是尽快将数字相乘——这是法学硕士的核心任务。
该公司打赌——这是一种孤注一掷的赌注——它的芯片在训练法学硕士和提供结果方面将比 Nvidia 的 GPU 至少好 10 倍。
Pope 表示:“Nvidia 是一款非常强大的产品,显然适合大多数公司。” “但我们认为我们可以做得更好。”
MatX 已筹集 2500 万美元,最近一轮融资由人工智能投资组合Nat Friedman和Daniel Gross领投。该公司位于加利福尼亚州山景城,距离硅谷第一家晶体管工厂肖克利半导体实验室只有几英里,有数十名员工正在埋头研究该公司计划明年推出的芯片。“MatX 创始人象征着我们人工智能世界的趋势,”格罗斯说,因为他们“采用了一些最大的公司开发的一些最好的想法,这些想法有点太缓慢和太官僚化,并自行将它们商业化。”
如果人工智能软件继续沿着目前的道路发展,它将对昂贵的计算产生巨大的需求。
据估计,每个正在开发的模型的训练成本约为 10 亿美元,其后续模型的训练成本预计为 100 亿美元。
MatX 预测,通过赢得 OpenAI 和Anthropic PBC等多家主要人工智能厂商的支持,它的业务将会蓬勃发展。“这些公司的经济状况与典型公司完全落后,”冈特说。“他们把所有这些钱花在计算上,而不是工资上。如果情况不改变,他们就会没钱了。”
硅谷,顾名思义,曾经充斥着芯片公司。当时有数十家初创公司,甚至计算巨头惠普、IBM 和 Sun Microsystems 都生产了自己的芯片。然而,在最近的历史中,英特尔通过其在个人电脑和服务器市场的主导地位压制了许多这些努力,而三星电子公司和高通公司等公司开始主导智能手机零部件。由于这些趋势,投资者开始不再向芯片初创公司投入资金,认为它们比软件成本更高、更耗时、风险更大。
“2014 年左右,我拜访了风险投资公司,他们把所有了解半导体的合作伙伴都开除了,”投资 MatX 的芯片专家拉吉夫·赫马尼 (Rajiv Khemani)说道。“我会盯着那些不知道我在说什么的人。”
然而,人工智能的兴起改变了风险与回报的方程式。拥有丰富资源的公司——其中包括亚马逊、谷歌和微软——已经投资设计自己的用于人工智能工作的张量芯片。几年前,Groq Inc.和Cerebras Systems Inc.等初创公司首次出现了人工智能专用芯片的浪潮。但这些产品是在人工智能重大技术突破导致法学硕士崛起成为人工智能领域的主流之前设计的。
初创公司不得不适应人们对法学硕士突然产生的兴趣,并尝试即时调整他们的产品。MatX 很可能代表着又一波从头开始专注于法学硕士的芯片初创公司的开始。
进入芯片行业的一个巨大问题是设计和制造新芯片需要三到五年的时间。(当然,Nvidia 不会在这段时间停滞不前,事实上,本月宣布了其 GPU 的更快版本。)
初创公司必须预测技术趋势和竞争将在哪里,几乎没有犯错的余地这可能会减慢生产速度。
软件公司通常必须重写代码才能在新的半导体上运行,这是一个成本高昂且耗时的过程,只有当他们期望通过转换获得巨大回报时,他们才会这样做。
经验法则是,新芯片必须至少比之前的芯片好 10 倍,才有机会说服客户改变所有代码。
格罗斯预测,我们正处于构建支持向人工智能转变为主要计算形式所需的基础设施的早期阶段。“我认为我们正在进入一个半导体周期,相比之下其他周期显得黯然失色,”他说。如果他是对的,那么几乎可以肯定还有新的芯片帝国有待创建。