大多数人工智能初创公司都注定失败b
作者:James Wang
编译:舟航
大多数人工智能初创企业注定要失败,这句话可能相当平常。毕竟,从数字上看,大多数初创企业都注定要失败。
我想说的是更容易引起争端的话题。几乎所有在 ChatGPT 之后炒作起来的、明确标榜自己为 "人工智能初创企业 "的初创企业都注定要失败。
现在,我是一名在人工智能领域投资了很长时间的风险投资人。事实上,我最初离开对冲基金界,就是因为我看到了人工智能领域发生的很多事情。因此,我绝对不是一个人工智能怀疑论者。
尽管如此,但从根本上说,我认为从投资者的角度来看,当前炒作周期中获得融资的大部分项目都是没有价值的。
如果您在周末构建了它,其他人也可以
让我们先说明最简单的问题。
我见过许多初创公司,它们基本上都是把一些生成式人工智能 API 粘合在一起,做一些提示工程,然后再加上一个 UI 界面。其中也有一些产品在打磨和功能方面令人印象深刻。
这些公司也都注定要么成为完全合格的企业(但按照保罗·格雷厄姆的经典定义,不是初创企业),要么死掉。
很显然,如果你用一个周末的时间做出来了,别人也能做出来。现在,假设你是一个编码天才。一个名副其实的 10X 程序员神童!这可能需要世界上所有人花上几个周末的时间......但它一定能完成。
如果你的项目产品基本上是免费赠送的,只是为了好玩,那没什么大不了的。
但是,如果你开始收费,客户开始非常依赖它,其他人就可以入场,稍微压低你的价格。也许你的还是更好一些,变得更好意味着产品越被受欢迎。
但如果它真的很重要(即支付意愿高,使用频率高),这就是经济学和竞争的魔咒发挥作用的地方。人们会模仿你,争夺你的利润。
“没有防御性和差异化”等于“没有利润”。这就是基本的经济学原理。
连 Alphabet、Meta 或 OpenAI 都没有任何防御能力
好吧,这就是《经济学 101》和《创业 101》。这并不是这个领域独有的。每个炒作周期的基本特征都是人们忘记了这些基本规则的存在,然后在周期结束时懊恼地重新发现它们。
不过,请注意,我主要说的是那些把 ChatGPT 等 API 粘合到一起的初创公司。这些产品的差异化和可防御性显然很低。即使你的用户界面更漂亮,别人也可以来复制它。
不过,我的观点不仅仅局限于这些微不足道的例子。
现在,让我们把同样的逻辑应用到 ChatGPT、Bard、LlaMA 等 LLM 的底层技术本身。
如果我告诉你,我有一项人人都想使用的奇妙技术,而要创造这项技术,我必须做的就是:
- 收集互联网上的所有文本;
- 使用大量的 GPU 和数百万美元对其进行训练;
- 在众所周知的技术上构建它,其中大部分都是开源的。
这有道理吗?对于小型初创公司来说,第 1 点和第 2 点可能会有一定的技术或后勤困难,但对于其他大公司来说,这两点都不是特别难以克服的困难,尤其是结合第 3 点的事实。所有这些都建立在Transformer 算法和 LLM 的相同底层架构上。这些 LLM 没有真正的护城河。任何大型互联网公司都可以复制它们。
事实上,就连 Alphabet/Google 内部也是这么说的。
这同样适用于所有图像和视频生成式人工智能。只需将第 1 点替换为图片或视频即可(题外话:如果 Alphabet 能切断 YouTube 的便捷访问,视频可能是个例外)。
但如果我拥有最好版本的人工智能呢?
好了,我们已经确定,在他人的技术前构建一个API(我们微不足道的情况)并不是一件超级有用的事情。我们现在来谈论为什么 LLM 这种不那么微不足道的情况从根本上说是站不住脚的。
如果我灵活运用上述第 3 点,提出 LLM 的最佳版本呢?或者在人工智能的其他领域提出类似的版本呢?
理论上,这很有趣。当然,除了整个行业的技术前沿发展速度有多快这一事实之外。
这就好比在 90 年代拥有最快的 CPU!
如果我在 20 世纪 90 年代告诉你,我有最好的 CPU 会怎么样?我的速度是英特尔的 3 倍!
考虑到开发 CPU 的成本和难度,这在技术上确实令人印象深刻!当然,问题是,你能年复一年地重复这一壮举吗?因为你的问题是,考虑到半导体技术当时的发展速度(摩尔定律),你在一两年内(也许)有优势。英特尔和其他所有人都会与你的性能持平。如果你有一些特殊的秘诀,能让你持续保持领先,那是一回事,但更有可能的是,你只是偶然发现了一套特殊的优化方法,而其他人也会很快采用。
如今的人工智能也存在同样的问题。前沿技术发展得太快,而整个人工智能学术和产业研究界的前沿技术几乎肯定比你一家公司的火力更猛。
顺便说一句,当我们谈论火力时,这一挑战甚至适用于最大规模的情况。例如,中国的人工智能发展速度远远赶不上全球(主要集中在美国)的研究界。基本上,每一个从专有模型中脱离出来的人都会很快落后,最终还是会采用全球最先进的技术。人工智能比半导体更糟糕,因为所有的人工智能都倾向于开放源代码,这使得在算法方面长期保持优势变得更加困难。
因此,除非你能让这一两年的优势在建立持久护城河的过程中发挥实际作用,否则你就无法获得任何持久价值。
等等,那么什么是可以防御的呢?
好了,我们已经完成了排除过程。还剩下什么呢?
哥斯拉规模的巨大算力
那么,你可以选择一种计算密集度高到只有你才能经济地完成训练或推理的方法。在我看来,这不太可能,因为人工智能已经取得了长足进步,降低了实现特定结果所需的数据量和计算量。不过,请注意,我的观点有些不受欢迎。你可以自己判断这一点是否属实。不过,至少从投资者的角度来看,即使这是一个真正的优势,我也不确定自己是否会为一家初创公司积累比谷歌、Facebook、百度等公司更多 GPU/ASIC/FPGA 的战略而感到兴奋......
真实世界的专有数据
其次,你可能在一个无法简单地从互联网上获取数据的地方开展业务。例如,在医院中孤立存在的医疗保健数据,或者现在根本没有收集的数据。或者,蛋白质折叠或药物动力学反应数据,这些数据必须通过真实世界的实验煞费苦心地收集。还有很多其他东西......所有这些数据都有一个共同的特点,那就是它们不存在于纯数字世界中,也不能简单地从互联网上获取。
这就是我所看到的大多数人工智能初创公司的价值所在。在这些地方,如果没有高昂的成本、时间和的物理世界混乱,您就无法简单地决定去收集数据。这些初创公司可以乘着人工智能改进的浪潮——这并不重要,反正算法都已经商品化了——但它们是唯一拥有并掌握这些专有的、几乎不可能获得的真实世界数据的公司。
创造的价值并不意味着获取的价值
注意,我提到了初创企业。很多人都忘了,在社会层面上创造了价值,并不一定意味着公司就能获得这些价值。20 世纪 90 年代的互联网热潮创造了大量的网络基础设施,但公司的投资回报率却为负数。虽然这对社区上网有很大帮助,但那是社会效益,而不是公司的投资回报率。
在最近的一个案例中,你知道 Azure 实际上运行着大量的私有区块链吗?由于种种原因,很难真正披露其财务结果,但许多大公司都在 Azure 上运行这些东西,这使得微软成为区块链领域的大赢家之一。(是的,还有一个单独的问题,即私有区块链是否真的与数据库有什么不同。但这与我的观点无关)。
同样的事情也可能发生在OpenAI身上,OpenAI看起来就像是微软的一个研发实验室。微软在 Azure 中提供计算资源,作为回报,OpenAI 开发工具,然后由 Azure 作为托管服务提供。这样,Azure 就能从 ChatGPT 和其他可以按需付费的 API 调用中赚一大笔钱。当然,Bard 和 Google Cloud Compute 等也是如此。
这一原则贯穿了当今大多数人工智能领域。将会有大量的价值产生,这些价值都将归于社会,而不会被任何私人公司所获取。顺便说一句,这很好,技术就是这样成为社会和宏观经济中为数不多的 "免费午餐 "之一的。
同时,也会有大量的价值被现有的行业参与者利用其市场力量和规模简单地获取。这对社会来说并不是免费的午餐,但也正是资本主义的运作方式,而且往往还能为社会带来 "剩余"(经济学中 "好东西 "的说法)。
最后,还有相当小的一部分既能产生价值,又能为新成立的年轻公司带来收益,理想的情况是,这些公司能够出现并取代现有的公司(这就是健康的市场更替是如何发生的)。
这些公司将产生超额回报,成为未来知名的科技公司,当然,这也是风险投资公司理论上所寻找的。实际上,目前大多数投资者在向人工智能初创公司(甚至是声称拥有 "人工智能战略 "的大型上市公司)砸钱时都比较盲目。因此,这些钱大多都被冲进了下水道。
人工智能将改变世界。但大多数人工智能初创企业注定要失败。