1
今天我司的 recruiter 跑来问我:“你觉得 OpenAI 是现象级还是偶然性事件(技术壁垒不高)?”,因为有个候选人对她表示 OpenAI 的技术壁垒并不高,只是做了第一个吃螃蟹的人。目前来看,OpenAI 的进展确实放缓,据我所知其他一些厂商的追赶速度极快,甚至在一些模型上可以说是完胜了 OpenAI。但在我心中 OpenAI 还是一个特殊的存在,因为我会觉得 OpenAI 的价值并不在商业上,而是在技术上,更何况,现在 OpenAI 在商业上虽然说不上非常成功,但肯定不能算失败。
在之前就关注 OpenAI 的朋友应该知道,当时 GPT 和 GPT-2 在外界看来是很“玩具”的东西,同期 Google 的 Bert 才是最强的语言模型;以及 GPT-3 出来时,大家会觉得有意思,但依然是没啥用的状态;直到后续的 GPT-3.5 让大家看到了 AGI 的可能性。在 GPT-3.5 出来之前,OpenAI 独自在 GPT 架构上坚持了 4 年以及更久的时间,即使算上当时马斯克、奥特曼等人的资金很多,融资能力也强,OpenAI 作为一家创业公司一直在一个不一定成功的方向上坚定投入,这也是非常难的事情。
在我看来,OpenAI 的坚持才是这家公司和其他公司的主要不同,其他公司去做大语言模型,是因为商业需要;而 OpenAI 去做大语言模型,是因为这家公司相信这样可以创造一个有 AGI 的未来。这也是其他公司的所作所为“无意义”之处,在 OpenAI 已经推出 GPT 后,如果一个后来者(公司)想要为人类做出贡献,那必然是不应该选择大语言模型的工作的,因为除非你有和大众非常不一样的见解,那么这个领域已经是被 OpenAI 充分探索的领域了,这家后来者公司应该去独立思考还有什么领域是重要的,却被市场忽略而未能被探索的,这些领域才会有新的价值和技术被创造。也就是说,作为后来者的公司应该先考虑去做新事情,而不是抢着去做旧事情。
2
上面这句话可能会有不少人有反对意见,什么赚钱做什么呗。但我会觉得没有人竞争的市场才有丰厚的利润,在 LLM 这个大家挤破头的竞争领域,除非最后出现赢家,不然就是大家都是收着成本价打工。
一个例子是当年的 AI 四小龙(商汤、旷视、依图、云从),做的技术看上去很难,但其实大家同质化很严重,以至于后来大厂用了一段时间四小龙提供的各种解决方案后,就转向了内部自研,留下四小龙只能去走 ToB 和 ToG 路线。当然计算机视觉还有一个问题是没有太大的商业价值,此处不表。
另一个例子则是小米,小米总是在需求被市场验证后才进入市场,这就导致小米做的是“感动人心”的高性价比产品,商业模式无关对错,小米也是一家有很大的社会责任感的企业。但事实上小米的硬件产品利润率极低,也就没有太大的成本去做创新。
所以兜了一个圈子说回来,去做 LLM 赚钱吗?我个人会觉得这是个赔钱的生意,目前来看只有字节的豆包是个例外,因为 ChatGPT 无法对中国提供服务,而中国的大量普通用户也需要一个好用的 LLM app。
3
相对于其他公司,各家大厂做 LLM 其实是 OpenAI 做过的“旧事情”;而 OpenAI 之前在 GPT,过去两年在多模态,以及最近在 post training 上做的才是“新事情”。相比之下,我个人会偏爱做“新事情”,理由如下。
第一点,做新事情是有意义的,如 OpenAI 长达几年在 AGI 上的坚持换来了如今 AI 应用的大爆发。新技术会创造新需求和新资源,但旧事情更多是基于现有条件重新分配资源。
第二点,收益最大化,如果一件新事情成功了,那么你就是这件事情的行业第一,自然有非常大的商业利润,大量的资金会允许你做很多事情;相比之下做旧事情的利润总归是有限的,因为市场和用户需求都在逐渐固化,其他竞争者也想从你这里分一杯羹。新事情的成功概率其实是很低的,失败是更常见的结果,但其实失败也有很大的收益。90 年代,有一家叫做 General Magic 的公司想要制造出一个可以随身携带的触屏互联网设备,这是一个从现在看和 iPhone 很像的设备,结果也可想而知,90 年代的技术无法制造出 iPhone。 General Magic 失败了,但里面的不少员工因为这段经历得到了一个成功的职业生涯,Tony Fadell 离开 General Magic 后几经辗转来到了 Apple,主导了 iPod 的设计和开发工作;Kevin Lynch 则是主导了 Apple Watch 的开发;Andy Rubin 写出了一个叫做 Android 的操作系统并被 Google 收购。
第三点,领先者抄袭他人的优势是极大的,虽然领先者完成的”新事情“会被后来者抄袭成”旧事情“,但领先者又可以反过来抄袭后来者做的各种”微创新“。这样的例子不胜枚举,从 QQ 到苹果到 OpenAI,这些公司的所有追随者只是在帮助领先者验证一些他们没有时间去验证的需求,一旦需求被验证,领先者可以用极小的成本完成抄袭,甚至追随者原来的客户也会被领先者抢走。
第四点,被误解其实是一种巨大的优势。正因为短期的逐利者无法关注到你,你可以很轻松地筛选掉没有不认同你愿景的员工;因为你做的事情还没有成为风口,你可以用极低的成本从相关的供应商那里拿到资源;同时因为没有竞争,你也不会有太多时间上的压力,做“新事情”的节奏感和手感会好很多。
4
如果说我们更认同做“新事情”,那有什么实践是我们可以做到呢?
- 职业上,偏好做“新事情”的公司:这样个人不仅可以获得更大的成长,也有小概率获得非常大的财务回报。
- 投资上,偏好做”新事情“的公司:这类公司的特点其实比较明显,他们专注做一些别人不愿意做的事情,因此股价很低,但这些事情一旦成功,会有很大的商业价值,在此之后这些公司的股价会发生极大的提升。不过对事情和公司的判断不只是说说而已,我也不推荐在投资上花费过多的时间和财力。
- 日常做事上,把评价事物的标准从注重”完成度“转换到注重”创新性“:我自己有一个很不好的学生思维就是明明花 20% 的时间可以拿到 80% 的成果,但自己会去花 100% 的时间去拿到 100% 的成果,但其实多出来的 20% 成果很多都是一些琐碎或不重要之事;现在对我来说,快速地 deliver 结果,验证 idea 的价值是更重要的事情。剩下的 20%,如果你的 80% 足够重要,那么会有很多人来愿意做的。