先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
微软&OpenAI帝国的一道裂缝
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
虽然 ChatGPT 推出后仅用2个月,月活便突破了1亿,成为史上用户增长最快的应用。但同为 OpenAI 发布的AI作画产品:DALL-E,却一直相对默默无闻,被其开源对手 Stable Diffution 压着打。再后来 MidJourney 凭借出色的艺术效果异军突起,更是让 DALL-E 黯然失色。
也就是说,OpenAI 当前的主要优势还是在语言大模型。但其实这块根据地也已经隐隐有一道裂缝:由Meta推出的开源羊驼大模型,得益于开源模式的众人拾柴火焰高,已经在性能上接近 ChatGPT,并在成本上大幅领先。这让这位如日中天的AI新皇怎能不着急呢?
这里先简单介绍下羊驼大模型的背景
2023年2月24日,Meta(原Facebook)公司发布了语言大模型 LLaMA ,因 llama 在英文中被译作羊驼,故而被业界戏称为「羊驼」。羊驼仅在发布一周后,就被「非故意开源」了,这里的内情根据扎克伯格最新的电话会议可以看出一二,他说「如果行业在 Meta 使用的基础工具上做到标准化,那么 Meta 就能从其他开发者的改进中获益,这样会更好」。这显然是基本的开源理念了。
羊驼发布后,美国的各大顶级学术界、产业界第一时间进行了跟进研究,一时间百花争艳,基于羊驼的家族产品纷至沓来:斯坦福的 Alpaca、伯克利 Vicuna、Koala、ChatLLaMA、FreedomGPT等等。
以伯克利的 Vicuna 为例,在5月份的最新评测中,Vicuna对于许多任务来说,已经是「ChatGPT-3.5的可行替代品」。
而根据伯克利的计算机教授 Ion Stoica 的说法,「现在的免费AI模型,在性能上已经相当接近谷歌和 OpenAI 的专有模型了,毫无疑问,大多数开发者最终都会选择免费模型。」
这里的一个关键是,Vicuna的训练成本能做到几百元美金,而如果选择非开源的商业大模型,训练一次动辄几十万的token费用。
这就是开源的威力!汇集全世界的开发者的智慧与一家商业公司角力。在开源与非开源的竞争中,产品面向的市场越大,开源带来的空间和想象力就越大。典型的如传统的IT领域,开源的 Linux 操作系统,基本垄断了全球的服务器和云计算市场。
因此,在与开源的竞合生态中,做好卡位,已经成为 OpenAI 不得不抓紧布好的一枚棋子。
推演大模型的竞争终局
借着这个事,也推演下未来大模型的竞争终局。以下是三个主要论断:
1. 未来的大模型应用,C端可能属于大厂,但是B端必有开源的半壁江山。
可以预见的是,在未来几年,大模型一定会在C(Customer)端的生活中,以及在B(Business)端产业的各个场景下逐步落地。得益于大厂对消费者需求的深度理解,和海量的用户数据沉淀,其C端产品的用户体验能做到显著优于相对粗矿的开源产品。
但是在B端,每个企业都不希望自己的商业机密、数据被喂给其他商业公司。当然,这通过将大模型私有化部署,可以解决部分数据安全的问题。但是私有化部署,并不能解决供应商锁定的问题:
(1)当你用了这家的方案,后续再想换供应商往往难度巨大,成本高昂。
(2)容易失去谈判的议价权。
并且越大、越成熟的企业越有这方面的担忧。基于产业经验,开源产品会成为很多企业的选择。
2. 大模型的核心竞争点并不在于技术,而在于数据与生态。
技术是门槛,但往往靠堆人就能解决,对大厂之间的竞争来说,并不能成为壁垒。但训练大模型的数据,就要各凭本事了。而数据是大模型训练效果的关键要素。因此,对于通用大模型类的产品,基本主导权在拥有海量数据的大厂和政府。
生态无需多言,目前各个大模型紧锣密鼓的打造各类插件,就是抢占生态位的动作。逻辑和 iphone 的 app store 是一致的。
3. 未来真正的大模型巨头,可能并不在你的视线当中。
从目前看,全球范围内,会逐步走出几个通用大模型巨头,他们将占领生态位;
会有至少数百家垂直领域的大模型公司,立足于解决特定行业和场景的需求,赋能产业;
会有数以几十万计的应用类公司和开发者,丰满大模型的插件、应用和生态。
但是,这轮通用人工智能的浪潮,才刚刚开启。就像我们在门户网站时代,完全预见不到Web 2.0的人声鼎沸,在PC互联网时代完全预见不到移动互联网的满目繁华一样。
真正的巨头,还在至美希望的彼岸!