生成式AI和大模型第一轮抢跑已见分晓

前言

看到朋友转发这篇帖子：

2024大模型从业者的至暗时刻.pdf

用平静的语言，诉说着大模型追随者的心酸😄

这周有点忙，OpenAI、谷歌、火山引擎/字节等国内外多家大模型巨头召开了发布会。上一篇帖子里写过，OpenAI发布的GPT-4o并没有太多的技术革新，更多是在应用上的扩展。

春末夏初的畅想 GPT-4o Amodei兄妹、木头姐谈投资孙正义的金鱼说谷歌开发者大会

本文阐述俺这一段时间的观察，欢迎交流讨论。

前言

核心观点

Transformer的至尊地位

大模型商业生态

中文大模型迅速崛起

大模型基础功能差异化困境

核心观点

这周国内外几家大模型厂商有了新发布，内容上并没有太多的技术突破和创新，几乎都是应用层面的优化和扩展。俺大胆推断，2022年11月30日ChatGPT问世所引发的生成式AI和大模型浪潮，历时近一年半后，第一轮比赛已经尘埃落定。

接下去的第二轮比赛，重心会放在以云服务为依托的企业和消费者应用上，前者主要是各大咨询公司+云服务商联手抢夺市场份额，后者则是大模型厂商与各创业企业之间激烈博弈。详情后叙。

硬件和芯片上面，各家都在加大投资，google I/o上发布了自己的第六代TPU Trillium，AMD、Intel，甚至苹果都有自己的芯片。哪家能够成为英伟达对手，拭目以待。AI PC也值得期待。

关于OpenAI对市场的影响写过一篇：

OpenAI是繁花中李李送给宝总的那条鲶鱼吗

Transformer的至尊地位

2017年由谷歌研究者发明的Transformer架构被认为是引爆本次AI革命的最大创新，目前几乎所有的大模型都是基于这个架构。硬件技术+并行训练（transformer）大幅缩短模型训练时间，使得商业应用成为可能。论文：Attention is all you need, Vaswani, et al., 2017

大模型商业生态

目前的大模型商业应用模式：公有云（IaaS）+大模型，海外三大云服务商都有自己的大模型。微软azure/GPT 4o、谷歌gcp/Gemini 1.5 pro、亚马逊aws/claude。国内厂商阿里云/通义千问市场份额增长中。各大咨询公司发挥云服务商（大模型服务商）与客户商业需求之间的桥梁作用。去年9月关于大模型行业生态有过阐述：企业级生成式AI行业的观察与思考

4/10 Intel Vision 2024中， Guan Lan (Accenture Chief Al Officer) 介绍说有上千个生成式AI项目进行中。这些项目正在逐步上线，一些原本对大模型没什么兴趣的朋友，也正在从自家企业新上线的应用中感受到其威力。

中文大模型迅速崛起

国内大模型崛起迅速拉近与海外大模型差距。

大模型基础功能差异化困境

国内外大模型基本功能接近：文生文、文生图、文生视频、文生音乐、多模态识别。基本功能接近的前提下，为了差异化争夺市场份额，大模型厂商开始向应用层面推进，这样就有可能与创业公司抢夺机会。创业者谨慎选择创业方向💪 这一点也可以参见上一篇帖子：春末夏初的畅想 GPT-4o Amodei兄妹、木头姐谈投资孙正义的金鱼说谷歌开发者大会

以下是谷歌开发者大会 google I/O keynote的笔记。除了谷歌看家本领的搜索与大模型的融合之外，其他发表内容基本上与别的大模型厂商类似。

Happy reading :-)

--end--