前言
看到朋友转发这篇帖子:
用平静的语言,诉说着大模型追随者的心酸😄
这周有点忙,OpenAI、谷歌、火山引擎/字节等国内外多家大模型巨头召开了发布会。上一篇帖子里写过,OpenAI发布的GPT-4o并没有太多的技术革新,更多是在应用上的扩展。
春末夏初的畅想 GPT-4o Amodei兄妹、木头姐谈投资 孙正义的金鱼说 谷歌开发者大会
本文阐述俺这一段时间的观察,欢迎交流讨论。
目录
前言
核心观点
Transformer的至尊地位
大模型商业生态
中文大模型迅速崛起
大模型基础功能差异化困境
核心观点
这周国内外几家大模型厂商有了新发布,内容上并没有太多的技术突破和创新,几乎都是应用层面的优化和扩展。俺大胆推断,2022年11月30日ChatGPT问世所引发的生成式AI和大模型浪潮,历时近一年半后,第一轮比赛已经尘埃落定。
接下去的第二轮比赛,重心会放在以云服务为依托的企业和消费者应用上,前者主要是各大咨询公司+云服务商联手抢夺市场份额,后者则是大模型厂商与各创业企业之间激烈博弈。详情后叙。
硬件和芯片上面,各家都在加大投资,google I/o上发布了自己的第六代TPU Trillium,AMD、Intel,甚至苹果都有自己的芯片。哪家能够成为英伟达对手,拭目以待。AI PC也值得期待。
关于OpenAI对市场的影响写过一篇:
Transformer的至尊地位
2017年由谷歌研究者发明的Transformer架构被认为是引爆本次AI革命的最大创新,目前几乎所有的大模型都是基于这个架构。硬件技术+并行训练(transformer)大幅缩短模型训练时间,使得商业应用成为可能。论文:Attention is all you need, Vaswani, et al., 2017
大模型商业生态
目前的大模型商业应用模式:公有云(IaaS)+大模型,海外三大云服务商都有自己的大模型。微软azure/GPT 4o、谷歌gcp/Gemini 1.5 pro、亚马逊aws/claude。国内厂商阿里云/通义千问市场份额增长中。各大咨询公司发挥云服务商(大模型服务商)与客户商业需求之间的桥梁作用。去年9月关于大模型行业生态有过阐述:企业级生成式AI行业的观察与思考
4/10 Intel Vision 2024中, Guan Lan (Accenture Chief Al Officer) 介绍说有上千个生成式AI项目进行中。这些项目正在逐步上线,一些原本对大模型没什么兴趣的朋友,也正在从自家企业新上线的应用中感受到其威力。

中文大模型迅速崛起
国内大模型崛起迅速拉近与海外大模型差距。


大模型基础功能差异化困境
国内外大模型基本功能接近:文生文、文生图、文生视频、文生音乐、多模态识别。基本功能接近的前提下,为了差异化争夺市场份额,大模型厂商开始向应用层面推进,这样就有可能与创业公司抢夺机会。创业者谨慎选择创业方向💪 这一点也可以参见上一篇帖子:春末夏初的畅想 GPT-4o Amodei兄妹、木头姐谈投资 孙正义的金鱼说 谷歌开发者大会
以下是谷歌开发者大会 google I/O keynote的笔记。除了谷歌看家本领的搜索与大模型的融合之外,其他发表内容基本上与别的大模型厂商类似。



Happy reading :-)
--end--
code/s?__biz=MzI5ODM4Mjc3MQ==&mid=2247484812&idx=1&sn=e2c55f389856534544b078c78c843fbf&chksm=eca7e150dbd068461ad3ed41977b14654a61ea27152e601dc0c83ab5995394dd674d077aa423#rd