生成式AI和大模型第一轮抢跑已见分晓

前言


看到朋友转发这篇帖子:


2024大模型从业者的至暗时刻.pdf


用平静的语言,诉说着大模型追随者的心酸😄


这周有点忙,OpenAI、谷歌、火山引擎/字节等国内外多家大模型巨头召开了发布会。上一篇帖子里写过,OpenAI发布的GPT-4o并没有太多的技术革新,更多是在应用上的扩展。


春末夏初的畅想 GPT-4o Amodei兄妹、木头姐谈投资 孙正义的金鱼说 谷歌开发者大会


本文阐述俺这一段时间的观察,欢迎交流讨论。


目录


前言

核心观点

Transformer的至尊地位

大模型商业生态

中文大模型迅速崛起

大模型基础功能差异化困境


核心观点


这周国内外几家大模型厂商有了新发布,内容上并没有太多的技术突破和创新,几乎都是应用层面的优化和扩展。俺大胆推断,2022年11月30日ChatGPT问世所引发的生成式AI和大模型浪潮,历时近一年半后,第一轮比赛已经尘埃落定。


接下去的第二轮比赛,重心会放在以云服务为依托的企业和消费者应用上,前者主要是各大咨询公司+云服务商联手抢夺市场份额,后者则是大模型厂商与各创业企业之间激烈博弈。详情后叙。


硬件和芯片上面,各家都在加大投资,google I/o上发布了自己的第六代TPU Trillium,AMD、Intel,甚至苹果都有自己的芯片。哪家能够成为英伟达对手,拭目以待。AI PC也值得期待。


关于OpenAI对市场的影响写过一篇:


OpenAI是繁花中李李送给宝总的那条鲶鱼吗


Transformer的至尊地位


2017年由谷歌研究者发明的Transformer架构被认为是引爆本次AI革命的最大创新,目前几乎所有的大模型都是基于这个架构。硬件技术+并行训练(transformer)大幅缩短模型训练时间,使得商业应用成为可能。论文:Attention is all you need, Vaswani, et al., 2017


大模型商业生态


目前的大模型商业应用模式:公有云(IaaS)+大模型,海外三大云服务商都有自己的大模型。微软azure/GPT 4o、谷歌gcp/Gemini 1.5 pro、亚马逊aws/claude。国内厂商阿里云/通义千问市场份额增长中。各大咨询公司发挥云服务商(大模型服务商)与客户商业需求之间的桥梁作用。去年9月关于大模型行业生态有过阐述:企业级生成式AI行业的观察与思考 


4/10 Intel Vision 2024中, Guan Lan (Accenture Chief Al Officer) 介绍说有上千个生成式AI项目进行中。这些项目正在逐步上线,一些原本对大模型没什么兴趣的朋友,也正在从自家企业新上线的应用中感受到其威力。


生成式AI和大模型第一轮抢跑已见分晓


中文大模型迅速崛起


国内大模型崛起迅速拉近与海外大模型差距。


生成式AI和大模型第一轮抢跑已见分晓
生成式AI和大模型第一轮抢跑已见分晓


大模型基础功能差异化困境


国内外大模型基本功能接近:文生文、文生图、文生视频、文生音乐、多模态识别。基本功能接近的前提下,为了差异化争夺市场份额,大模型厂商开始向应用层面推进,这样就有可能与创业公司抢夺机会。创业者谨慎选择创业方向💪 这一点也可以参见上一篇帖子:春末夏初的畅想 GPT-4o Amodei兄妹、木头姐谈投资 孙正义的金鱼说 谷歌开发者大会


以下是谷歌开发者大会 google I/O keynote的笔记。除了谷歌看家本领的搜索与大模型的融合之外,其他发表内容基本上与别的大模型厂商类似。


生成式AI和大模型第一轮抢跑已见分晓
生成式AI和大模型第一轮抢跑已见分晓
生成式AI和大模型第一轮抢跑已见分晓

Happy reading :-)


--end--

返回:生成式AI和大模型第一轮抢跑已见分晓

本文由“公众号文章抓取器”生成,请忽略上文所有联系方式或指引式信息。有问题可以联系:五人工作室,官网:www.Wuren.Work,QQ微信同号1976.424.585