【天天播资讯】AI十年浮沉,与改变命运的大模型

2023-04-22 08:18:51 来源:远川研究所

2019年,前谷歌CEO埃里克·施密特向白宫递交了一份颇为“诡谲”的报告。这份长达750页的文件,核心观点其实只有一句话:若美国再不加大投资,中国将彻底主导AI领域[1]。


(资料图片)

施密特此举其实有“骗经费”之嫌:一年前,谷歌曾迫于舆论压力退出了一个政府AI项目,他一直对此耿耿于怀。但报告本身却并非胡诌。同年,美国数据创新中心也发布了一份报告,声称中国AI实力全球第二,且在数据等层面比美国更具优势[2]。

在全民追赶GPT的今天,这则旧闻读起来颇有几分“魔幻感”。

报告甚至上升到了“国家安全”的高度

然而,施密特口中的AI,与如今人们谈论的GPT并非一个东西。

以GPT为代表的AI,指的其实是大模型。它拥有生成图像、音频、视频等内容的能力,像是个文艺青年。但彼时让美国人深感威胁的,多指识别型AI(小模型)。它擅长各类数据分析工作,如同一个木得感情的运算机器。

大模型走红前,识别型AI曾被寄予了太多改变世界的厚望,在中国催生了一段群雄并起、热钱涌动的黄金岁月。*时期,中国AI初创企业的融资金额甚至超过了美国——李开复将其形容为“有三个AI专家就能估值7亿、靠AI概念就能忽悠投资人”,也不怪美国人感到焦虑。

只是好景不长:后来VC陆陆续续退出,曾经风头无两的独角兽也褪去了身上的光环,残暴的欢愉最终以残暴终结。

对此,百度集团执行副总裁、百度智能云事业群总裁沈抖曾打过这么一个比方:大模型出现前的AI像是氧气——本身很有价值,但自己不会燃烧,必须找到可燃物才能把价值给发挥出来。这里的“可燃物”,指的是落地场景。

AI起起落落这十年,成也场景,败也场景。

范式的困境

2016年,谷歌AlphaGO不仅彻底颠覆了围棋,也改变了当时的AI创业。一时间,VC、科学家、大学教授,乃到各路乡镇企业家,无一不在谈论着AI商业化的可能性。短短一年时间,国内诞生了528家AI企业,催生371起AI投融资,同比涨幅达到了38.9%;同一时间,中国AI企业申请了9000多项AI专利,几乎是美国新增专利数的两倍有余[3]。

不过,整个行业闭眼狂奔的同时,鲜有人会注意到初冬的号角已经悄悄吹响。2019年,繁荣戛然而止。

首先是融资遇冷:这一年的AI融资金额仅有186亿元,相比2018年直接腰斩了一个0。受此影响,AI初创企业的数量也大幅缩水,仅有鼎盛时期的1/20。至于那些从竞争中幸存、成功“上岸”的AI企业,其财务状况仍旧惨不忍睹。据不完全统计,近九成AI企业都处于严重亏损的状态[4]。

大起大落背后,是AI长期以来的产业化困境。

2021年之前,业界三大主流AI技术分别是计算机视觉、语音识别、自然语言识别,本质都属于识别型AI。单从技术层面来看,上述技术都具备着充分的下游应用空间,想象力充足。

例如在“AI+安防”领域,2020年时已有453亿元的市场,且增速可观,预计到2025年时市场规模将再翻一番[6]。

可下游需求不断扩大,并无法拯救亏钱的AI企业。识别型AI的技术特点,决定了它是一门技术、投入与产出不成正比的生意。

识别型AI采用的是小模型——这是一种专为特定任务而生的技术。在实际训练小模型时,研究员只需给AI灌入标注过的特定数据,便能让AI获得对应的能力。如果想要一个能抓“闯红灯”的AI,那么无需教它语文数学,只要让它从小学习各种闯红灯的视频即可。

小模型的优点在于简单、高效,专用向的AI能够很好地完成对应任务。但其缺点同样明显:由于没学过其他知识,一个AI只能解决一个问题。譬如一个抓闯红灯的AI,显然不会具备识别超速、违规变道的能力。

识别不同元素需要不同的标注数据

由于小模型不具备通用性,导致识别型AI只能成为一门类手工作坊的定制生意。

且具体到实际应用中,一个需求有时还需要定制不止一个AI。例如在工业领域,在制造冶金钢卷时有缺陷检测这一步骤。如果将这项工作交由AI,定制起来其实相当麻烦。因为钢卷分为冷轧、热轧,所以AI企业需要同时用“冷轧-合格”“冷轧-缺陷”“热轧-合格”“热轧-缺陷”四组数据训练四遍[7]。其繁琐程度,与“五彩斑斓的黑”有的一拼。

定制需求繁琐的同时,对人力要求还不低——这活儿可不是月薪三千的大学生能干的。

出于业务需要,头部AI企业都聘请了大批科学家、博士生与教授作为研究员,而AI研究员又是出了名的“高薪岗位”。2015年,谷歌为了不让知名研究员伊利亚(Ilya Sutskever)跳槽,曾开出过200万美元/年的高薪——后来桑达尔·皮查伊继任谷歌CEO时,其基本工资是同一个数字。

财新曾对国内AI企业招股书做过一笔测算,发现:它们每挣1块钱,就要花掉0.75元的人力成本。再算上定制AI的算力、数据开销、以及其他成本,几乎做一单亏一单。

人们这才惊奇地发现,AI这门生意似乎远不如想象中那么性感。

陷入死局后,AI企业们只能寄希望于一场“推翻重来”式变革。幸运的是,没过几年,暴风雨真的来了。

通用性的价值

红杉资本率先嗅到了风雨欲来的气息。2022年9月,红杉发表了文章《Generative AI: A Creative New World》,预言一场全新的科技竞赛即将来临。投资人同行很快闻风而动,一度冷清的AI圈再度人声鼎沸。

这篇文章发布仅半年,有头有脸的科技公司们几乎全部一头扎进了AI浪潮之中,要用人工智能把每个行业都重新做一遍。

例如当下火热的直播行业,大模型应用的空间就相当广阔。对于那些养不起专业直播团队的商家,如今只需输入商品信息,百度的文心一言能够自动生成话术、配音以及数字人主播,直接包揽了整个流程。

企业无需再花钱雇主播、想话术、搞培训,能轻松实现7*24小时直播,对中小企业而言无疑是个重大利好。

在沈抖看来,大模型创业带来的众多机会,将带动数字化经济更进一步,有机会在全球范围内掀起一股产业再造的浪潮。

他认为,随着大模型深入数字经济,更多产业会出现新的改变。智能化不仅让整个生产流程大幅提效,也改变了很多原有的生产关系,包括人和人、人和设备、人和系统的关系。以前没有智能时,很多工作实际上是靠人来操作;有了智能以后,机器、设备、系统都可以按照人的思想去学习。

未来的工作模式,很有可能是一个聪明的人去指导一堆机器人。这些机器人执行人类的决定,重塑整个生产线。沈抖说道,“生成式AI已经形成全球性的‘AI再造业务’趋势,企业迎来‘智能化跃迁’的历史机遇。”

AI产业能够二度迎来春天,背后其实是大模型技术迈向成熟。

这场变革的起点发生在2017年:彼时,谷歌几位研究员公开了深度学习模型Transformer。以此为基础,OpenAI等机构开始尝试研究大模型,一种不同于识别型AI的全新技术。

其研究成果,正是如今备受关注的GPT,即Generative Pre-trained Transformer(生成式预训练Transformer)。

众所周知,一个AI由模型、数据、算力三要素构成。相比于传统的识别型AI(小模型),以GPT为代表大模型在数据、模型等方面均有不同程度的革新,赋予了大模型更强的通用性。这恰好改善了小模型时代的产业化痛点,AI实现即插即用。AI企业终于能摆脱手工作坊般的生产模式,有机会变成一门好生意。

大模型的这一价值,几乎吸引了全球所有的目光。连早已退休、专心搞慈善的比尔盖茨,都为此兴奋不已。他在一篇文章中写道,自己有幸亲历了人类可能最重要的两场革命的开端:*次发生在Windows萌芽、PC市场刚刚兴起的80年代,而第二次正是去年——大模型刚刚开始涌现的时候。

而沈抖认为,作为“通才”的大模型还催生一种全新的产业化路径:MaaS(Model as a Service),模型即服务。“根据我们提供的文心一言的大模型服务,企业能够以此为基础,结合他们所在行业去微调出一个行业大模型,再用这个行业大模型去服务整个行业。”

未来,大模型可能会成为一个类似于安卓的“超级底座”, 每个行业都迎来AI再造的机会,并给应用端带来大量的机会。

而在美国,已经诞生了依托于大模型开展业务的独角兽。在德克萨斯州,一家初创企业凭借微调后的AI应用,在短短18个月时间做到了15亿美元估值,年收入已有3000万美元,比直接做大模型的企业还赚钱[10]。

不过,产业化潜力仅仅是大模型价值的一个方面。不同于过去两年流行的元宇宙、Web3等概念,大模型带来了实打实的生产力提升。

例如长安汽车在参与百度文心一言的邀测时,就体验了一回大模型的生成PPT功能。过去,制作一份PPT通常要花费半天甚至一天时间;如今,只需三分钟即可做出一份内容齐全、格式精美的PPT。未来,机械的重复性工作将完全可以交给AI,员工可以集中于创造更大价值的工作,企业竞争力增加同时增加社会财富。

百度智能云举行的闭门沟通会上,现场演示文心一言生成PPT

毫无疑问,大模型将是未来十年科技圈最重要的叙事之一。

百模大战

“百模大战”来了,一如当年的“百团大战”。

国内大公司纷纷扎堆推出大模型,百度文心一言*,360、腾讯、阿里、商汤、科大讯飞、字节等纷纷紧追。大模型产品大多同时兼具对话问答、文章创作、代码写作等多项技能。市场上供给多了,但这些产品的“智力”水平却参差不齐,如何挑选成为了一个难题。

目前主流观点认为,可以有以下两个标准:

*,从芯片到框架、模型再到应用的全链路环节都具备极为优秀的性能。

芯片决定了算力,这是AI训练的基础。OpenAI曾做过一笔测算:2012年开始,全球AI训练所用的计算量平均每3.43个月便会翻一倍,远超摩尔定律。在肉眼可见的未来,“算力不足”都将会是制约AI发展的*因素。因此,芯片要做到性能过硬。

只有制造出算力极强的高端芯片,才能满足智算时代的计算需求,让云好用,这是基础条件。

而在框架和模型层面,软件适配程度要更高,算法积累足够,大模型能力要更强。深度学习框架需要做到全栈自主可控,推动大模型不断迭代升级。在此基础上,推出多样云服务使得大模型适应各产业的数字、智能化需求,做好模型即服务(MaaS)。

第二,能为大家提供全链路的服务保障。

服务商不仅要具备多元的能力,还需要将它们有机地结合起来:如此一来不仅能带来更高的可靠性、帮助企业降本增效,还降低AI使用门槛,既易用,又好用。

好的智算基础设施,就是要高效解决算力、算法、数据处理等多维度的问题,而且这些维度之间不是独立存在的,而是互相依赖,相互优化、紧密耦合,从而提升整体基础设施效能。

比如芯片解决算力问题,框架解决算法开发问题,大模型解决模型泛化问题,他们三者就犹如三人四足比赛中的团队合伙人,只有彼此心有灵犀、协调互补,才能打出*的团队配合,赢得比赛胜利。

百度的解决方案,是将文心一言大模型与百度智能云服务结合起来,提供一种更便捷的一站式服务,即“云智一体”。

该方案同时提供了算力与大模型服务,企业只需提供自身行业的数据做微调,即可快速生产出符合市场需求的AI产品。不过,百度智能云能做的还不止微调一项,它还额外集成了推理与托管服务。

推理是大模型所具备的一项能力,指利用训练好的AI去进行结论推导的过程。如果说微调是将已有的房子重新装修一遍,那么推理则相当于给你空地和材料,搭建一个全新的房子。虽然推理的成本高于微调,但能让大模型新增更多原本不具备的能力,满足企业更深层次的开发需求。

至于托管,则能帮助较为早期的大模型创业者解决搭建团队的难题。高薪的AI研究员一直是市场上最抢手的资源之一,初创企业不仅资金有限,且很难在人才竞争中获得太多优势。相比之下,托管服务则会提供一支高度专业的团队,帮助第三方企业管理他们的AI解决方案。

由此可见,微调、推理、托管三大服务的功能各不相同,能够满足不同阶段企业的需求。

如今,上述“云智一体”服务已成为一种行业共识。百度智能云作为这一概念的提出者,具备一些独有的优势。

2022年,百度副总裁沈抖升级了原有的架构,正式对外官宣了“云智一体3.0”。该架构的优势在于,形成了“芯片-框架-大模型-行业应用”的智能化闭环路径,百度是全球*在每一层都有自研产品的公司。比如芯片层有昆仑芯,框架有中国市场份额*的飞桨。

沈抖认为,四层架构的高效协同,能实现更高的运转效率,“我们能在同等算力投入下,把某个应用的性能提高100%,相当于让算力需求降低了50%。”这是百度智能云非常独特的优势,也使得百度智能云成为国内*个训练出大模型的云。

如今,“云智一体”不仅仅只是一项服务,更有可能成为数字时代的一种新基建。经济学博士任泽平曾在2023年跨年演讲中预测,智能云将成为数字经济的重要技术支撑,并在未来20年成为支撑中国经济繁荣发展的新型基础设施。

对当今社会而言,这些变化既是将来时,也是进行时——AI正在以肉眼可见的速度重塑这个社会。对此,舆论上充斥着许多不安的声音。不过,当时代的浪潮扑面而来,企业、个体*的选择,只有拥抱它。

尾声

不论是红杉资本还是黄仁勋,都喜欢将当下称为“AI的IPhone时刻”。

初代IPhone发布于2007年。彼时,摩托罗拉、诺基亚才是手机市场的霸主,张小龙还在忙着做QQ邮箱,百度搜索的网页访问量每天都在增长,没人知道世界上*款智能手机到底会带来些什么。

然而,当乔布斯讲出那句“今天,苹果将重新发明手机”时,世界依旧为之沸腾,变革的伏笔已经埋下。相比于市面上的其他产品,初代IPhone的革新之处其实只有两个方面:一是取消了键盘,改用触屏设计;二是借鉴了电脑的设计,尝试在手机中加入浏览器、股票、天气等应用。

10年之后,初代IPhone的这两大设计已然成为了智能手机的设计标准,以此构建的移动互联网改写了数十亿人的生活。

沈抖曾在采访时提到,初代IPhone的出现,将手机分成了两类:智能手机与非智能手机,而非智能手机最终被淘汰了。大模型出来后,同样会把企业分成两类:一类是智能企业,一类是非智能企业——类似的故事有可能会再次上演。

关于大模型的未来,如今看来仍有些模糊,但唯有一点是确信的——新时代的序幕正缓缓拉开,一场重新定义时代的比赛已经开始。

参考资料

[1]China will dominate AI unless U.S. invests more, commission warns,Axios

[2]2019年AI实力对决:美国领跑,中国追赶,欧盟弱势,智东西

[3]乌镇指数:全球人工智能发展报告(2017)

[4]2021年人工智能行业发展白皮书

[5]中国人工智能软件及应用市场研究报告-2020,IDC

[6]2021年中国AI+安防行业发展研究报告,艾瑞咨询

[7]正在消失的机器视觉公司,脑极体

[8] Generative AI: A Creative New World,sequoia

[9]揭秘ChatGPT身后的AIGC技术和它的中国同行们,海通国际

[10]The Best Little Unicorn in Texas: Jasper Was Winning the AI Race—Then ChatGPT Blew Up the Whole Game,The Information

[11] AI Developers Stymied by Server Shortage at AWS, Microsoft, Google,The Information

关键词

最近更新