变态另类巨浪：生成式AI的神话还能持续多久？（怪盗团新书首发）

发布日期：2024-08-10 03:05 点击次数：193

着手：市集资讯变态另类

互联网怪盗团的第三本原创文章《巨浪：生成式AI的史诗和现实》业已由电子工业出书社出书而况在各大文籍渠谈上架了。正好遭遇好意思国科技股结合两天暴跌、生成式AI主意短期可能见顶的时间，算是十分凑巧了。在此我想抒发一个我方对生成式AI的基本不雅点：在恒久，它必将透澈改革东谈主类社会的形态，乃至组成第四次工业创新的基础；在短期，它可能被高估了，尤其是被本钱市集高估。前者与后者互不妨碍，咱们齐既生存在短期、也生存在恒久，所谓恒久就是由一个又一个短期结合组成的。

半年多以前，当出书社剪辑提议我撰写一部对于生成式AI的书时，我一开动不太伤风：市面上这样的文章、文章依然许多了，莫得必要再镌脾琢肾。关联词，我的格调终究如故改革了，因为通过与几位在互联网大厂从事AI研发的一又友交流，我意志到了底下的事实：

国内对生成式AI产业的救援，很猛进度上是割裂的。手艺斥地者、惩办者、投资东谈主和分析师，各自看到了生成式AI的一部分，却缺少饱和的交流。至于圈外东谈主士，要想看清产业链的统统这个词图景，就更是难上加难了。生成式AI波及很是复杂的手艺细节。市面上大部分对于生成式AI的产业筹谋和普及读物，要么过度纠缠于手艺，导致非手艺东谈主员看不懂；要么基本不筹谋手艺，导致失去驻足点。找到均衡点是至关紧迫的。生成式AI的手艺特地太快了，当东谈主们还千里浸在Sora的轰动中时，GPT-5的公测依然提上了议事日程，更毋庸说飞速进化的开源大模子了。无论是专科还长短专科东谈主士，齐容易千里浸在星罗棋布的新信息当中，找不到焦点。

因此，我决定写一册出类拔萃的对于生成式AI的书。首先，它应该对AI产业和AI手艺夙昔多年的发展条理作念一个归来，以瀽瓴高屋的视角分析事物的全貌。其次，它应该深入浅出地筹谋AI尤其是生成式AI的缺欠手艺问题，但不应千里溺于这些问题。再次，它应该既波及西洋首先进的生成式AI产业，也波及中国在追逐中的生成式AI产业。终末，它应该脱离本钱市集的短期视角，尽量筹谋一些基本的、长久的问题，举例生成式AI到底要如何改进传统产业。

要针对生成式AI话题写一册有价值的、站得住脚的书并辞谢易。运气的是，我在互联网和科技行业领有许多值得信任的一又友。我一直以为，学习一件簇新事物最佳的顺序，就是先向靠得住的一又友推断，以他们的意见为驻足点。在本书收尾，我列出了赐与我强大匡助的一些专科东谈主士的名字。除此之外，还参考了生成式AI产业链的主要公司，包括英伟达、台积电、微软、谷歌、亚马逊、苹果、AMD……等等的财报和电话会议纪要。虽然本书只波及少许手艺问题，但仍然参考了几篇比较紧迫的AI手艺论文，在跋文中也一并致谢。

本书的截稿日历是2024年4-5月。在此之后，生成式AI行业又发生了许多强大变化，举例LLaMA-3发布、快手可灵发布、国产大模子价钱战、伊利亚离开OpenAI，等等等等。运气的是，本书的主要基调莫得过期，仍然是站得住脚的。要是读者有需要，来岁能够会进行一定进度的增补，以体现行业的新进展。

本书目次如下：

序生成式AI的一刹莅临

第一章 AI之春：一部正在进行的史诗

从“深蓝”到AlphaGo：两种迥然不同理念的斗争

李飞飞与ImageNet：东谈主工智能创新的最初“锤真金不怕火场”

神经蚁集与深度学习：“AI之春”的手艺基础

如日中天的谷歌AI帝国特地崩溃的预兆

第二章 OpenAI的崛起历程与统领之谈

为什么“天然语言处理”如斯紧迫

不疯魔，不成活：OpenAI以偏执狂的状貌打败谷歌

OpenAI内耗：“圣殿”之中究竟发生了什么

谷歌何故无法对OpenAI进行灵验的反击

第三章全球总动员：尖锐化的生成式AI战局

AI大模子的竞争阵势：独角兽vs巨头，开源vs闭源

支路仍然许多：悬而未决的大模子手艺问题

科技巨头的困局：是自研、团结，如故拥抱开源生态

把持战场：微软一马首先，但一切才刚刚开动

第四章算力战争：争夺第四次工业创新最紧迫的资源

英伟达：巧合性与势必性结合的传奇

台积电：难以逾越的全球芯片供应瓶颈

全球科技巨头的AI算力图夺战

对于AI算力的多少神话与现实

第五章生成式AI在中国的近况与畴昔

国产大模子近况：麻烦复杂的“2+N”阵势

国内AIGC把持：但愿与困惑

濒临AIGC波澜：矛盾的中国本钱市集

“同”与“不同”：AIGC波澜与当年的互联网波澜在中国

性爱巴士电影

第六章预计畴昔：AIGC对东谈主类社会的改革

戒指组织限制的紧迫性：从“东谈主月神话”提及

“咒语创业”期间：当《哈利·波特》的场景成为现实

“AI霸权”的兴起与专科白领阶级的调谢

供养东谈主类？“智能体”全面普及之后的社会

附录主要参考及学习贵府

以下段落摘自本书第二章第一节“为什么‘天然语言处理’如斯紧迫”，有删减。接待专家多提贵重意见！

伟大的筹画机科学家、形而上学家、逻辑学家阿兰·图灵(Alan Turing)于1941年发表了第一篇对于东谈主工智能的论文；很缺憾，其全文当今依然遗失。1950年，图灵发表了另一篇论文，提倡了“图灵测试”的主意。从那以后，“东谈主工智能”(AI)这个主意阅历了巨额次推广和演化，外延变得弄脏不清。什么齐不错是AI，没东谈主说得清AI到底是什么。

在玩游戏的时间，咱们会说“AI太强了”，有趣有趣是“由电脑戒指的敌东谈主太理智了”；在刷短视频的时间，咱们会说“AI怎么这样奇怪”，有趣有趣是“平台的保举算法不适应我的口味”；在使用扫地机器东谈主的时间，咱们也会说“AI调教的不太好”，有趣有趣是“扫地机器东谈主内置顺序无法很好地识别我家的地貌”。在通俗话境下，一切具备自动化和智能化属性的筹画机顺序，均会被咱们归入AI的行列，AI这个词因此失去了有趣有趣。

不管生手东谈主怎么看待AI，在东谈主工智能专科东谈主士的心目中，存在一颗“金冠上的明珠”，专家心向往之的此岸矿藏：通用东谈主工智能(AGI， Artificial General Intelligence)。这个主意最早在1997年被学术界提倡，其时如故所谓“AI隆冬期”。凭证谷歌DeepMind的界说，通用东谈主工智能应该同期在多个领域里展现出与东谈主类很是或者强于东谈主类的领悟智商。这样的AGI很容易让东谈主意想阿西莫夫科幻演义《我，机器东谈主》当中的智能机器东谈主。

游戏顶用来戒指敌东谈主的顺序，短视频平台的算法保举顺序，以及扫地机器东谈主的内置顺序，齐只适用于某个特定的、狭小的领域。就算在这个特定领域里，它们也不一定具备强于东谈主类的领悟智商，举例扫地机器东谈主对室内空间和地貌的领悟水平细则比不上熟练的保洁大姨。它们与通用东谈主工智能相去甚远。

迈向通用东谈主工智能，路在何方？莫得东谈主知谈，因为那是东谈主类从未涉足的领域。在2015年离开谷歌之后，伊利亚·苏茨克维与山姆·奥特曼团结建设了OpenAI，其方针从一开动就很明晰：为了早日竣事AGI而致力于。OpenAI培植了三个主攻标的，代表了通向AGI的三个可能旅途：

第一是实体机器东谈主。东谈主类生存在物理天下里，每天跟海量的物理实体打交谈，婴儿在学会话语之前就学会了爬行（有的还先学会了步辇儿）。OpenAI斥地了一个机器东谈主系统Dactyl，其最著名的效果是把持一个机器手臂玩魔方；到了2019年，Dactyl依然具备了收复三阶魔方的智商。就在合并时期，OpenAI还斥地了名为RoboSumo的假造场景，用于模拟现实天下的地形、征象、物体联系，假造机器东谈主不错在这里学习如何应回报杂的物理天下。

第二是玩游戏。虽然层见迭出的家长很歧视孩子玩游戏，但不可否定，游戏是东谈主类的天性，而电子游戏是游戏艺术的最高体式。深度学习的三种主要状貌是监督学习、强化学习和无监督学习，而游戏无疑是高效的强化学习状貌：打怪升级、过关、拿高分，对模子而言齐是很好的外部强化。OpenAI用于锤真金不怕火AI的游戏，既包括雅达利(Atari)等上古游戏主机上的不祥游戏，也包括DoTA2这样的复杂游戏。附带说一句，OpenAI对DoTA2的锤真金不怕火效果欠安，激发过不雅众的群嘲。

2019年，百度贴吧网友的预言：“OpenAI快倒闭了”，因为其DoTA2电竞AI发挥欠安

第三是天然语言。咱们每个东谈主每天齐生存在语言笔墨的包围中。哪怕是茕居的、阔别社会的东谈主，也不可能不阅读各式文本，以及通过电视、电话和互联网引子摄取各式语音书息。婴儿在学会最基本的肢体作为之后，就会开动牙牙学语。事实证据注解，天然语言是OpenAI下注最奏效的谈路，对于这一丝，后续章节将会张开叙述。

OpenAI押注的上述三个标的，恰好亦然谷歌猖狂押注的标的：在机器东谈主领域，Google Brain的手艺研发效果十分丰厚，谷歌收购过巨额个机器东谈主斥地团队，还在2019年推出了挑升为机器东谈主斥地服务的云平台。在游戏领域，DeepMind在围棋、《星际争霸2》上赢得的效果有目共睹。在天然语言领域，谷歌提倡的Transformer手艺阶梯，以及在此基础上推出的BERT大语言模子，直到2021年齐是毫无争议的领先者。其实这也不是恰恰，四色网站因为谷歌会对统统可能通向AGI的手艺阶梯齐押下重注，与其说它与OpenAI“勇士所见略同”，倒不如说前者的资源过于浑厚，十足粉饰了后者的领域。

从过后诸葛亮的角度看，天然语言处理(NLP， Neutral Language Processing)成为了对天下影响最大的芜杂口，也很有可能是通向AGI的正确旅途——对于这一丝，有些东谈主还有争议，但主流意见是认可的。为什么？这个天下上不错被相识、被救援的事物星罗棋布，东谈主类的语言笔墨虽然很紧迫，但是到底紧迫到什么地步？与前文提到过的图像识别、实体机器东谈主以及玩游戏比较，天然语言处理究竟有多“特殊”？这个问题看似不祥，实则十分复杂。

从实用方针的角度讲，东谈主类彼此交流的主要状貌是语言，能够救援天然语言的AI更容易跟东谈主交流。东谈主们但愿AI匡助处理的通俗事务，有一大部分齐是语言笔墨处理事务。即等于其他类型的AI，若能具备一定的天然语言智商，也会大幅普及东谈主类的使用体验。假想一下，当你家的扫地机器东谈主能够灵敏地鉴别你的语音教悔并以语音恢复时，你应该会眼睛一亮。ChatGPT发布之后引起的狂风暴雨的和顺，充分证据了东谈主类对于“能熟练使用东谈主类语言的AI”有何等期待。关联词，天然语言处理之是以成为东谈主类向AGI芜杂的主阵脚，除了实用角度之外，还有更深条理的原因。

看过《封神榜》的读者，应该还紧记商朝忠臣比干的故事：妲己借口为我方治病，要剖开比干的胸膛，取出“七窍玲珑心”。被摘心后的比干，面色煞白，照常骑着马离开朝歌王宫。执政歌的市集里，他碰见了一个妇东谈主（据说是妲己的同伙）在叫卖无心菜。比干停驻来问她：“东谈主无心如何？”妇东谈主恢复：“东谈主无心即死。”比干随即大喊一声，从速即摔下来，死了。

小时间我第一次读到这个故事时很猜忌：为什么比干被摘心了没事，听到“东谈主无心即死”就死了？笃信许多东谈主有一样的猜忌。其实，这是天下各民族神话据说中不时出现的一种设定：语言是有魅力的，天下的真相不错由语言“谈破”。故去多年的东谈主可能以为我方还辞世，直到被东谈主谈破“你其实早就死了”。在希腊古典形而上学里，存在名为“逻各斯”(Logos)的主意：它是天下的一般规矩、教导万物变化的瞒哄奢睿，在施行上是一种语言，华文有时间会翻译为“谈”。《新约·约翰福音》描述天主创造天下的历程，第一句话就是“元始有谈”，即天主是通过圣洁的语言创造天下的。

无论天下的施行是不是语言，东谈主类相识事物的状貌齐根植于语言。实验败露，一门语言的常用语序，举例“主谓宾”或“宾主谓”，往往会影响其使用者看待事物的状貌：前者可能倾向于优先和顺“主语”，后者可能倾向于优先和顺“宾语”。语言中的各式万般的词汇，组成了东谈主类脑海中的“分类系统”，在一定进度上决定了他们如何看待天下。语言自己是由东谈主类文化塑造的，而语言反过来又塑造了东谈主类文化。当咱们堕入千里念念的时间，咱们往往会在脑海顶用我方熟识的语言不竭地“默念”，念念考的历程就是用语言梳理周围环境的历程。

2015年，澳大利亚墨尔本大学的两位语言学家对澳大利亚西北海岸的一小群原住民的母语穆林帕特哈语(Murrinh-Patha)进行了深入筹谋。这是一种词序解放、主谓宾不错随便组合的语言。语言学家条款原住民不雅看一系列图片，然后用穆林帕特哈语证明图片里描述了什么。斥逐很真理：被试者的眼神会在图片里的各个对象之间马上地挪动，试图厘清它们之间的联系，这个历程往往会在几百毫秒内完成！这可能是因为他们的语言莫得固定的词序，是以他们必须先对图片造周详体相识，然后在脑海中组织语言。比较之下，母语为英语等“主谓宾”语言的被试者，一般倾向于先看“作为发出对象”（主语），再看“作为经受对象”（宾语）。在某种有趣有趣上，这些原住民的念念维全体性更强。

20世纪最伟大的形而上学家之一齐德维希·维特根斯坦(Ludwig Wittgenstein)有一句颇具争议的名言：“形而上学剩下的任务仅仅语言分析。”这句话包含两层含义：首先，东谈主类特地的历史就是形而上学领地消弱的历史，在东谈主类常识体系高度发展的情况下，形而上学的筹谋范围在不竭地被其他学科侵占，相识天下变成了天然科学的服务，相识东谈主类变成了社会科学的服务；留给形而上学的土地只剩下语言了。

其次，语言分析不错为形而上学的许多传统问题提倡解药。举例，客不雅天下确凿存在吗？除了我除外的其他东谈主具备自我意志吗？咱们如何着实地救援其他东谈主的嗅觉？维特根斯坦以为，无论对外部的客不雅天下，如故内心的主不雅天下，咱们齐是通过语言相识的；语言带有人人性，不存在只消我方能救援、别东谈主不行救援的“私东谈主语言”。而且语言自己就是一种行动。譬如说，咱们会用语言去道喜我方亲爱的东谈主，去悲痛我方的敌东谈主，去招呼一又友一齐玩耍。那种以为语言只代表内心感受、与行动对立的不雅点，是浅薄的、不值一驳的。相识天下的正确状貌不是搞“缸中之脑”“形而上学僵尸”这样的形而上学实验，而是从语言分析脱手！

自上而下等二排右三为中学期间的维特根斯坦；第一滑右一为他的同学阿谈夫·希特勒，1933-1945年任德国总理

在其最紧迫的文章之一《逻辑形而上学论》当中，维特根斯坦提倡：天下是一切事实的总额，而语言是一切命题的总额；命题是事实的“图像”，是以语言就是天下的“图像”。语言的规模就是天下的规模，那些“不可言说”的东西，就是咱们无法相识的。不外，维特根斯坦晚年的念念想又有了大转向，开动批判我方早年对语言的看法（但不是十足推翻）。无论如何，他对“语言与天下的联系”的描述，深入影响了一代又一代的形而上学家、语言学家、情愫学家。现代学术界的主流不雅点是：语言不仅是东谈主类彼此交流的器具，亦然东谈主类领悟和念念考的器具。要学习东谈主类的念念维状貌，语言就是最佳的切入点！

因此，咱们不错救援，为何天然语言处理成为了东谈主工智能界“显学中的显学”，以及为什么大语言模子具备如斯惊东谈主的效力和创造力。通过实体机器东谈主去相识天下的物理规矩，这天然很好，但并非东谈主类念念维状貌的支点；通过下围棋、玩游戏去提高我方的领悟水平，这也相称好，但也不是东谈主类念念维状貌的支点；学习并预测卵白质的结构，那长短常有用的，但与东谈主类念念维状貌的距离有点远。只消当神经蚁集模子熟练掌合手了东谈主类语言、能够与东谈主类以天然语言无缝交流时，它才确凿掌合手了东谈主类的念念维状貌，也就掌合手了东谈主类领悟范围内的“天下”。

无论当年OpenAI和GoogleBrain的科学家们有莫得读过维特根斯坦，他们应该早已救援天然语言对东谈主类念念维的有趣有趣，因为他们的通俗服务之一就是语言学、情愫学、领悟科学筹谋者打交谈。在深度学习创新以后，东谈主工智能变成了一个多学科交叉的筹谋领域，数理模子和代码仅仅基础设施，不行离开其他学科孤苦发展。自从2017年Transformer模子发布之后，谷歌在天然语言处理方面参预的资源有加无已，大语言模子就算不是谷歌AI帝国的中枢，至少亦然中枢之一。在OpenAI那边亦然如斯，尤其是在2019年经受微软投资之后，大语言模子基本成为了一切但愿方位。

在大语言模子方朝上，谷歌与OpenAI的手艺阶梯其实高度重合，仅在极少数问题上存在不同不雅点——这极少数问题恰是一切的缺欠方位。咱们知谈，东谈主类与黑猩猩的DNA有96%的相似性，但是前者建立了后光灿烂的闲雅，后者却只可在热带雨林和动物园里吃果实和树叶。底下就让咱们望望二者的手艺不合究竟在那儿，以及这些不合如何决定了竞争的输赢。

（由伊利亚·苏茨克维领衔的OpenAI筹谋团队以不可念念议的偏执状貌打败了谷歌，打赢了险些毫无胜算的战役，将生成式AI从涓涓细流变成巨浪，直到他戏剧性地在一场宫廷政变中失败并离开OpenAI为止。对于这一丝，笃信大部分东谈主略有耳闻变态另类，本书的第二章登第三章的一部分蚁集筹谋了这些话题。）

变态另类巨浪：生成式AI的神话还能持续多久？（怪盗团新书首发）

热点资讯

相关资讯

变态另类 巨浪：生成式AI的神话还能持续多久？（怪盗团新书首发）

热点资讯

相关资讯

变态另类巨浪：生成式AI的神话还能持续多久？（怪盗团新书首发）