人工智能群星闪耀时_模型材料发展

人工智能群星闪耀时

发布时间:2023/12/23 11:10:42

总是需要无数的光阴无谓地流逝，才能等到一个真正具有历史意义的时刻——一个人类群星闪耀的时刻出现……我把它们称为人类群星闪耀的时刻，因为在这个人类难以企及、不朽的时间黑夜里，它们宛若星辰，刺破了黑暗，放射出永恒的光芒。

——斯蒂芬·茨威格《人类群星闪耀时》

人工智能出现以降，人类还从未在哪个时代感受过如此强烈的AI震撼。

从AI绘画到ChatGPT，从AI配音到AI作曲，从百度文心一言到谷歌Bard，才不到一年时间，与AI相关的各种最新产品、工具以日新月异（字面意义上）的速度刷新着我们的眼球，AIGC更作为一种全新的内容生产方式，成为各行各业眼下最炙手可热的名词。

此时此刻，AI正如繁星般闪烁在人类科技与文明的星穹。但对被AI群星照耀的人类而言，心里却多少有些五味杂陈——因为AI所散发的星光，未来也许会渐渐盖过人类的光芒。

AI形成的科技发展力，眼下正以前所未有的力量推动着人类发展史上“奇点时刻”加速到来，进而从实质上影响人类社会的运转机制，对人类重新进行价值排序。而人类，显然还没有做好充足的心理准备去应对即将到来的冲击。

智力竞技王庭的“弑君者”

倘若将AI对人类的追逐战比作一场SLG国战，那么拥有上帝视角的玩家会发现，AI正以惊人的速度蚕食着人类所剩无几的地盘，它所向披靡，一次次将人类的尊严打得支离破碎。

黑白相间的国际象棋棋盘是第一个没有硝烟的智力竞技战场。年，IBM研发的国际象棋AI“深蓝”向国际象棋世界冠军、特级大师卡斯帕罗夫发起挑战，以2：4落败；一年后，运行速度已达“深蓝”两倍之快的“更深的蓝”再战卡斯帕罗夫，并最终以3.5：2.5获胜。

国际象棋只是AI“攻城略地”的桥头堡，此后20年，AI一路摧城拔寨，相继攻克中国象棋、将棋等“重镇”，锋芒直指被誉为“人类智力竞技之首”的围棋。

要知道，人类一直对“围棋守卫战”心存一丝期望，这种底气源于围棋极高的复杂程度——基于19*19的格棋盘，围棋被公认为人类当之无愧的最难棋类游戏。从AI的视角来看，其业已征服的国际象棋每盘棋的总变化量约为10的次方，象棋的总变化量约为10的次方，而围棋却高达10的次方，以天文数字领先于前两者。因此当时棋坛普遍认为，AI还没有与人类九段高手正面交锋的能力。

但这一点小小的“侥幸”很快便被AI击溃。6年3月，谷歌旗下英国人工智能公司DeepMind研发的围棋AI阿尔法狗（AlphaGo）以4：1的比分战胜如日中天的韩国名将李世石，李世石仅在在第四局凭“神之一手”略微挽回人类颜面。

这是AI第一次在围棋之巅正面击败人类顶尖高手，自这一刻起，飞速发展的人工智能今后只会将人类越甩越远。“大敌”当前，时年20岁不到的中国天才棋手柯洁在微博上放出豪言：“就算阿尔法狗战胜了李世石，但它赢不了我。”

然而当柯洁坐到升级后的阿尔法狗（AlphaGoMaster版）面前，他才真正体悟到，他眼前的这台无情的计算机器究竟有多可怕。3：0，阿尔法狗以毫无悬念的比分轻取柯洁。

第三局比赛眼看大势已去，柯洁一度离场20分钟，独自一人痛饮血肉之躯与机器抗争的无力与迷茫。赛后面对媒体采访，柯洁哽咽道：“阿尔法狗太冷静、太完美了，不给你任何希望。我跟它下棋特别痛苦，只能猜它一半的棋，差距太大。这是我与人工智能的最后三盘棋。”

如果说AI在国际象棋、围棋领域的大获全胜，还只是穷举法或AI深度学习的胜利，那么德州扑克AI开始完虐人类赌神，则意味着AI已攻下人类智力博弈领域的最后一城——策略。

与国际象棋、围棋这类完美信息博弈不同，由于扑克对决中“隐藏信息”（即对手手中的未知牌）的存在，牌手在牌局中往往需要运用多种策略和心理博弈才能取得胜利，这些都是棋类游戏所不具备的。尤其是当AI来到德州扑克等多人牌局时，诸多不确定因素让其更加举步维艰。因此在很长一段时间内，德扑都被视作对AI的终极考验。

然而，即便是这最后一点“优越感”，人类也没能保住。

就在柯洁输给阿尔法狗升级版的同一年，美国卡耐基梅隆大学开发的人工智能Libratus在面对4名顶尖人类选手时（1v1轮流对决）取得了最终胜利；两年之后，Libratus又在6人德扑中力压5名人类赌神夺冠。这是AI首次在多人德扑中战胜人类，此时人类选手惊异地发现，AI已经开始在牌局中完全随机地使用混合策略——这本是人类一直在试图做的事。

7年Libratus与其他四名人类选手的比赛数据，橙色折线为AI得分

至此，在绝大多数人类与AI的智力竞技对决中，作为造物主的人类已然全面败北。而更令人沮丧的是，咄咄逼人的AI发展速度，让人们开始质疑人类的价值。

9年退役后，李世石接受采访时曾多次表示，“我学棋的时候围棋是艺术，但是AI让围棋沦为了游戏”，“蓝圆圈不过是概率统计罢了（即AI对棋盘上所有可下位置“蓝色圆圈”进行概率测算），围棋沦为游戏才会追求这种概率上的最高必然性。”

柯洁也在直播时直言：“AI让围棋无聊透顶，人类棋手已没有魅力，甚至找不到存在的意义。”而他直播间的名称则被其自嘲地改为“都什么年代了，还在下传统围棋”。

道心破碎后的世界名画：《只下围棋》

但AI从不会因为人类感情波动而停止前进的步伐。当人类仍在抱怨、恐惧着AI进步神速，阿尔法狗又再进一步。8年，DeepMind推出集将棋、国际象棋、围棋等功能于一身的人工智能AlphaZero。仅仅运行了8个小时，它就以:0的战绩碾压了其前辈阿尔法狗。

AlphaZero下国际围棋、将棋、围棋的胜率都极高

这个由人类亲手打开的潘多拉魔盒，正以超乎所有人想象的速度进行着“超进化”。不论是人类，还是AI自己，都不清楚其进化的终点在哪儿，更没有人知道，AI将把人类带向何方。

皇冠上最亮宝珠的“篡夺者”

“我来，我见，我征服”。公元前48年，凯撒大帝在泽拉战役中一举击败本都国王法尔纳克二世，随后这位征服者第一时间向罗马元老院送出了这份著名捷报。

而对AI来说，继征服智力游戏之后，其剑锋所指的是人类腹地——八大艺术之一的绘画。

或许任谁都不会想到，在人工智能概念提出60年后的今天，首先受到AI冲击的居然是创作行业。更让人类胆战心惊的是，相较于智力竞技型AI击败精英棋手、牌手在精神层面带来的沮丧与不忿，异军突起的AI绘画更可能颠覆人类苦心经营至今的创作秩序和行业生态，从业者丢掉饭碗只在旦夕之间。这是自绘画这一行当诞生以来从未有过的危机。

事实上，直到两年前，AI还只能绘出一团意义不明、近似于抽象画的电子垃圾。那个时候，也根本不会有画师和美术从业者意识到，这个襁褓之中的“幼稚婴孩”，将在一年后威胁到他们的营生，甚至可能撼动人类存续了数千年的艺术创作方式。

年初，美国人工智能非营利组织OpenAI推出了一个名为DALL-E的绘画AI，其名字由西班牙超现实主义绘画大师达利（Dali）和机器人瓦力（Wall-E）融合而来，操作者仅需输入文本信息，DALL-E就可以根据有限的Tag生成图像。但彼时，尚在蹒跚学步的DALL-E还只能绘制简单抽象的图像，线条勾勒和色块涂抹都相当粗糙，也很少人将这些拙笨的作品放在眼里。

DALL-E画的狐狸

而OpenAI免费向公众开放的DALL-E“青春版”DALL·Emini，更因相比原版更小的体量、更为粗糙的模型，成为“邪典”图片批量制造机、网络乐子人的欢乐源泉。

真正让人类开始正视AI绘画能力的，是DiffusionModel（扩散模型）的普及和应用。

DiffusionModel的原理与宇宙创世的过程莫名相似：宇宙自鸿蒙而生，从奇点慢慢演化为基本粒子、尘埃、星云以及大千世界；而依托于DiffusionModel的AI绘图则在空白中随机生成无数像素，然后再从像素中一点点浮现噪声、色块、结构，并完成最后的成像。但正是这种堪称“玄学”的绘图理论，为AI绘画插上了飞向人类艺术的伊卡洛斯之翼。

年2月，谷歌开发的DiscoDiffusion正式推出。基于DiffusionModel，该AI绘画可以做到稳定可控的图片输出。稍有不足的是，它产图速度慢，经常要几十分钟才能出图。

知名自由艺术家

疯景CrazyJN使用DD绘制的AI场景画

4月，OpenAI发布了DALL-E的升级版——DALL-E2。仅仅上线两个月，DALL-E2就已经能够绘出表情生动的五官，而且相比前代，2代的美术作品精细度显然高出不止一个数量级。

DALL-E2已经可以在原画基础上进行二次创作

6月，Midjourne工作室推出的同名绘画AI首次亮相。两个月后，一名参赛者通过Midjourne生成的画作《太空歌剧院》在美国科罗拉多州举行的一场艺术博览会上获颁数字艺术奖——且组委会是在明知该画是由AI绘画的前提下授此奖项的。据《太空歌剧院》作者透露，他只是在Midjourn中输入关键词，然后进行适当的微调和筛选就获得了最终成品。但就是这样，这幅画依然一举击败了人类所创作的画作。

此时，人们才猛然惊醒：人工智能，这个人类智慧的结晶，竟欲染指人类皇冠上的最后一颗明珠——艺术与创作。

但AI绘图的进化早已不可阻挡。年8月，英国人工智能团队stability.ai开源了AI模型StableDiffusion，该AI集出图速度快、关键词发散性强、绘图精准等优点于一身，最重要的是，SD免费向全网用户开放，于是一场铺天盖地的AI绘图浪潮就此到来。

此后基于StableDiffusion，短短半年时间，各路开发者就陆续推出了诸如Chilloutmix-Ni、LoRA、NovelAI、TextualInversion等如今已广为流传的衍生训练模型。而且，通过“喂养”不同画风、出自名家之手的作品，AI已对二次元、写实等主流绘画风格驾轻就熟。如果抛开个别细节不谈，你甚至很难仅靠肉眼分辨这些质感极高的作品究竟是出自AI还是人类之手。

B站

神游ちゃん

既然AI绘画走到这一步，真人风格的画作自然无法幸免。今年2月，一位名叫勘云工造的国人博主公布了一系列足以媲美真人的赛博Coser图片，效果几乎与Coser出片一般无二。看到栩栩如生的AI绘图，看客们的第一反应是：“我们还需要经过化妆、修图的真人Cosplay吗？”一时间，Cos圈和福利姬人人自危。

史尔特尔

勘云工造

这还不算完。2月14日，一位华人小哥、斯坦福大学计算机在读博士LvminZhang推出了一个可控性更强的AI绘画插件——ControlNet。之所以说它可控性强，是因为凭借该模型自带的“Openpose”扩展姿势控制模组，用户只需要输入简单的草图或骨骼图，AI就可以根据线稿自行绘制相应的图片，同时还一劳永逸地解决了AI不会画手的“世纪难题”。

到了3月，Midjourne最新版本V5已经可以根据关键词画出不同年代的真人和地域场景。

到这里，AI绘画从上手门槛、出图效率、性价比等多个维度对人工绘画完成了全方位包围，其用时之短、迭代之快、水准之高让人瞠乎其后，以至于你不敢想象一年多前，它的画作还那么贻笑大方，对人类画师来说显得那么“人畜无害”。

但生而为人，又怎能容忍AI抢走自己的生计？寒窗十载、苦练画技凭什么被AI一朝代替？

于是自年年底起，一场向AI绘画（当然也包括背后的使用者）的讨伐便浩浩荡荡地兴起于全球画师圈。但不管他们“兴师问罪”的初衷是AI喂养图片的版权归属问题，还是AI对手工创作价值的颠覆与背离，亦或真心实意地为人类艺术的尊严而战，这都是一场与所有创作者休戚相关的对决，其掀起的波澜没有谁可以置身事外。

社会生产合作的“颠覆者”

十九世纪六七十年代，如火如荼的第二次工业革命轰然而至，内燃机、电器推动并重构了社会生产力和劳动方式。其时，恩格斯在手稿《自然辩证法》上写道：“劳动创造了人本身”。

但在年后的今天，第四次工业革命（即智能化时代）的剧烈程度已远不止于再次促进社会劳动力发展，其“破坏力”足以重塑人类迄今为止建立的社会基本结构。

语言是传承人类文明的基石。雨果奖、星云奖双料得主，华裔科幻作家特德·蒋曾在短篇小说《你一生的故事》（电影《降临》原作）中，试图探讨“萨丕尔—沃尔夫假说”：语言如何决定思维方式。而如今，这场比AI绘画影响更广泛更深远的变革，其风起之地正是人与计算机的交互语言、人工智能的核心课题——NLP（自然语言处理）。

NLP的核心目的是理解人类语言的意义

7年，DeepMind率先在计算机RL（强化学习）的基础上提出RLHF（人类反馈强化学习）概念，首次将人类纳入AI训练的一环；同年，谷歌推出奠定了大语言模型（LLM）基础框架的全新架构Transformer，并基于该模型在8年发布全新AI语言模型——BERT。

不过，真正让Transformer横扫全球的却是DeepMind在AI领域的直接竞争对手，微软旗下的AI研究机构OpenAI。

8年6月，OpenAI推出当时还名不见经传的AI语言模型GPT-1。GPT-1的学习材料和参数分别只有5GB和1.17亿，它也只能进行一些简单的“文字接龙”游戏，既拼不过BERT“完形填空”式的语言方式，苦于算力和成本有限，又不能无节制扩大模型规模。即便年OpenAI已将GPT-3的学习材料扩大到45TB，参数提高到亿，普罗大众仍极少

转载请注明:http://www.aideyishus.com/lktp/6068.html

------分隔线----------------------------

上一篇文章：读金庸的书学管理,HR要专还是要博
下一篇文章：没有了

热点文章

夏天自己做雪糕冰棒模具简单实用

人工智能群星闪耀时

最新文章

热点文章

推荐文章