模型材料

人工智能群星闪耀时

发布时间:2023/12/23 11:10:42   

总是需要无数的光阴无谓地流逝,才能等到一个真正具有历史意义的时刻——一个人类群星闪耀的时刻出现……我把它们称为人类群星闪耀的时刻,因为在这个人类难以企及、不朽的时间黑夜里,它们宛若星辰,刺破了黑暗,放射出永恒的光芒。

——斯蒂芬·茨威格《人类群星闪耀时》

人工智能出现以降,人类还从未在哪个时代感受过如此强烈的AI震撼。

从AI绘画到ChatGPT,从AI配音到AI作曲,从百度文心一言到谷歌Bard,才不到一年时间,与AI相关的各种最新产品、工具以日新月异(字面意义上)的速度刷新着我们的眼球,AIGC更作为一种全新的内容生产方式,成为各行各业眼下最炙手可热的名词。

此时此刻,AI正如繁星般闪烁在人类科技与文明的星穹。但对被AI群星照耀的人类而言,心里却多少有些五味杂陈——因为AI所散发的星光,未来也许会渐渐盖过人类的光芒。

AI形成的科技发展力,眼下正以前所未有的力量推动着人类发展史上“奇点时刻”加速到来,进而从实质上影响人类社会的运转机制,对人类重新进行价值排序。而人类,显然还没有做好充足的心理准备去应对即将到来的冲击。

智力竞技王庭的“弑君者”

倘若将AI对人类的追逐战比作一场SLG国战,那么拥有上帝视角的玩家会发现,AI正以惊人的速度蚕食着人类所剩无几的地盘,它所向披靡,一次次将人类的尊严打得支离破碎。

黑白相间的国际象棋棋盘是第一个没有硝烟的智力竞技战场。年,IBM研发的国际象棋AI“深蓝”向国际象棋世界冠军、特级大师卡斯帕罗夫发起挑战,以2:4落败;一年后,运行速度已达“深蓝”两倍之快的“更深的蓝”再战卡斯帕罗夫,并最终以3.5:2.5获胜。

国际象棋只是AI“攻城略地”的桥头堡,此后20年,AI一路摧城拔寨,相继攻克中国象棋、将棋等“重镇”,锋芒直指被誉为“人类智力竞技之首”的围棋。

要知道,人类一直对“围棋守卫战”心存一丝期望,这种底气源于围棋极高的复杂程度——基于19*19的格棋盘,围棋被公认为人类当之无愧的最难棋类游戏。从AI的视角来看,其业已征服的国际象棋每盘棋的总变化量约为10的次方,象棋的总变化量约为10的次方,而围棋却高达10的次方,以天文数字领先于前两者。因此当时棋坛普遍认为,AI还没有与人类九段高手正面交锋的能力。

但这一点小小的“侥幸”很快便被AI击溃。6年3月,谷歌旗下英国人工智能公司DeepMind研发的围棋AI阿尔法狗(AlphaGo)以4:1的比分战胜如日中天的韩国名将李世石,李世石仅在在第四局凭“神之一手”略微挽回人类颜面。

这是AI第一次在围棋之巅正面击败人类顶尖高手,自这一刻起,飞速发展的人工智能今后只会将人类越甩越远。“大敌”当前,时年20岁不到的中国天才棋手柯洁在微博上放出豪言:“就算阿尔法狗战胜了李世石,但它赢不了我。”

然而当柯洁坐到升级后的阿尔法狗(AlphaGoMaster版)面前,他才真正体悟到,他眼前的这台无情的计算机器究竟有多可怕。3:0,阿尔法狗以毫无悬念的比分轻取柯洁。

第三局比赛眼看大势已去,柯洁一度离场20分钟,独自一人痛饮血肉之躯与机器抗争的无力与迷茫。赛后面对媒体采访,柯洁哽咽道:“阿尔法狗太冷静、太完美了,不给你任何希望。我跟它下棋特别痛苦,只能猜它一半的棋,差距太大。这是我与人工智能的最后三盘棋。”

如果说AI在国际象棋、围棋领域的大获全胜,还只是穷举法或AI深度学习的胜利,那么德州扑克AI开始完虐人类赌神,则意味着AI已攻下人类智力博弈领域的最后一城——策略。

与国际象棋、围棋这类完美信息博弈不同,由于扑克对决中“隐藏信息”(即对手手中的未知牌)的存在,牌手在牌局中往往需要运用多种策略和心理博弈才能取得胜利,这些都是棋类游戏所不具备的。尤其是当AI来到德州扑克等多人牌局时,诸多不确定因素让其更加举步维艰。因此在很长一段时间内,德扑都被视作对AI的终极考验。

然而,即便是这最后一点“优越感”,人类也没能保住。

就在柯洁输给阿尔法狗升级版的同一年,美国卡耐基梅隆大学开发的人工智能Libratus在面对4名顶尖人类选手时(1v1轮流对决)取得了最终胜利;两年之后,Libratus又在6人德扑中力压5名人类赌神夺冠。这是AI首次在多人德扑中战胜人类,此时人类选手惊异地发现,AI已经开始在牌局中完全随机地使用混合策略——这本是人类一直在试图做的事。

7年Libratus与其他四名人类选手的比赛数据,橙色折线为AI得分

至此,在绝大多数人类与AI的智力竞技对决中,作为造物主的人类已然全面败北。而更令人沮丧的是,咄咄逼人的AI发展速度,让人们开始质疑人类的价值。

9年退役后,李世石接受采访时曾多次表示,“我学棋的时候围棋是艺术,但是AI让围棋沦为了游戏”,“蓝圆圈不过是概率统计罢了(即AI对棋盘上所有可下位置“蓝色圆圈”进行概率测算),围棋沦为游戏才会追求这种概率上的最高必然性。”

柯洁也在直播时直言:“AI让围棋无聊透顶,人类棋手已没有魅力,甚至找不到存在的意义。”而他直播间的名称则被其自嘲地改为“都什么年代了,还在下传统围棋”。

道心破碎后的世界名画:《只下围棋》

但AI从不会因为人类感情波动而停止前进的步伐。当人类仍在抱怨、恐惧着AI进步神速,阿尔法狗又再进一步。8年,DeepMind推出集将棋、国际象棋、围棋等功能于一身的人工智能AlphaZero。仅仅运行了8个小时,它就以:0的战绩碾压了其前辈阿尔法狗。

AlphaZero下国际围棋、将棋、围棋的胜率都极高

这个由人类亲手打开的潘多拉魔盒,正以超乎所有人想象的速度进行着“超进化”。不论是人类,还是AI自己,都不清楚其进化的终点在哪儿,更没有人知道,AI将把人类带向何方。

皇冠上最亮宝珠的“篡夺者”

“我来,我见,我征服”。公元前48年,凯撒大帝在泽拉战役中一举击败本都国王法尔纳克二世,随后这位征服者第一时间向罗马元老院送出了这份著名捷报。

而对AI来说,继征服智力游戏之后,其剑锋所指的是人类腹地——八大艺术之一的绘画。

或许任谁都不会想到,在人工智能概念提出60年后的今天,首先受到AI冲击的居然是创作行业。更让人类胆战心惊的是,相较于智力竞技型AI击败精英棋手、牌手在精神层面带来的沮丧与不忿,异军突起的AI绘画更可能颠覆人类苦心经营至今的创作秩序和行业生态,从业者丢掉饭碗只在旦夕之间。这是自绘画这一行当诞生以来从未有过的危机。

事实上,直到两年前,AI还只能绘出一团意义不明、近似于抽象画的电子垃圾。那个时候,也根本不会有画师和美术从业者意识到,这个襁褓之中的“幼稚婴孩”,将在一年后威胁到他们的营生,甚至可能撼动人类存续了数千年的艺术创作方式。

年初,美国人工智能非营利组织OpenAI推出了一个名为DALL-E的绘画AI,其名字由西班牙超现实主义绘画大师达利(Dali)和机器人瓦力(Wall-E)融合而来,操作者仅需输入文本信息,DALL-E就可以根据有限的Tag生成图像。但彼时,尚在蹒跚学步的DALL-E还只能绘制简单抽象的图像,线条勾勒和色块涂抹都相当粗糙,也很少人将这些拙笨的作品放在眼里。

DALL-E画的狐狸

而OpenAI免费向公众开放的DALL-E“青春版”DALL·Emini,更因相比原版更小的体量、更为粗糙的模型,成为“邪典”图片批量制造机、网络乐子人的欢乐源泉。

真正让人类开始正视AI绘画能力的,是DiffusionModel(扩散模型)的普及和应用。

DiffusionModel的原理与宇宙创世的过程莫名相似:宇宙自鸿蒙而生,从奇点慢慢演化为基本粒子、尘埃、星云以及大千世界;而依托于DiffusionModel的AI绘图则在空白中随机生成无数像素,然后再从像素中一点点浮现噪声、色块、结构,并完成最后的成像。但正是这种堪称“玄学”的绘图理论,为AI绘画插上了飞向人类艺术的伊卡洛斯之翼。

年2月,谷歌开发的DiscoDiffusion正式推出。基于DiffusionModel,该AI绘画可以做到稳定可控的图片输出。稍有不足的是,它产图速度慢,经常要几十分钟才能出图。

知名自由艺术家

疯景CrazyJN使用DD绘制的AI场景画

4月,OpenAI发布了DALL-E的升级版——DALL-E2。仅仅上线两个月,DALL-E2就已经能够绘出表情生动的五官,而且相比前代,2代的美术作品精细度显然高出不止一个数量级。

DALL-E2已经可以在原画基础上进行二次创作

6月,Midjourne工作室推出的同名绘画AI首次亮相。两个月后,一名参赛者通过Midjourne生成的画作《太空歌剧院》在美国科罗拉多州举行的一场艺术博览会上获颁数字艺术奖——且组委会是在明知该画是由AI绘画的前提下授此奖项的。据《太空歌剧院》作者透露,他只是在Midjourn中输入关键词,然后进行适当的微调和筛选就获得了最终成品。但就是这样,这幅画依然一举击败了人类所创作的画作。

此时,人们才猛然惊醒:人工智能,这个人类智慧的结晶,竟欲染指人类皇冠上的最后一颗明珠——艺术与创作。

但AI绘图的进化早已不可阻挡。年8月,英国人工智能团队stability.ai开源了AI模型StableDiffusion,该AI集出图速度快、关键词发散性强、绘图精准等优点于一身,最重要的是,SD免费向全网用户开放,于是一场铺天盖地的AI绘图浪潮就此到来。

此后基于StableDiffusion,短短半年时间,各路开发者就陆续推出了诸如Chilloutmix-Ni、LoRA、NovelAI、TextualInversion等如今已广为流传的衍生训练模型。而且,通过“喂养”不同画风、出自名家之手的作品,AI已对二次元、写实等主流绘画风格驾轻就熟。如果抛开个别细节不谈,你甚至很难仅靠肉眼分辨这些质感极高的作品究竟是出自AI还是人类之手。

B站

神游ちゃん

既然AI绘画走到这一步,真人风格的画作自然无法幸免。今年2月,一位名叫勘云工造的国人博主公布了一系列足以媲美真人的赛博Coser图片,效果几乎与Coser出片一般无二。看到栩栩如生的AI绘图,看客们的第一反应是:“我们还需要经过化妆、修图的真人Cosplay吗?”一时间,Cos圈和福利姬人人自危。

史尔特尔

勘云工造

这还不算完。2月14日,一位华人小哥、斯坦福大学计算机在读博士LvminZhang推出了一个可控性更强的AI绘画插件——ControlNet。之所以说它可控性强,是因为凭借该模型自带的“Openpose”扩展姿势控制模组,用户只需要输入简单的草图或骨骼图,AI就可以根据线稿自行绘制相应的图片,同时还一劳永逸地解决了AI不会画手的“世纪难题”。

到了3月,Midjourne最新版本V5已经可以根据关键词画出不同年代的真人和地域场景。

到这里,AI绘画从上手门槛、出图效率、性价比等多个维度对人工绘画完成了全方位包围,其用时之短、迭代之快、水准之高让人瞠乎其后,以至于你不敢想象一年多前,它的画作还那么贻笑大方,对人类画师来说显得那么“人畜无害”。

但生而为人,又怎能容忍AI抢走自己的生计?寒窗十载、苦练画技凭什么被AI一朝代替?

于是自年年底起,一场向AI绘画(当然也包括背后的使用者)的讨伐便浩浩荡荡地兴起于全球画师圈。但不管他们“兴师问罪”的初衷是AI喂养图片的版权归属问题,还是AI对手工创作价值的颠覆与背离,亦或真心实意地为人类艺术的尊严而战,这都是一场与所有创作者休戚相关的对决,其掀起的波澜没有谁可以置身事外。

社会生产合作的“颠覆者”

十九世纪六七十年代,如火如荼的第二次工业革命轰然而至,内燃机、电器推动并重构了社会生产力和劳动方式。其时,恩格斯在手稿《自然辩证法》上写道:“劳动创造了人本身”。

但在年后的今天,第四次工业革命(即智能化时代)的剧烈程度已远不止于再次促进社会劳动力发展,其“破坏力”足以重塑人类迄今为止建立的社会基本结构。

语言是传承人类文明的基石。雨果奖、星云奖双料得主,华裔科幻作家特德·蒋曾在短篇小说《你一生的故事》(电影《降临》原作)中,试图探讨“萨丕尔—沃尔夫假说”:语言如何决定思维方式。而如今,这场比AI绘画影响更广泛更深远的变革,其风起之地正是人与计算机的交互语言、人工智能的核心课题——NLP(自然语言处理)。

NLP的核心目的是理解人类语言的意义

7年,DeepMind率先在计算机RL(强化学习)的基础上提出RLHF(人类反馈强化学习)概念,首次将人类纳入AI训练的一环;同年,谷歌推出奠定了大语言模型(LLM)基础框架的全新架构Transformer,并基于该模型在8年发布全新AI语言模型——BERT。

不过,真正让Transformer横扫全球的却是DeepMind在AI领域的直接竞争对手,微软旗下的AI研究机构OpenAI。

8年6月,OpenAI推出当时还名不见经传的AI语言模型GPT-1。GPT-1的学习材料和参数分别只有5GB和1.17亿,它也只能进行一些简单的“文字接龙”游戏,既拼不过BERT“完形填空”式的语言方式,苦于算力和成本有限,又不能无节制扩大模型规模。即便年OpenAI已将GPT-3的学习材料扩大到45TB,参数提高到亿,普罗大众仍极少

转载请注明:http://www.aideyishus.com/lktp/6068.html

------分隔线----------------------------