压在玻璃窗边c，在窗户边c-橘子百科-橘子都知道

压在玻璃窗边c，在窗户边c ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人ChatGPT火爆(bào)以来(lái)，微软公司创始人比尔·盖(gài)茨已多次(cì)公开(kāi)谈论人工智能话题(tí)。在最近的(de)一次采访中(zhōng)，他再次表(biǎo)示：“AI可能会让(ràng)科技行业迎来一次剧烈的洗牌”。

这个结论是他在(zài)当地时间2月(yuè)20日接受《In Good Company》节目(mù)专访时提出的。

他预(yù)期，AI的发展可能会威胁到谷歌的市占(zhàn)率，因为(wèi)微软在AI方面的(de)行动相(xiāng)当迅(xùn)速。而最(zuì)终科技巨头将把AI整合成用户的“全能助手”，包揽一切应用(yòng)，与(yǔ)人(rén)们进行沟(gōu)通并提供建议，可以取代亚马逊、Siri或(huò)Outlook等应(yīng)用。

大佬口中全(quán)能助手的(de)到来(lái)可能尚需时(shí)日，但由ControlNet引发(fā)的(de)又一次AI绘画浪(làng)潮，让AIGC在ChatGPT的话题热点包围(wéi)中杀出重围。

ChatGPT之后(hòu)又一应(yīng)用(yòng)杀疯了，AIGC或进入可控期(qī)，将洗牌科(kē)技行业？_黑(hēi)料正能量

ControlNet颠(diān)覆(fù)AI绘画新玩法(fǎ)

AIGC向可控靠(kào)近

以AI绘画为代表的AIGC上一次(cì)爆火的时(shí)候，还是2022年8月，在美(měi)国(guó)科罗拉(lā)多州举办的(de)新兴数(shù)字艺(yì)术家竞赛中，一(yī)幅名为《太空歌剧院》的作品获奖。

随后各(gè)大(dà)厂商的(de)AI绘画软件被广大网友熟知并体验，Stable Diffusion便是其(qí)中代表。

用户(hù)们可以在应用中(zhōng)输入一组(zǔ)关(guān)键(jiàn)词或者一张照片(piàn)，就能获(huò)得(dé)一幅AI创作的画作。

作(zuò)画的关(guān)键就(jiù)是所输入(rù)的文本(běn)。同一组关键词也(yě)可(kě)以创作出很多张(zhāng)风(fēng)格不一样的画作，这让创作的过(guò)程就像开盲盒。

很(hěn)多用户很(hěn)喜欢这(zhè)种(zhǒng)不确定(dìng)的惊喜(xǐ)，他们会将(jiāng)生成(chéng)的美图当做头(tóu)像。而(ér)另(lìng)一部分喜欢翻看AI绘画的“翻(fān)车”作品。在社交媒体上，许多用户分享AI“翻车现(xiàn)场”，例(lì)如，一(yī)位网友的小狗照(zhào)片被AI画成了(le)“肌肉男(nán)”，还有网友的个人(rén)照片被AI识别成了建筑(zhù)。

而如(rú)今(jīn)随(suí)着ControlNet的出现与加持，以往AI绘画的填写关键(jiàn)词游戏可能要被(bèi)颠覆了。

ControlNet是一位正在(zài)斯坦福(fú)读(dú)博的(de)中国人张(zhāng)吕(lǚ)敏创作的一种(zhǒng)基于(yú)控(kòng)制点的图(tú)像变形(xíng)算法，主要用于数字图像处理(lǐ)、计(jì)算机(jī)视觉和(hé)计算机图形(xíng)学等领域。

其SD插件一经发(fā)布，在短短的两(liǎng)天内(nèi)便成(chéng)为了AI绘画领域最新(xīn)的热点。

在(zài)此之前(qián)，大家(jiā)用了很多方法想(xiǎng)让AI生成的结果(guǒ)尽可能(néng)的符合要(yào)求(qiú)，但是(shì)都不(bù)尽如(rú)人(rén)意，它的出现(xiàn)代(dài)表着(zhe)AI生(shēng)成开始进入真正(zhèng)的(de)可控时期。

因为ControlNet可以直接提取画面的(de)构图，人物的姿势和画面的深(shēn)度信(xìn)息等(děng)。有了它(tā)的帮助，就不用频繁(fán)的(de)用提示词来碰运气，抽盲盒式(shì)的创(chuàng)作了。

通俗的说ControlNet相当于给AI绘画(huà)加了“魔法”，不少博主的作品(pǐn)已经获得了大量的浏(liú)览量，“viggo”就是其中之一，他(tā)用朋友的照(zhào)片直接带她们走进动漫世界(jiè)。

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件拓展找到对应的关键词；最后用ControlNet插件绑定骨(gǔ)骼开始(shǐ)换(huàn)关键词试效果。

通(tōng)过图片就可以看(kàn)出来，效果十分惊(jīng)艳。

更厉(lì)害的是(shì)，除了(le)真(zhēn)实的照片，草图也(yě)可以(yǐ)加上“魔(mó)法”，知乎大(dà)牛“DevPoint”和“逗砂(shā)”介绍到(dào)ControlNet还能实现线稿转全彩(cǎi)图(tú)。大神张吕敏其本尊也亲自(zì)回应。

不得(dé)不说(shuō)当下AIGC已经变得越来越强大，甚至输(shū)出(chū)的(de)作品都已经能以假乱真(zhēn)了。

难(nán)辨虚实，AIGC技术力爆(bào)发

警惕安(ān)全问题

近日，“苏州金鸡湖有游艇party”的消息火遍网络，而(ér)经过警方辟谣这所谓的“party”可能是全国第一起AI绘图诈骗。

由于这个活(huó)动里面(miàn)给出的美女照(zhào)片(piàn)都是AI制作的真人照片绘图，因为太逼真，被大家当成真(zhēn)事(shì)传播了(le)。

不过仔细观察(chá)可以发现，活动发起者(zhě)提供的照片中有(yǒu)个很大的漏洞可以发(fā)现并非真(zhēn)人，而(ér)是AI绘图(tú)，那便是图片中女性的(de)手指部分有的存在异常。

ChatGPT之后(hòu)又一应(yīng)用杀疯了，AIGC或进(jìn)入可(kě)控期，将洗牌科技行(xíng)业？_黑料正能量

有行业(yè)人(rén)事表示(shì)：“现(xiàn)在因为手指部(bù)分的绘画算法比较复(fù)杂，AI还(hái)不太会(huì)画人(rén)的手，但最(zuì)新看(kàn)到的图片已经(jīng)有越来越完美的AI模型出现(xiàn)，以后可能(néng)就完全没有(yǒu)漏洞了。”

类似的(de)AI作图诈(zhà)骗在国外(wài)也已有(yǒu)发生。据英国广播公司报道(dào)，土耳其(qí)地震期间，有Tiktok用户使用AI合成了(le)儿童(tóng)受灾的(de)假(jiǎ)照(zhào)片(piàn)发布(bù)到网络，以此诱骗善良的人打赏“捐助”从(cóng)而实施诈骗。

目前随着(zhe)技(jì)术发展，AIGC已经能做出真人照片般的绘(huì)图(tú)效果，如果这(zhè)样的图(tú)片被用来诈骗，将非常可怕。

此外AIGC还引发了很多担(dān)忧，一方面，批(pī)判者认为AI在(zài)“学习”了大量前人的作品之后，其创作没有(yǒu)任何情绪和灵(líng)魂，难以和人(rén)类的艺术创作相提并(bìng)论。

另一方面，AIGC背后的版权、目(mù)前(qián)都并没(méi)有得到有效的解决，还(hái)有(yǒu)AIGC会不会代替人(rén)类“至高无上(shàng)”的创意。

马斯克(kè)也强(qiáng)调，人工智能(néng)的安全问题需要得到(dào)重(zhòng)视(shì)，太晚就来不及了(le)。

AIGC下(xià)一站除了视频，还有远方

技术都是有两(liǎng)面性的，潜在的危害(hài)并不能掩盖其光辉的贡献(xiàn)。现在看来，人(rén)工智能技术将是第四(sì)次工(gōng)业革命的核心驱动(dòng)力量，将(jiāng)创造(zào)新(xīn)的增长奇(qí)迹。

过去一年，人工(gōng)智能在技术和商业层面都有了巨大进展，AI绘(huì)画就是人工(gōng)智(zhì)能(néng)技术(shù)发生方向性改(gǎi)变(biàn)的(de)一个代表。其下一站或许就是(shì)视频。

此前，Meta和谷歌先后发布了几条(tiáo)引(yǐn)爆(bào)科技圈的(de)短视频(pín)。这些视频引发关注并非内容做得多优秀(xiù)，反而都非常简单，比如(rú)一匹正在喝(hē)水的(de)马，一(yī)只画(huà)画(huà)的玩具熊，或者一段(duàn)骑摩托车的第一视角(jiǎo)录(lù)像，随便一个有手机的人都(dōu)可以(yǐ)随(suí)手录下一段。

但这些短视(shì)频的创(chuàng)作方式非常简单，创(chuàng)作者仅仅需要向AI输入一(yī)段话，甚至只是(shì)说(shuō)一下要求(qiú)，AI就可以根据需(xū)要生成一段视频。

谷歌发布的两个(gè)AI生(shēng)成视频分别来(lái)自于Imagen Video和(hé)Phenaki，前者主(zhǔ)要突(tū)出的是高清，与Meta的(de)Make-A-Video没有太多的差别。

在Make-A-Video公布了AI生成的视(shì)频后，AI圈就已经玩了一波梗(gěng)，一个能(néng)够做出更高清视频的(de)AI还不足以在短时间内戳中兴(xīng)奋点。

Phenaki更(gèng)加令人震惊的(de)地方在于，它(tā)可以制作出(chū)超过2分钟的(de)连贯(guàn)的(d压在玻璃窗边c，在窗户边ce)也有确切内容的视频，这才是真正让人们感到惊(jīng)喜的地(dì)方。因为无论(lùn)AI生成的视(shì)频多(duō)么高(gāo)清，也只能是为内(nèi)容生产者(zhě)提供(gōng)一个(gè)灵感，一个(gè)素材(cái)，一个过场动画。

不(bù)过能够制作出有具体剧情内容的视频就意(yì)味着，一(yī)些视(shì)频创作由AI代替人工完成已经初步有了可(kě)能。

当下AI的发展速度已经超过(guò)大部分人的想(xiǎng)象(xiàng)。内容产业的(de)本质是(shì)供给(gěi)创造需求，AIGC作为全新(xīn)的内容生产方(fāng)式(shì)，可以为内容产业带来更新的(de)内(nèi)容风(fēng)格、更快的生产速度，更低(dī)的生产(chǎn)成本，这无疑(yí)会驱动内容(róng)产业的大爆发(fā)。

除了AI绘图(tú)、视频，AIGC技术还能应用于音乐、代码、机器人动(dòng)作等多种(zhǒng)内容形式(shì)的生成。不难发现该项技(jì)术不仅在游戏等行业能得到(dào)有效(xiào)应(yīng)用，对于下(xià)一(yī)代互联网各种元素的构建亦有(yǒu)关键意义(yì)。

从商(shāng)业(yè)化的(de)角度来(lái)看，文化娱乐、教育(yù)、传(chuán)媒等(děng)诸(zhū)多(duō)领(lǐng)域，本(běn)身就对基于AI的可视化内容有强烈需求。

因此，AI绘画及视频或不是(shì)结果，而只是AI进程中的一块重要拼图，有望在技术更新的(de)加持下实现更大的应用(yòng)价值。

AI从理解(jiě)内容(róng)，走(zǒu)向了可以(yǐ)生成内容(róng)，甚至(zhì)能够创(chuàng)造(zào)出(chū)独立价值(zhí)和独立视角的内(nèi)容。AIGC的再次(cì)出(chū)圈，更代表着未来的先进生产力(lì)即将到来(lái)。

紧(jǐn)抓大模型与算力(lì)，牢固AIGC底座

从技术的发(fā)展也(yě)可以看出，在语(yǔ)言大模型、图像大模型之后，多模态大(dà)模型已经(jīng)成为了新的趋势。

大模型被誉为当(dāng)前人工智(zhì)能发展的(de)智能底座，是(shì)全球(qiú)竞(jìng)争最激烈(liè)的研究方向之一，包括谷歌、亚马逊、百(bǎi)度、阿(ā)里、腾讯(xùn)等众(zhòng)多头(tóu)部企业都(dōu)在竞(jìng)相发力。

不过训练大模型的确价格不菲(fēi)，以国盛证券发布的(de)《ChatGPT需要多少(shǎo)算力(lì)》报告估算(suàn)，GPT-3训练一(yī)次的成本约(yuē)为140万(wàn)美元。而对(duì)于一(yī)些更大(dà)的LLM(大(dà)型(xíng)语言模型)，训练成本则介于200万美(měi)元至1200万美元高价(jià)之间(jiān)。

以(yǐ)ChatGPT在2023年1月的独立访客平(píng)均数1300万计算(suàn)，其对应芯(xīn)片(piàn)需求为3万(wàn)多片英伟达(dá)A100 GPU，初始投入成本约为8亿美元，每日仅电费就在5万美(měi)元(yuán)左(zuǒ)右。

此(cǐ)外不论(lùn)是ChatGPT还是AIGC，都离不开庞大算力支持。在关注各(gè)类(lèi)大模型的发展同(tóng)时(shí)，更应(yīng)该关(guān)注(zhù)算力网络的建设。

算(suàn)力网络正驱(qū)动AI产业发展进入史诗(shī)级加速进程，让AIGC及通用AI这一人工智(zhì)能(néng)发(fā)展的终极目标离得更近。

因(yīn)为(wèi)算力(lì)可以对突破性技术创新提供大(dà)力(lì)的支持(chí)。这方面，多模态大模型是典型(xíng)。作(zuò)为面(miàn)向未来强人工智能、通用人工(gōng)智(zhì)能的重要技术创新，多(duō)模(mó)态(tài)大模型已经在(zài)人工智能(néng)领域提出了(le)很多(duō)年(nián)，业界也有不少技术(shù)突(tū)破，但(dàn)是，多模态大模型进一步往下走，算力需求呈几何式上升(shēng)，一般的算力(lì)基础设施(shī)很快将(jiāng)难以(yǐ)胜任。

从图像、文字、语音单独一项的训(xùn)练，到双模(mó)态(tài)、三模态的跃迁，让人(rén)工智能可(kě)以灵活应对不(bù)同模态的转化、像人与世界交互(hù)一样自然，这方面，由算力网络(luò)来驱(qū)动(dòng)将(jiāng)有明(míng)显优势。