一厢情愿是什么意思-橘子百科-橘子都知道

一厢情愿是什么意思 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器(qì)人ChatGPT火爆以来，微(wēi)软公(gōng)司(sī)创始人比尔(ěr)·盖茨已多次公开谈论人(rén)工智能(néng)话题。在最(zuì)近的一次采访中(zhōng)，他再次表示：“AI可能(néng)会(huì)让科(kē)技行(xíng)业迎来一(yī)次(cì)剧烈(liè)的洗牌”。

这个结论是(shì)他在当地(dì)时间2月20日接受《In Good Company》节目(mù)专访(fǎng)时(shí)提出(chū)的。

他预期，AI的发展可能(néng)会威胁(xié)到谷(gǔ)歌的(de)市占率，因为微软(ruǎn)在AI方(fāng)面的行动相当(dāng)迅速。而最(zuì)终(zhōng)科技巨头将把AI整合成用户的“全能(néng)助手”，包(bāo)揽(lǎn)一(yī)切应(yīng)用，与人们(men)进行沟通并提供建议(yì)，可以(yǐ)取(qǔ)代亚马(mǎ)逊(xùn)、Siri或(huò)Outlook等(děng)应用。

大(dà)佬口中全能助手(shǒu)的到来可(kě)能尚需时日，但由ControlNet引发的又一次AI绘画浪潮，让AIGC在ChatGPT的话题热点包围(wéi)中杀出重围。

ChatGPT之(zhī)后又一应用杀疯了，AIGC或(huò)进入可控期，将洗牌科技行业？_黑料正能量

ControlNet颠覆(fù)AI绘画新(xīn)玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上(shàng)一次爆火的时候，还(hái)是(shì)2022年8月，在美国科罗拉多州举办的新兴数字艺术家竞赛中(zhōng)，一幅名为《太(tài)空(kōng)歌剧院》的作品获(huò)奖(jiǎng)。

随后各大(dà)厂商的AI绘(huì)画软件被(bèi)广(guǎng)大(dà)网友熟知并体(tǐ)验，Stable Diffusion便是其中代(dài)表。

用户们可以在应(yīng)用中(zhōng)输入一(yī)组关键词或(huò)者一张照片，就能获得一幅AI创作的画作。

作(zuò)画的(de)关(guān)键就(jiù)是(shì)所输(shū)入的文本(běn)。同一(yī)组关键词也可以创作出很多张风格不(bù)一(yī)样的画作(zuò)，这让创作(zuò)的过(guò)程就像开盲盒。

很多用户(hù)很喜欢这种不确定的惊喜，他们会将生成的美图当做头像。而另一部分喜欢翻看AI绘画的“翻车”作品。在社(shè)交媒体上，许多用户分享AI“翻车现场”，例如，一(yī)位网友的小狗照片被AI画(huà)成了“肌肉男”，还有网友的个(gè)人照片被AI识(shí)别成了建筑。

而如今随着(zhe)ControlNet的出现与(yǔ)加持(chí)，以往(wǎng)AI绘画的填写(xiě)关键词游(yóu)戏可能(néng)要(yào)被颠覆了。

ControlNet是一位正在斯坦(tǎn)福读博的中国人张吕(lǚ)敏创作的一种(zhǒng)基(jī)于控制点的(de)图像变(biàn)形(xíng)算(suàn)法，主要用于数字图像处理(lǐ)、计算机视觉(jué)和计算机图形学(xué)等(děng)领域(yù)。

其SD插件一经(jīng)发(fā)布，在短短的两天内便(biàn)成为了AI绘画领域最新的热点。

在此(cǐ)之(zhī)前，大(dà)家用了很多(duō)方法(fǎ)想(xiǎng)让AI生成(chéng)的结果(guǒ)尽(jǐn)可能的符(fú)合要(yào)求，但是都不尽如人意，它的(de)出现代表(biǎo)着(zhe)AI生(shēng)成开始(shǐ)进入真(zhēn)正的可控时期(qī)。

因(yīn)为(wèi)ControlNet可以直接(jiē)提取画面的构图，人(rén)物(wù)的(de)姿势和(hé)画(huà)面(miàn)的(de)深度信息等。有了它(tā)的帮助(zhù)，就不用频繁的用提示词来碰(pèng)运气，抽盲盒式的创作(zuò)了。

通俗的说ControlNet相当于给AI绘画加了“魔(mó)法”，不少博主的(de)作品已经获(huò)得(dé)了大(dà)量的浏(liú)览(lǎn)量，“viggo”就是其中之一(yī)，他用朋(péng)友(yǒu)的照片直接带(dài)她们(men)走进动漫(màn)世界。

viggo先(xiān)用StableDiffusion图片转(zhuǎn)文字。

再用Text2Prompt插件拓展找到对应的(de)关键词(cí)；最后用ControlNet插件绑定骨(gǔ)骼开始换关键词试(shì)效果。

通过(guò)图片就可以(yǐ)看出来，效果十分(fēn)惊(jīng)艳。

更厉害(hài)的是，除了真实的照片，草图也(yě)可以加上“魔法(fǎ)”，知乎大牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还能(néng)实现线稿(gǎo)转(zhuǎn)全彩(cǎi)图。大神张吕敏(mǐn)其(qí)本(běn)尊也亲(qīn)自(zì)回应。

不得不说当下AIGC已经变得越来越强大，甚至输出(chū)的作品(pǐn)都已经(jīng)能(néng)以假乱真了。

难(nán)辨虚实，AIGC技术力爆发

警惕安全问题

近日，“苏州金鸡湖(hú)有(yǒu)游艇party”的消(xiāo)息(xī)火遍(biàn)网(wǎng)络，而(ér)经(jīng)过警方辟谣这(zhè)所(suǒ)谓的“party”可能(néng)是全(quán)国第(dì)一起AI绘图诈骗。

由于这个活动(dòng)里(lǐ)面给出(chū)的美女(nǚ)照片(piàn)都是(shì)AI制作的真人照片绘图，因(yīn)为太(tài)逼真，被(bèi)大家当成真(zhēn)事传(chuán)播(bō)了(le)。

不过仔细观察可以(yǐ)发现，活动发起者提供的照(zhào)片(piàn)中有个很大(dà)的漏洞可以发现并(bìng)非真人，而是(shì)AI绘图，那(nà)便是图片(piàn)中(zhōng)女性的手指部分(fēn)有的存在异常。

ChatGPT之后又一应用杀疯了，AIGC或进入可控期(qī)，将洗牌科技行(xíng)业？_黑料正能量(liàng)

有(yǒu)行业人(rén)事表(biǎo)示：“现在因为手指(zhǐ)部(bù)分的绘画算法比较复杂，AI还不太会画人的手，但最新看(kàn)到的图片(piàn)已(yǐ)经有(yǒu)越来越完美(měi)的AI模型(xíng)出(chū)现，以后(hòu)可能(néng)就完全(quán)没有漏洞了。”

类似(shì)的AI作图(tú)诈骗在国(guó)外(wài)也已有发生。据英国广播公(gōng)司(sī)报(bào)道，土耳其地震期间，有Tiktok用户(hù)使用AI合(hé)成了儿童受(shòu)灾的假照片发(fā)布到网络，以此诱骗善良的人(rén)打赏“捐助”从(cóng)而(ér)实施诈骗。

目前随着技术发展，AIGC已(yǐ)经能(néng)做出真人照(zhào)片般的绘(huì)图(tú)效果，如果这样的图片被用来诈(zhà)骗(piàn)，将(jiāng)非常可怕。

此(cǐ)外AIGC还引发了很(hěn)多担忧，一方面，批判(pàn)者认(rèn)为AI在“学习”了大(dà)量前人(rén)的作品之后，其创(chuàng)作没(méi)有(yǒu)任何情绪和灵魂，难以和人类(lèi)的艺(yì)术创作(zuò)相提并(bìng)论。

另一方面，AIGC背后的版权、目(mù)前都并没有(yǒu)得到有(yǒu)效的解(jiě)决，还有AIGC会不(bù)会代替人类“至高无上”的(de)创意。

马斯(sī)克(kè)也强调，人工(gōng)智能的(de)安全问(wèn)题需要得(dé)到重视，太(tài)晚就来不及了。

AIGC下(xià)一(yī)站除了(le)视频，还有远方

技术都是有两面性(xìng)的(de)，潜(qián)在的危(wēi)害并不能掩盖其光(guāng)辉(huī)的贡献。现在(zài)看来，人(rén)工智能(néng)技术将是第四次工业革(gé)命(mìng)的核心驱动力(lì)量，将创(chuàng)造新的(de)增长奇迹。

过去一年，人工智能在(zài)技术和商业层面都有了巨大(dà)进展，AI绘(huì)画就是人(rén)工(gōng)智能技术发(fā)生方向性改变的一(yī)个代表。其下(xià)一站(zhàn)或许就是视频。

此前，Meta和(hé)谷歌先(xiān)后发布了几条引爆科(kē)技(jì)圈的短(duǎn)视(shì)频。这些(xiē)视(shì)频引发关注并非内容做得多优秀，反而都非常简单(dān)，比如一匹正在喝(hē)水的马，一只(zhǐ)画(huà)画的玩具熊，或(huò)者一(yī)段(duàn)骑(qí)摩托车的第一视角录像，随便一个有手机的人都可以随手录(lù)下一段。

但这些(xiē)短(duǎn)视频(pín)的创(chuàng)作方(fāng)式非(fēi)常简单，创(chuàng)作(zuò)者仅仅(jǐn)需要向AI输入一段话(huà)，甚至(zhì)只(zhǐ)是(shì)说一下要求，AI就(jiù)可以(yǐ)根(gēn)据需(xū)要生成一段视频。

谷歌发布的(de)两个(gè)AI生成视频分别来(lái)自于Imagen Video和Phenaki，前者主(zhǔ)要突出的(de)是高(gāo)清，与Meta的Ma一厢情愿是什么意思ke-A-Video没有太(tài)多的差别。

在Make-A-Video公布了AI生成(chéng)的视频(pín)后，AI圈(quān)就(jiù)已经玩了一(yī)波梗(gěng)，一个能够做出(chū)更高清视频的AI还不足(zú)以在(zài)短时间内戳中兴奋点。

Phenaki更加令人震惊(jīng)的地方(fāng)在于，它可以制作出超(chāo)过(guò)2分钟的连贯的也(yě)有(yǒu)确切内容的视频(pín)，这才是真(zhēn)正让(ràng)人们感到惊(jīng)喜的地方。因为(wèi)无论AI生成的(de)视频多么高清，也只能是(shì)为内容(róng)生产(chǎn)者提供一个灵感，一个素材，一(yī)个过(guò)场动(dòng)画。

不过能够(gòu)制作出有具(jù)体剧(jù)情内容的视频就意味(wèi)着，一些视频创作由(yóu)AI代(dài)替人工完成已经初(chū)步(bù)有了可(kě)能。

当下AI的发展速(sù)度(dù)已经超过(guò)大部分人的想象(xiàng)。内(nèi)容产业的本质是(shì)供给创造需求，AIGC作为(wèi)全新的内(nèi)容生(shēng)产方式，可以为内容产业带来(lái)更新的内容风格、更(gèng)快(kuài)的生(shēng)产速度，更低(dī)的生产成(chéng)本，这无疑会驱动内容产业的大爆(bào)发。

除(chú)了AI绘图、视频，AIGC技术还能应(yīng)用于音乐(lè)、代码、机器(qì)人动作(zuò)等多种内容形式的生成。不难发(fā)现该(gāi)项(xiàng)技术不仅在游戏等行业能得到有效应用，对于下一代互(hù)联网各种元素(sù)的构(gòu)建亦有关(guān)键意义。

从商业化的角(jiǎo)度来看(kàn)，文化娱乐、教育、传媒(méi)等诸多领域，本(běn)身就对基(jī)于AI的可视化内容有强烈需求(qiú)。

因此，AI绘画及(jí)视频(pín)或(huò)不(bù)是结果，而只是AI进程(chéng)中的一块重要拼图，有望在技(jì)术更新的加持下实现更大的应(yīng)用价值。

AI从理解(jiě)内容，走向了(le)可(kě)以生成内容(róng)，甚(shèn)至能(néng)够创造出独(dú)立价值和独(dú)立(lì)视角的(de)内容。AIGC的(de)再次出(chū)圈，更代表着未来的先进生产力即将到来。

紧抓大模型与算(suàn)力，牢固AIGC底座

从技(jì)术(shù)的发展(zhǎn)也可以看出，在语言大模型、图像大模型之后，多模(mó)态大模型已经成(chéng)为了(le)新的趋势。

大(dà)模型被誉为当前人(rén)工智能发(fā)展(zhǎn)的智(zhì)能底座，是全球竞争最(zuì)激烈的研(yán)究方向之一，包括(kuò)谷歌、亚(yà)马(mǎ)逊、百(bǎi)度、阿里、腾讯等众(zhòng)多(duō)头部企(qǐ)业都在竞相发力。

不过训练大模型的确价格不菲，以国盛证(zhèng)券(quàn)发布的《ChatGPT需(xū)要(yào)多少(shǎo)算力》报告估算，GPT-3训练一次的成本约为140万美元。而(ér)对(duì)于(yú)一些更大的LLM(大型语(yǔ)言模(mó)型)，训练成本则介(jiè)于200万美(měi)元至1200万(wàn)美(měi)元高价(jià)之间。

以ChatGPT在(zài)2023年1月的独立访客(kè)平均数(shù)1300万计算(suàn)，其对应芯片需求为(wèi)3万(wàn)多片(piàn)英伟达A100 GPU，初(chū)始投入成本约为(wèi)8亿美元，每日仅电(diàn)费(fèi)就在5万(wàn)美元左(zuǒ)右。

此外不(bù)论(lùn)是(shì)ChatGPT还是AIGC，都离不(bù)开庞(páng)大算(suàn)力支持(chí)。在(zài)关注各类(lèi)大模型(xíng)的发展同时，更(gèng)应该关注(zhù)算力(lì)网络的建设。

算力网络正驱动(dòng)AI产业(yè)发展进入史诗(shī)级加速(sù)进(jìn)程，让AIGC及通用(yòng)AI这一人工智(zhì)能发展的终极目(mù)标离得更近(jìn)。

因为算力(lì)可以对突破(pò)性(xìng)技(jì)术创新提供(gōng)大力的支持。这方面，多模态大模型是典(diǎn)型。作为(wèi)面向未来强人工(gōng)智能(néng)、通用人工(gōng)智能的重要(yào)技术创新，多(duō)模态(tài)大模型已经在人工智能(néng)领域提(tí)出了很多(duō)年，业界也有(yǒu)不少技术突破，但是，多模态大(dà)模型进一步往下走，算(suàn)力需求呈几(jǐ)何式上升，一般的(de)算力基(jī)础设施(shī)很快将难以胜任。

从图像、文字、语音单独一项的训练，到双模态、三模态的(de)跃迁，让人(rén)工智能可(kě)以灵活应对不同模态的转化、像人与世界交(jiāo)互一样自然，这方面，由算力网络来驱动将有明显优势。