橘子百科-橘子都知道橘子百科-橘子都知道

一厢情愿是什么意思

一厢情愿是什么意思 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人ChatGPT火爆以来,微(wēi)软公(gōng)司(sī)创始人比尔(ěr)·盖茨已多次公开谈论人(rén)工智能(néng)话题。在最(zuì)近的一次采访中(zhōng),他再次表示:“AI可能(néng)会(huì)让科(kē)技行(xíng)业迎来一(yī)次(cì)剧烈(liè)的洗牌”。

这个结论是(shì)他在当地(dì)时间2月20日接受《In Good Company》节目(mù)专访(fǎng)时(shí)提出(chū)的。

他预期,AI的发展可能(néng)会威胁(xié)到谷(gǔ)歌的(de)市占率,因为微软(ruǎn)在AI方(fāng)面的行动相当(dāng)迅速。而最(zuì)终(zhōng)科技巨头将把AI整合成用户的“全能(néng)助手”,包(bāo)揽(lǎn)一(yī)切应(yīng)用,与人们(men)进行沟通并提供建议(yì),可以(yǐ)取(qǔ)代亚马(mǎ)逊(xùn)、Siri或(huò)Outlook等(děng)应用。

大(dà)佬口中全能助手(shǒu)的到来可(kě)能尚需时日,但由ControlNet引发的又一次AI绘画浪潮,让AIGC在ChatGPT的话题热点包围(wéi)中杀出重围。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正能量

01

ControlNet颠覆(fù)AI绘画新(xīn)玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上(shàng)一次爆火的时候,还(hái)是(shì)2022年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中(zhōng),一幅名为《太(tài)空(kōng)歌剧院》的作品获(huò)奖(jiǎng)。

随后各大(dà)厂商的AI绘(huì)画软件被(bèi)广(guǎng)大(dà)网友熟知并体(tǐ)验,Stable Diffusion便是其中代(dài)表。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进(jìn)入(rù)可控(kòng)期,将(jiāng)洗(xǐ)牌科(kē)技行业?_黑料正(zhèng)能量

用户们可以在应(yīng)用中(zhōng)输入一(yī)组关键词或(huò)者一张照片,就能获得一幅AI创作的画作。

作(zuò)画的(de)关(guān)键就(jiù)是(shì)所输(shū)入的文本(běn)。同一(yī)组关键词也可以创作出很多张风格不(bù)一(yī)样的画作(zuò),这让创作(zuò)的过(guò)程就像开盲盒。

很多用户(hù)很喜欢这种不确定的惊喜,他们会将生成的美图当做头像。而另一部分喜欢翻看AI绘画的“翻车”作品。在社(shè)交媒体上,许多用户分享AI“翻车现场”,例如,一(yī)位网友的小狗照片被AI画(huà)成了“肌肉男”,还有网友的个(gè)人照片被AI识(shí)别成了建筑。

而如今随着(zhe)ControlNet的出现与(yǔ)加持(chí),以往(wǎng)AI绘画的填写(xiě)关键词游(yóu)戏可能(néng)要(yào)被颠覆了。

ChatGPT之后(hòu)又(yòu)一应用杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业(yè)?_黑料正能量

ControlNet是一位正在斯坦(tǎn)福读博的中国人张吕(lǚ)敏创作的一种(zhǒng)基(jī)于控制点的(de)图像变(biàn)形(xíng)算(suàn)法,主要用于数字图像处理(lǐ)、计算机视觉(jué)和计算机图形学(xué)等(děng)领域(yù)。

其SD插件一经(jīng)发(fā)布,在短短的两天内便(biàn)成为了AI绘画领域最新的热点。

在此(cǐ)之(zhī)前,大(dà)家用了很多(duō)方法(fǎ)想(xiǎng)让AI生成(chéng)的结果(guǒ)尽(jǐn)可能的符(fú)合要(yào)求,但是都不尽如人意,它的(de)出现代表(biǎo)着(zhe)AI生(shēng)成开始(shǐ)进入真(zhēn)正的可控时期(qī)。

因(yīn)为(wèi)ControlNet可以直接(jiē)提取画面的构图,人(rén)物(wù)的(de)姿势和(hé)画(huà)面(miàn)的(de)深度信息等。有了它(tā)的帮助(zhù),就不用频繁的用提示词来碰(pèng)运气,抽盲盒式的创作(zuò)了。

通俗的说ControlNet相当于给AI绘画加了“魔(mó)法”,不少博主的(de)作品已经获(huò)得(dé)了大(dà)量的浏(liú)览(lǎn)量,“viggo”就是其中之一(yī),他用朋(péng)友(yǒu)的照片直接带(dài)她们(men)走进动漫(màn)世界。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进(jìn)入可控期,将洗牌科技行(xíng)业?_黑料正(zhèng)能量

viggo先(xiān)用StableDiffusion图片转(zhuǎn)文字。

再用Text2Prompt插件拓展找到对应的(de)关键词(cí);最后用ControlNet插件绑定骨(gǔ)骼开始换关键词试(shì)效果。

ChatGPT之后又一应(yīng)用(yòng)杀(shā)疯(fēng)了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑(hēi)料正能量

通过(guò)图片就可以(yǐ)看出来,效果十分(fēn)惊(jīng)艳。

ChatGPT之(zhī)后又(yòu)一应用(yòng)杀(shā)疯了,AIGC或进入可控期,将(jiāng)洗牌科技(jì)行业?_黑料正能量

ChatGPT之后又一应用杀(shā)疯了,AIGC或进(jìn)入(rù)可(kě)控(kòng)期(qī),将洗牌科(kē)技行业(yè)?_黑料正能量

更厉害(hài)的是,除了真实的照片,草图也(yě)可以加上“魔法(fǎ)”,知乎大牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还能(néng)实现线稿(gǎo)转(zhuǎn)全彩(cǎi)图。大神张吕敏(mǐn)其(qí)本(běn)尊也亲(qīn)自(zì)回应。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或(huò)进入可控(kòng)期,将(jiāng)洗(xǐ)牌科技行业?_黑(hēi)料(liào)正能量

不得不说当下AIGC已经变得越来越强大,甚至输出(chū)的作品(pǐn)都已经(jīng)能(néng)以假乱真了。

02

难(nán)辨虚实,AIGC技术力爆发

警惕安全问题

近日,“苏州金鸡湖(hú)有(yǒu)游艇party”的消(xiāo)息(xī)火遍(biàn)网(wǎng)络,而(ér)经(jīng)过警方辟谣这(zhè)所(suǒ)谓的“party”可能(néng)是全(quán)国第(dì)一起AI绘图诈骗。

由于这个活动(dòng)里(lǐ)面给出(chū)的美女(nǚ)照片(piàn)都是(shì)AI制作的真人照片绘图,因(yīn)为太(tài)逼真,被(bèi)大家当成真(zhēn)事传(chuán)播(bō)了(le)

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗(xǐ)牌科(kē)技行业(yè)?_黑料(liào)正能量

不过仔细观察可以(yǐ)发现,活动发起者提供的照(zhào)片(piàn)中有个很大(dà)的漏洞可以发现并(bìng)非真人,而是(shì)AI绘图,那(nà)便是图片(piàn)中(zhōng)女性的手指部分(fēn)有的存在异常。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌科技行(xíng)业?_黑料正能量(liàng)

有(yǒu)行业人(rén)事表(biǎo)示:“现在因为手指(zhǐ)部(bù)分的绘画算法比较复杂,AI还不太会画人的手,但最新看(kàn)到的图片(piàn)已(yǐ)经有(yǒu)越来越完美(měi)的AI模型(xíng)出(chū)现,以后(hòu)可能(néng)就完全(quán)没有漏洞了。

类似(shì)的AI作图(tú)诈骗在国(guó)外(wài)也已有发生。据英国广播公(gōng)司(sī)报(bào)道,土耳其地震期间,有Tiktok用户(hù)使用AI合(hé)成了儿童受(shòu)灾的假照片发(fā)布到网络,以此诱骗善良的人(rén)打赏“捐助”从(cóng)而(ér)实施诈骗。

目前随着技术发展,AIGC已(yǐ)经能(néng)做出真人照(zhào)片般的绘(huì)图(tú)效果,如果这样的图片被用来诈(zhà)骗(piàn),将(jiāng)非常可怕。

此(cǐ)外AIGC还引发了很(hěn)多担忧,一方面,批判(pàn)者认(rèn)为AI在“学习”了大(dà)量前人(rén)的作品之后,其创(chuàng)作没(méi)有(yǒu)任何情绪和灵魂,难以和人类(lèi)的艺(yì)术创作(zuò)相提并(bìng)论。

另一方面,AIGC背后的版权、目(mù)前都并没有(yǒu)得到有(yǒu)效的解(jiě)决,还有AIGC会不(bù)会代替人类“至高无上”的(de)创意。

马斯(sī)克(kè)也强调,人工(gōng)智能的(de)安全问(wèn)题需要得(dé)到重视,太(tài)晚就来不及了。

03

AIGC下(xià)一(yī)站除了(le)视频,还有远方

技术都是有两面性(xìng)的(de),潜(qián)在的危(wēi)害并不能掩盖其光(guāng)辉(huī)的贡献。现在(zài)看来,人(rén)工智能(néng)技术将是第四次工业革(gé)命(mìng)的核心驱动力(lì)量,将创(chuàng)造新的(de)增长奇迹。

过去一年,人工智能在(zài)技术和商业层面都有了巨大(dà)进展,AI绘(huì)画就是人(rén)工(gōng)智能技术发(fā)生方向性改变的一(yī)个代表。其下(xià)一站(zhàn)或许就是视频。

此前,Meta和(hé)谷歌先(xiān)后发布了几条引爆科(kē)技(jì)圈的短(duǎn)视(shì)频。这些(xiē)视(shì)频引发关注并非内容做得多优秀,反而都非常简单(dān),比如一匹正在喝(hē)水的马,一只(zhǐ)画(huà)画的玩具熊,或(huò)者一(yī)段(duàn)骑(qí)摩托车的第一视角录像,随便一个有手机的人都可以随手录(lù)下一段。

ChatGPT之后又一应用杀疯了,AIG<span style='color: #ff0000; line-height: 24px;'>一厢情愿是什么意思</span>C或进入(rù)可控期,将(jiāng)洗牌科(kē)技行业?_黑(hēi)料(liào)正能量

但这些(xiē)短(duǎn)视频(pín)的创(chuàng)作方(fāng)式非(fēi)常简单,创(chuàng)作(zuò)者仅仅(jǐn)需要向AI输入一段话(huà),甚至(zhì)只(zhǐ)是(shì)说一下要求,AI就(jiù)可以(yǐ)根(gēn)据需(xū)要生成一段视频。

谷歌发布的(de)两个(gè)AI生成视频分别来(lái)自于Imagen Video和Phenaki,前者主(zhǔ)要突出的(de)是高(gāo)清,与Meta的Ma一厢情愿是什么意思ke-A-Video没有太(tài)多的差别。

在Make-A-Video公布了AI生成(chéng)的视频(pín)后,AI圈(quān)就(jiù)已经玩了一(yī)波梗(gěng),一个能够做出(chū)更高清视频的AI还不足(zú)以在(zài)短时间内戳中兴奋点。

Phenaki更加令人震惊(jīng)的地方(fāng)在于,它可以制作出超(chāo)过(guò)2分钟的连贯的也(yě)有(yǒu)确切内容的视频(pín),这才是真(zhēn)正让(ràng)人们感到惊(jīng)喜的地方。因为(wèi)无论AI生成的(de)视频多么高清,也只能是(shì)为内容(róng)生产(chǎn)者提供一个灵感,一个素材,一(yī)个过(guò)场动(dòng)画。

不过能够(gòu)制作出有具(jù)体剧(jù)情内容的视频就意味(wèi)着,一些视频创作由(yóu)AI代(dài)替人工完成已经初(chū)步(bù)有了可(kě)能。

当下AI的发展速(sù)度(dù)已经超过(guò)大部分人的想象(xiàng)。内(nèi)容产业的本质是(shì)供给创造需求,AIGC作为(wèi)全新的内(nèi)容生(shēng)产方式,可以为内容产业带来(lái)更新的内容风格、更(gèng)快(kuài)的生(shēng)产速度,更低(dī)的生产成(chéng)本,这无疑会驱动内容产业的大爆(bào)发。

除(chú)了AI绘图、视频,AIGC技术还能应(yīng)用于音乐(lè)、代码、机器(qì)人动作(zuò)等多种内容形式的生成。不难发(fā)现该(gāi)项(xiàng)技术不仅在游戏等行业能得到有效应用,对于下一代互(hù)联网各种元素(sù)的构(gòu)建亦有关(guān)键意义。

从商业化的角(jiǎo)度来看(kàn),文化娱乐、教育、传媒(méi)等诸多领域,本(běn)身就对基(jī)于AI的可视化内容有强烈需求(qiú)。

因此,AI绘画及(jí)视频(pín)或(huò)不(bù)是结果,而只是AI进程(chéng)中的一块重要拼图,有望在技(jì)术更新的加持下实现更大的应(yīng)用价值。

AI从理解(jiě)内容,走向了(le)可(kě)以生成内容(róng),甚(shèn)至能(néng)够创造出独(dú)立价值和独(dú)立(lì)视角的(de)内容。AIGC的(de)再次出(chū)圈,更代表着未来的先进生产力即将到来。

ChatGPT之后又(yòu)一(yī)应用杀疯了(le),AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正(zhèng)能量

04

紧抓大模型与算(suàn)力,牢固AIGC底座

从技(jì)术(shù)的发展(zhǎn)也可以看出,在语言大模型、图像大模型之后,多模(mó)态大模型已经成(chéng)为了(le)新的趋势。

大(dà)模型被誉为当前人(rén)工智能发(fā)展(zhǎn)的智(zhì)能底座,是全球竞争最(zuì)激烈的研(yán)究方向之一,包括(kuò)谷歌、亚(yà)马(mǎ)逊、百(bǎi)度、阿里、腾讯等众(zhòng)多(duō)头部企(qǐ)业都在竞相发力。

不过训练大模型的确价格不菲,以国盛证(zhèng)券(quàn)发布的《ChatGPT需(xū)要(yào)多少(shǎo)算力》报告估算,GPT-3训练一次的成本约为140万美元。而(ér)对(duì)于(yú)一些更大的LLM(大型语(yǔ)言模(mó)型),训练成本则介(jiè)于200万美(měi)元至1200万(wàn)美(měi)元高价(jià)之间。

以ChatGPT在(zài)2023年1月的独立访客(kè)平均数(shù)1300万计算(suàn),其对应芯片需求为(wèi)3万(wàn)多片(piàn)英伟达A100 GPU,初(chū)始投入成本约为(wèi)8亿美元,每日仅电(diàn)费(fèi)就在5万(wàn)美元左(zuǒ)右。

ChatGPT之后又一应用杀(shā)疯(fēng)了(le),AIGC或进入(rù)可控(kòng)期,将洗(xǐ)牌科技行业?_黑料正能(néng)量

此外不(bù)论(lùn)是(shì)ChatGPT还是AIGC,都离不(bù)开庞(páng)大算(suàn)力支持(chí)。在(zài)关注各类(lèi)大模型(xíng)的发展同时,更(gèng)应该关注(zhù)算力(lì)网络的建设。

算力网络正驱动(dòng)AI产业(yè)发展进入史诗(shī)级加速(sù)进(jìn)程,让AIGC及通用(yòng)AI这一人工智(zhì)能发展的终极目(mù)标离得更近(jìn)。

因为算力(lì)可以对突破(pò)性(xìng)技(jì)术创新提供(gōng)大力的支持。这方面,多模态大模型是典(diǎn)型。作为(wèi)面向未来强人工(gōng)智能(néng)、通用人工(gōng)智能的重要(yào)技术创新,多(duō)模态(tài)大模型已经在人工智能(néng)领域提(tí)出了很多(duō)年,业界也有(yǒu)不少技术突破,但是,多模态大(dà)模型进一步往下走,算(suàn)力需求呈几(jǐ)何式上升,一般的(de)算力基(jī)础设施(shī)很快将难以胜任。

从图像、文字、语音单独一项的训练,到双模态、三模态的(de)跃迁,让人(rén)工智能可(kě)以灵活应对不同模态的转化、像人与世界交(jiāo)互一样自然,这方面,由算力网络来驱动将有明显优势。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正(zhèng)能(néng)量

此(cǐ)外(wài),还有很多需要爆发式增长的算力(lì)来支撑(chēng)的技术创(chuàng)新(xīn),将(jiāng)在人工智能算力网络支撑下快速推进。

AIGC已经露出(chū)曙光,期待在(zài)大模型和(hé)大(dà)算力的(de)支持下AIGC能持续颠(diān)覆内容生产的方(fāng)式,将创(chuàng)造(zào)的(de)边际成本降低(dī),让(ràng)万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 一厢情愿是什么意思

评论

5+2=