橘子百科-橘子都知道橘子百科-橘子都知道

正、异、新,正异新的区分

正、异、新,正异新的区分 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人ChatGPT火(huǒ)爆以(yǐ)来,微软公司创始(shǐ)人(rén)比(bǐ)尔·盖(gài)茨(cí)已多次公(gōng)开谈论人工(gōng)智能话题。在最近的一次采访中,他再(zài)次表示:“AI可能会让(ràng)科技行(xíng)业迎(yíng)来(lái)一次剧(jù)烈的洗牌”。

这(zhè)个结(jié)论是(shì)他在当(dāng)地时间2月20日接受《In Good Company》节目专访(fǎng)时提出的。

他预期,AI的发展可能(néng)会威胁到谷歌的市占率,因为微软在AI方(fāng)面的行(xíng)动相当迅(xùn)速。而最终(zhōng)科(kē)技巨(jù)头将把AI整合成用(yòng)户的(de)“全(quán)能助手”,包揽一切应用,与人们进行沟(gōu)通并提供建议(yì),可以取(qǔ)代(dài)亚马逊、Siri或Outlook等应用。

大佬口中(zhōng)全能助手的到来可(kě)能尚需时日,但由ControlNet引发的又一次(cì)AI绘(huì)画浪潮,让AIGC在ChatGPT的话题热点包围中(zhōng)杀(shā)出重围。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期(qī),将(jiāng)洗(xǐ)牌(pái)科技行业?_黑料正能量正、异、新,正异新的区分cropy1="0" data-cropy2="503.46020761245677" data-ratio="0.503" data-s="300,640" data-type="jpeg" data-w="1000">

01

ControlNet颠(diān)覆AI绘画新玩法

AIGC向可(kě)控靠近

以AI绘画为代表的AIGC上(shàng)一次爆(bào)火的时候,还是2022年(nián)8月,在美国科(kē)罗拉多州举办的新兴数字(zì)艺术(shù)家竞赛中,一(yī)幅(fú)名为《太空(kōng)歌(gē)剧院》的作品获奖。

随后(hòu)各大厂商的AI绘画(huà)软件被广(guǎng)大网友熟知并(bìng)体验(yàn),Stable Diffusion便是其(qí)中代表。

ChatGPT之后(hòu)又一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料(liào)正能量

用户们可以在应用中输入一(yī)组关键词(cí)或者一张照片,就能获得(dé)一(yī)幅AI创作的画作(zuò)。

作画的关键就是所输入的文(wén)本。同一组(zǔ)关键(jiàn)词(cí)也可以创作出(chū)很(hěn)多(duō)张风格不一(yī)样的画作(zuò),这让(ràng)创作的过程(chéng)就像开盲(máng)盒。

很多(duō)用户很喜(xǐ)欢这种不确定的(de)惊喜(xǐ),他们会将生成的美图当做(zuò)头像(xiàng)。而另一部分喜欢翻看AI绘画的“翻车”作品(pǐn)。在社交媒体(tǐ)上,许多用(yòng)户分享AI“翻(fān)车现场”,例如,一位网(wǎng)友(yǒu)的小(xiǎo)狗照(zhào)片被AI画成了(le)“肌肉男”,还有网友的个人照(zhào)片被AI识别成了建筑(zhù)。

而如(rú)今随着(zhe)ControlNet的出现与加持,以往AI绘画的填(tián)写(xiě)关(guān)键词游戏可(kě)能要(yào)被颠覆了。

ChatGPT之(zhī)后又一(yī)应用杀疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌科(kē)技行业?_黑料正能(néng)量

ControlNet是(shì)一位正在斯坦福读博的中(zhōng)国人(rén)张吕(lǚ)敏创作(zuò)的(de)一(yī)种基于控制点的(de)图(tú)像变形(xíng)算法,主要用于(yú)数字图(tú)像处(chù)理、计算机视(shì)觉和计算机图(tú)形学等(děng)领域。

其SD插件一经发布(bù),在(zài)短短(duǎn)的(de)两天内便(biàn)成为了AI绘画领域最新的热点。

在此之(zhī)前,大家用了很多(duō)方(fāng)法想(xiǎng)让AI生成的结(jié)果尽(jǐn)可能的符合要求,但是都不尽如(rú)人意,它(tā)的出现代表着AI生成开始进(jìn)入真正的可控时期(qī)。

因为(wèi)ControlNet可以(yǐ)直接(jiē)提取画面的构图,人(rén)物的姿势和(hé)画面的深度信(xìn)息等(děng)。有了它(tā)的帮助,就不用(yòng)频繁的用提示词来碰运气,抽盲盒式的(de)创(chuàng)作了(le)。

通俗(sú)的说ControlNet相当于给AI绘画加了“魔(mó)法”,不(bù)少博主的作品已经获得了大(dà)量的浏览量,“viggo”就是其中之一,他用朋友的照片(piàn)直(zhí)接带她们走进(jìn)动(dòng)漫(màn)世界(jiè)。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或进入可(kě)控期(qī),将洗牌(pái)科(kē)技行业(yè)?_黑料正能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓正、异、新,正异新的区分展找到对应的关键词;最后用(yòng)ControlNet插件绑定骨骼开始换关键词试(shì)效果。

ChatGPT之后又(yòu)一应用(yòng)杀(shā)疯了,AIGC或(huò)进入可控(kòng)期(qī),将洗(xǐ)牌(pái)科(kē)技行业?_黑料正能量

通过(guò)图片就(jiù)可以看出(chū)来,效果(guǒ)十分惊(jīng)艳。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行(xíng)业(yè)?_黑料正能量

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入(rù)可控期,将洗牌科技(jì)行(xíng)业?_黑料正能(néng)量(liàng)

更厉(lì)害(hài)的是(shì),除了真实(shí)的照片,草图也可以(yǐ)加(jiā)上(shàng)“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现线稿(gǎo)转全(quán)彩图(tú)。大神张吕敏其(qí)本(běn)尊也亲自回应。

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业(yè)?_黑料正能量(liàng)

不得不(bù)说当下AIGC已经变得越来越(yuè)强大(dà),甚(shèn)至输出的作品都(dōu)已经能(néng)以假乱真了。

02

难辨虚实,AIGC技术(shù)力(lì)爆发

警惕安全(quán)问题

近日,“苏州金(jīn)鸡湖有游(yóu)艇party”的消息火遍(biàn)网络(luò),而经过警方(fāng)辟谣这所(suǒ)谓的“party”可能(néng)是全国(guó)第一起AI绘图诈骗。

由于这个活(huó)动里面给出的美女照片(piàn)都是AI制作的真人照(zhào)片绘图,因为太逼真,被大家当成真事传播了

ChatGPT之后又一(yī)应用杀疯了,AIGC或(huò)进入可控期,将洗(xǐ)牌科技行业?_黑料正能量

不过(guò)仔细观察(chá)可以发现,活(huó)动发(fā)起(qǐ)者提(tí)供的照片(piàn)中有个很大的漏洞可以发(fā)现并非(fēi)真(zhēn)人,而是AI绘(huì)图,那便是图(tú)片中女性的手指(zhǐ)部分有的(de)存(cún)在异常。

ChatGPT之(zhī)后(hòu)又一(yī)应用杀(shā)疯(fēng)了(le),AIGC或进入可控期(qī),将洗牌科技行业?_黑料(liào)正能量(liàng)

有行(xíng)业(yè)人事表(biǎo)示:“现在因为手指部分的绘画算法比较复杂,AI还不太会画人的(de)手,但最新看到的图(tú)片已经有(yǒu)越(yuè)来越完美的AI模型出现,以后(hòu)可能(néng)就完(wán)全没有漏洞(dòng)了。

类(lèi)似的AI作图(tú)诈骗在国外也已有发生。据英国广播公司报道,土耳(ěr)其地震期间,有(yǒu)Tiktok用户(hù)使用(yòng)AI合成了儿(ér)童受灾(zāi)的假(jiǎ)照片发布到网络,以此诱骗善良的人打赏“捐(juān)助”从而实施诈骗。

目前(qián)随着技(jì)术(shù)发(fā)展,AIGC已(yǐ)经能做(zuò)出真人照片(piàn)般的(de)绘(huì)图效果,如(rú)果(guǒ)这(zhè)样的图(tú)片(piàn)被用来(lái)诈骗,将非常可怕。

此外(wài)AIGC还引发(fā)了很多担忧,一方面(miàn),批判者认(rèn)为AI在(zài)“学习”了大量(liàng)前人(rén)的作品之后,其创作没有任(rèn)何情(qíng)绪和灵(líng)魂,难以(yǐ)和人(rén)类的艺术创作相提并论。

另一(yī)方(fāng)面,AIGC背后的版(bǎn)权、目前都并没有(yǒu)得(dé)到(dào)有效的解决,还有AIGC会不(bù)会代替人类“至(zhì)高无(wú)上”的创意。

马斯克也(yě)强(qiáng)调,人工智(zhì)能的(de)安全(quán)问题需要得(dé)到重视,太晚就来不及了。

03

AIGC下(xià)一站除了视频,还有远方

技术都(dōu)是有两(liǎng)面性的,潜在的危害并不(bù)能掩盖其(qí)光辉的贡献。现(xiàn)在看(kàn)来,人工智能技术将(jiāng)是第四次工业革命的核心驱动力量,将创造新(xīn)的增长奇迹。

过去一年,人工智能在技术和商业层(céng)面都有了(le)巨(jù)大进展,AI绘画就是人工(gōng)智能(néng)技(jì)术发(fā)生方(fāng)向性(xìng)改(gǎi)变的一(yī)个代表(biǎo)。其下一站或许(xǔ)就是(shì)视(shì)频。

此前,Meta和(hé)谷歌先后发布(bù)了(le)几条引爆科(kē)技圈的短视(shì)频。这些视频引发关(guān)注并非内容(róng)做(zuò)得多优(yōu)秀(xiù),反而都(dōu)非常简单,比如一匹正在(zài)喝水的马,一只(zhǐ)画画的玩具(jù)熊,或者一段骑摩托(tuō)车的第一视角录像,随(suí)便一(yī)个(gè)有手机的人都可以随手录下一(yī)段。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行(xíng)业?_黑料正能量

但这些短视频的创作方式(shì)非常(cháng)简(jiǎn)单,创作者仅仅需要向AI输入一段话,甚(shèn)至只是(shì)说(shuō)一下要(yào)求,AI就(jiù)可以根(gēn)据需要生成一段视(shì)频。

谷歌发布的两个(gè)AI生成视频分别来自于Imagen Video和(hé)Phenaki,前者主要(yào)突出的是高清,与Meta的(de)Make-A-Video没有太多的差(chà)别。

在(zài)Make-A-Video公(gōng)布(bù)了AI生成(chéng)的视频(pín)后,AI圈就已经玩(wán)了(le)一波梗,一个(gè)能够做出更高清(qīng)视频的AI还不(bù)足以(yǐ)在短时间内戳中兴奋点。

Phenaki更加令(lìng)人震惊的地方在于,它(tā)可(kě)以制作(zuò)出超过2分钟的连贯的也有(yǒu)确切内容的视频,这才(cái)是真(zhēn)正让人们感到惊喜的地(dì)方。因为无论AI生(shēng)成的视频多么高清,也只能是为内(nèi)容生(shēng)产者(zhě)提(tí)供一个灵感,一个素材,一个过场动画。

不过能(néng)够制作出有具体(tǐ)剧(jù)情内(nèi)容的视频就意味(wèi)着,一(yī)些(xiē)视频(pín)创作由AI代替人工完成已经初步有(yǒu)了可能(néng)。

当下AI的发展速度已(yǐ)经超过大部分人(rén)的想象。内容(róng)产(chǎn)业(yè)的本质是供(gōng)给创造(zào)需(xū)求,AIGC作为(wèi)全(quán)新的内容生产方式,可(kě)以为内(nèi)容产业带来(lái)更新(xīn)的内(nèi)容(róng)风格、更快(kuài)的生产速(sù)度,更低的生(shēng)产成本,这无疑会(huì)驱(qū)动内容产业的大(dà)爆发。

除了(le)AI绘图、视频,AIGC技术还能应用于音乐、代码、机器人动作(zuò)等多(duō)种内(nèi)容形式的生成。不难发现该项技术不(bù)仅在游戏等行业能得到(dào)有效应(yīng)用,对于下(xià)一代互联网各种元素的构(gòu)建(jiàn)亦(yì)有关键意(yì)义。

从商业化的角度来看,文(wén)化娱乐、教育、传媒等诸多(duō)领(lǐng)域(yù),本身就(jiù)对(duì)基于AI的可(kě)视(shì)化(huà)内容有强烈需(xū)求。

因此(cǐ),AI绘画及(jí)视(shì)频或不是结(jié)果(guǒ),而只是AI进程(chéng)中的(de)一(yī)块重(zhòng)要拼图,有望(wàng)在技术更新的加(jiā)持(chí)下实现(xiàn)更大(dà)的应用价值。

AI从理解内容,走向了可以生成(chéng)内容,甚(shèn)至能够创造(zào)出(chū)独立价值和独立视角的内容。AIGC的(de)再次出圈,更代表(biǎo)着未来的先进生产力即将到来。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗(xǐ)牌科技行业?_黑料(liào)正能(néng)量

04

紧抓大模型与算力(lì),牢(láo)固(gù)AIGC底座

从技术的发展也可以(yǐ)看出,在语言大模型(xíng)、图像大模(mó)型之后(hòu),多模态大模型已经成为了新的趋(qū)势。

大模型被誉(yù)为当前人工(gōng)智能发展的智能底座(zuò),是全球(qiú)竞争最激烈的(de)研究方向之一,包括谷(gǔ)歌(gē)、亚马逊(xùn)、百度、阿(ā)里、腾(téng)讯等(děng)众多头(tóu)部企业都在竞(jìng)相(xiāng)发(fā)力(lì)。

不过训练大模型的确(què)价格不菲(fēi),以国盛(shèng)证(zhèng)券发布的《ChatGPT需要多少算(suàn)力》报告估算,GPT-3训练(liàn)一次的成本约为140万美(měi)元。而对于(yú)一些更大的LLM(大(dà)型语言模(mó)型(xíng)),训练成(chéng)本则介(jiè)于200万美元至1200万(wàn)美元高价(jià)之间(jiān)。

以ChatGPT在(zài)2023年1月的独立访(fǎng)客平均数1300万计算,其(qí)对应(yīng)芯片(piàn)需求为3万多(duō)片英伟(wěi)达A100 GPU,初始投入成本(běn)约为8亿(yì)美元(yuán),每日(rì)仅电费就在5万美元(yuán)左右。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗(xǐ)牌科技行业?_黑料正能量

此外不论是ChatGPT还是AIGC,都离不开庞大算力支持。在关(guān)注(zhù)各类大模(mó)型(xíng)的发展同时(shí),更应该(gāi)关注算力网络(luò)的建设。

算力网络(luò)正驱动AI产业(yè)发展进入史诗级加(jiā)速进程,让AIGC及(jí)通用AI这一人工(gōng)智能发展的终极目标离得更近(jìn)。

因(yīn)为算力(lì)可以对(duì)突破性技术创新提供(gōng)大力(lì)的支(zhī)持。这方(fāng)面,多模态大模型是典型。作为(wèi)面(miàn)向未来(lái)强人工智能、通用人工智能的(de)重要技术创新,多模(mó)态(tài)大模型(xíng)已(yǐ)经在(zài)人工智能领域提出了很多年,业(yè)界也(yě)有不少技术突破,但是,多模态(tài)大(dà)模型进一步往下走(zǒu),算力需求呈几何式(shì)上升,一般(bān)的算力基(jī)础设施很快将难(nán)以胜任(rèn)。

从图像、文字、语音单独一项的训练,到(dào)双(shuāng)模态、三模态的跃迁,让人工智能可以灵(líng)活(huó)应对不同模态(tài)的转化、像人(rén)与(yǔ)世(shì)界交互一样自然(rán),这方面,由算力网络来驱动将(jiāng)有明显优势。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科(kē)技行(xíng)业?_黑(hēi)料(liào)正(zhèng)能量

此外,还(hái)有很多需要爆发式增长的算力(lì)来(lái)支撑的技术创新,将在人工智能算力网络支撑(chēng)下快速(sù)推进。

AIGC已经露出曙光,期待在大模型和大算力的(de)支(zhī)持下AIGC能持续颠覆(fù)内容生产的方式(shì),将创(chuàng)造的边际成本降(jiàng)低,让万众受益(yì)。

未经允许不得转载:橘子百科-橘子都知道 正、异、新,正异新的区分

评论

5+2=