橘子百科-橘子都知道橘子百科-橘子都知道

压在玻璃窗边c,在窗户边c

压在玻璃窗边c,在窗户边c ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆(bào)以来(lái),微软公司创始人比尔·盖(gài)茨已多次(cì)公开(kāi)谈论人工智能话题(tí)。在最近的(de)一次采访中(zhōng),他再次表(biǎo)示:“AI可能会让(ràng)科技行业迎来一次剧烈的洗牌”。

这个结论是他在(zài)当地时间2月(yuè)20日接受《In Good Company》节目(mù)专访时提出的。

他预(yù)期,AI的发展可能会威胁到谷歌的市占(zhàn)率,因为(wèi)微软在AI方面的(de)行动相(xiāng)当迅(xùn)速。而最(zuì)终科技巨头将把AI整合成用户的“全能助手”,包揽一切应用(yòng),与(yǔ)人(rén)们进行沟(gōu)通并提供建议,可以取代亚马逊、Siri或(huò)Outlook等应(yīng)用。

大佬口中全(quán)能助手的(de)到来(lái)可能尚需时(shí)日,但由ControlNet引发(fā)的(de)又一次AI绘画浪(làng)潮,让AIGC在ChatGPT的话题热点包围(wéi)中杀出重围。

ChatGPT之后(hòu)又一应(yīng)用(yòng)杀疯了,AIGC或进入可控期(qī),将洗牌科(kē)技行业?_黑(hēi)料正能量

01

ControlNet颠(diān)覆(fù)AI绘画新玩法(fǎ)

AIGC向可控靠(kào)近

以AI绘画为代表的AIGC上一次(cì)爆火的时(shí)候,还是2022年8月,在美(měi)国(guó)科罗拉(lā)多州举办的(de)新兴数(shù)字艺(yì)术家竞赛中,一(yī)幅名为《太空歌剧院》的作品获奖。

随后各(gè)大(dà)厂商的(de)AI绘画软件被广大网友熟知并体验,Stable Diffusion便是其(qí)中代表。

ChatGPT之后又(yòu)一应用杀疯了(le),AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正能量

用户(hù)们可以在应用中(zhōng)输入一组(zǔ)关(guān)键(jiàn)词或者一张照片(piàn),就能获(huò)得(dé)一幅AI创作的画作。

作(zuò)画的关(guān)键就(jiù)是所输入(rù)的文本(běn)。同一组关键词也(yě)可(kě)以创作出很多张(zhāng)风(fēng)格不一样的画作,这让创作的过(guò)程就像开盲盒。

很(hěn)多用户很(hěn)喜欢这(zhè)种(zhǒng)不确定(dìng)的惊喜(xǐ),他们会将(jiāng)生成(chéng)的美图当做头(tóu)像。而(ér)另(lìng)一部分喜欢翻看AI绘画的“翻(fān)车”作品。在社交媒体上,许多用户分享AI“翻车现(xiàn)场”,例(lì)如,一(yī)位网友的小狗照(zhào)片被AI画成了(le)“肌肉男(nán)”,还有网友的个人(rén)照片被AI识别成了建筑(zhù)。

而如(rú)今(jīn)随(suí)着ControlNet的出现与加持,以往AI绘画的填写关键(jiàn)词游戏可能要被(bèi)颠覆了。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业?_黑料正能量

ControlNet是一位正在(zài)斯坦福(fú)读(dú)博的(de)中国人张(zhāng)吕(lǚ)敏创作的一种(zhǒng)基于(yú)控(kòng)制点的图(tú)像变形(xíng)算法,主要用于数字图像处理(lǐ)、计(jì)算机(jī)视觉和(hé)计算机图形(xíng)学等领域。

其SD插件一经发(fā)布,在短短的两(liǎng)天内(nèi)便成(chéng)为了AI绘画领域最新(xīn)的热点。

在(zài)此之前(qián),大家(jiā)用了很多方法想(xiǎng)让AI生成的结果(guǒ)尽可能(néng)的符合要(yào)求(qiú),但是(shì)都不(bù)尽如(rú)人(rén)意,它的出现(xiàn)代(dài)表着(zhe)AI生(shēng)成开始进入真正(zhèng)的(de)可控时期。

因为ControlNet可以直接提取画面的(de)构图,人物的姿势和画面的深(shēn)度信(xìn)息等(děng)。有了它(tā)的帮助,就不用频繁(fán)的(de)用提示词来碰运气,抽盲盒式(shì)的创(chuàng)作了。

通俗的说ControlNet相当于给AI绘画(huà)加了“魔法”,不少博主的作品(pǐn)已经获得了大量的浏(liú)览量,“viggo”就是其中之一,他(tā)用朋友的照(zhào)片直接带她们走进动漫世界(jiè)。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可(kě)控期,将(jiāng)洗(xǐ)牌(pái)科技行业?_黑料正能(néng)量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件拓展找到对应的关键词;最后用ControlNet插件绑定骨(gǔ)骼开始(shǐ)换(huàn)关键词试效果。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入可控(kòng)期(qī),将洗牌(pái)科(kē)技行业?_黑料正能(néng)量(liàng)

通(tōng)过图片就可以看(kàn)出来,效果十分惊(jīng)艳。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技行业?_黑料正能(néng)量(liàng)

ChatGPT之后又(yòu)一应(yīng)用杀疯了(le),AIGC或(huò)进入可控期,将洗(xǐ)牌(pái)科技(jì)行业?_黑料(liào)正能量

更厉(lì)害的是(shì),除了(le)真(zhēn)实的照片,草图也(yě)可以(yǐ)加上“魔(mó)法”,知乎大(dà)牛“DevPoint”和“逗砂(shā)”介绍到(dào)ControlNet还能实现线稿转全彩(cǎi)图(tú)。大神张吕敏其本尊也亲自(zì)回应。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可(kě)控期,将洗牌科技行业(yè)?_黑料正能量

不得(dé)不说(shuō)当下AIGC已经变得越来越强大,甚至输(shū)出(chū)的(de)作品都已经能以假乱真(zhēn)了。

02

难(nán)辨虚实,AIGC技术力爆(bào)发

警惕安(ān)全问题

近日,“苏州金鸡湖有游艇party”的消息火遍网络,而(ér)经过警方辟谣这所谓的“party”可能是全国第一起AI绘图诈骗。

由于这个活(huó)动里面(miàn)给出的美女照(zhào)片(piàn)都是AI制作的真人照片绘图,因为太逼真,被大家当成真(zhēn)事(shì)传播了(le)

ChatGPT之后(hòu)又(yòu)一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑(hēi)料正能量

不过仔细观察(chá)可以发现,活动发起者(zhě)提供的照片中有(yǒu)个很大的漏洞可以发(fā)现并非真(zhēn)人,而(ér)是AI绘图(tú),那便是图片中女性的(de)手指部分有的存在异常。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进(jìn)入可(kě)控期,将洗牌科技行(xíng)业?_黑料正能量

有行业(yè)人(rén)事表示(shì):“现(xiàn)在因为手指部(bù)分的绘画算法比较复(fù)杂,AI还(hái)不太会(huì)画人(rén)的手,但最(zuì)新看(kàn)到的图片已经(jīng)有越来越完美的AI模型出现(xiàn),以后可能(néng)就完全没有(yǒu)漏洞了。

类似的(de)AI作图诈(zhà)骗在国外(wài)也已有(yǒu)发生。据英国广播公司报道(dào),土耳其(qí)地震期间,有Tiktok用户使用AI合成了(le)儿童(tóng)受灾的(de)假(jiǎ)照(zhào)片(piàn)发布(bù)到网络,以此诱骗善良的人打赏“捐助”从(cóng)而实施诈骗。

目前随着(zhe)技(jì)术发展,AIGC已经能做出真人照片般的绘(huì)图(tú)效果,如果这(zhè)样的图(tú)片被用来诈骗,将非常可怕。

此外AIGC还引发了很多担(dān)忧,一方面,批(pī)判者认为AI在(zài)“学习”了大量前人的作品之后,其创作没有(yǒu)任何情绪和灵(líng)魂,难以和人(rén)类的艺术创作相提并(bìng)论。

另一方面,AIGC背后的版权、目(mù)前(qián)都并没(méi)有得到有效的解决,还(hái)有(yǒu)AIGC会不会代替人(rén)类“至高无上(shàng)”的创意。

马斯克(kè)也强(qiáng)调,人工智能(néng)的安全问题需要得到(dào)重(zhòng)视(shì),太晚就来不及了(le)。

03

AIGC下(xià)一站除了视频,还有远方

技术都是有两(liǎng)面性的,潜在的危害(hài)并不能掩盖其光辉的贡献(xiàn)。现在看来,人(rén)工智能技术将是第四(sì)次工(gōng)业革命的核心驱动(dòng)力量,将(jiāng)创造(zào)新(xīn)的增长奇(qí)迹。

过去一年,人工(gōng)智能在技术和商业层面都有了巨大进展,AI绘(huì)画就是人工(gōng)智(zhì)能(néng)技术(shù)发生方向性改(gǎi)变(biàn)的(de)一个代表。其下一站或许就是(shì)视频。

此前,Meta和谷歌先后发布了几条(tiáo)引(yǐn)爆(bào)科技圈的(de)短视频(pín)。这些视频引发关注并非内容做得多优秀(xiù),反而都非常简单,比如(rú)一匹正在喝(hē)水的(de)马,一(yī)只画(huà)画(huà)的玩具熊,或者一段(duàn)骑摩托车的第一视角(jiǎo)录(lù)像,随便一个有手机的人都(dōu)可以(yǐ)随(suí)手录下一段。

ChatGPT之后又一(yī)应(yīng)用杀疯(fēng)了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正(zhèng)能(néng)量

但这些短视(shì)频的创(chuàng)作方式非常简单,创(chuàng)作者仅仅需要向AI输入一(yī)段话,甚至只是(shì)说(shuō)一下要求(qiú),AI就可以根据需(xū)要生成一段视频。

谷歌发布的两个(gè)AI生(shēng)成视频分别来(lái)自于Imagen Video和(hé)Phenaki,前者主(zhǔ)要突(tū)出的是高清,与Meta的(de)Make-A-Video没有太多的差别。

在Make-A-Video公布了AI生成的视(shì)频后,AI圈就已经玩了一波梗(gěng),一个能(néng)够做出更高清视频的(de)AI还不足以在短时间内戳中兴(xīng)奋点。

Phenaki更(gèng)加令人震惊的(de)地方在于,它(tā)可以制作出(chū)超过2分钟的(de)连贯(guàn)的(d压在玻璃窗边c,在窗户边ce)也有确切内容的视频,这才是真正让人们感到惊(jīng)喜的地(dì)方。因为无论(lùn)AI生成的视(shì)频多(duō)么高(gāo)清,也只能是为内(nèi)容生产者(zhě)提供(gōng)一个(gè)灵感,一个(gè)素材(cái),一个过场动画。

不(bù)过能够制作出有具体剧情内容的视频就意(yì)味着,一(yī)些视(shì)频创作由AI代替人工完成已经初步有了可(kě)能。

当下AI的发展速度已经超过(guò)大部分人的想(xiǎng)象(xiàng)。内容产业的(de)本质是(shì)供给(gěi)创造需求,AIGC作为全新(xīn)的内容生产方(fāng)式(shì),可以为内容产业带来更新的(de)内(nèi)容风(fēng)格、更快的生产速度,更低(dī)的生产(chǎn)成本,这无疑(yí)会驱动内容(róng)产业的大爆发(fā)。

除了AI绘图(tú)、视频,AIGC技术还能应用于音乐、代码、机器人动(dòng)作等多种(zhǒng)内容形式(shì)的生成。不难发现该项技(jì)术不仅在游戏等行业能得到(dào)有效(xiào)应(yīng)用,对于下(xià)一(yī)代互联网各种元素的构建亦有(yǒu)关键意义(yì)。

从商(shāng)业(yè)化的(de)角度来(lái)看,文化娱乐、教育(yù)、传(chuán)媒等(děng)诸(zhū)多(duō)领(lǐng)域,本(běn)身就对基于AI的可视化内容有强烈需求。

因此,AI绘画及视频或不是(shì)结果,而只是AI进程中的一块重要拼图,有望在技术更新的(de)加持下实现更大的应用(yòng)价值。

AI从理解(jiě)内容(róng),走(zǒu)向了可以(yǐ)生成内容(róng),甚至(zhì)能够创(chuàng)造(zào)出(chū)独立价值(zhí)和独立视角的内(nèi)容。AIGC的再次(cì)出(chū)圈,更代表着未来的先进生产力(lì)即将到来(lái)。

ChatGPT之(zhī<span style='color: #ff0000; line-height: 24px;'><span style='color: #ff0000; line-height: 24px;'>压在玻璃窗边c,在窗户边c</span></span>)后又(yòu)一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料(liào)正能量(liàng)

04

紧(jǐn)抓大模型与算力(lì),牢固AIGC底座

从技术的发(fā)展也(yě)可以看出,在语(yǔ)言大模型、图像大模型之后,多模态大(dà)模型已经(jīng)成为了新的趋势。

大模型被誉为当(dāng)前人工智(zhì)能发展的(de)智能底座,是(shì)全球(qiú)竞(jìng)争最激烈(liè)的研究方向之一,包括谷歌、亚马逊、百(bǎi)度、阿(ā)里、腾讯(xùn)等众(zhòng)多头(tóu)部企业都(dōu)在竞(jìng)相发力。

不过训练大模型的确价格不菲(fēi),以国盛证券发布的(de)《ChatGPT需要多少(shǎo)算力(lì)》报告估算(suàn),GPT-3训练一(yī)次的成本约(yuē)为140万(wàn)美元。而对(duì)于一(yī)些更大(dà)的LLM(大(dà)型(xíng)语言模型),训练成本则介于200万美(měi)元至1200万美元高价(jià)之间(jiān)。

以(yǐ)ChatGPT在2023年1月的独立访客平(píng)均数1300万计算(suàn),其对应芯(xīn)片(piàn)需求为3万(wàn)多片英伟达(dá)A100 GPU,初始投入成本约为8亿美元,每日仅电费就在5万美(měi)元(yuán)左(zuǒ)右。

ChatGPT之后又一应(yīng)用杀(shā)疯了(le),AIGC或(huò)进入可(kě)控期(qī),将洗牌(pái)科技行业?_黑料正能量(liàng)

此(cǐ)外不论(lùn)是ChatGPT还是AIGC,都离不开庞大算力支持。在关注各(gè)类(lèi)大模型的发展同(tóng)时(shí),更应(yīng)该关(guān)注(zhù)算力网络的建设。

算(suàn)力网络正驱(qū)动AI产业发展进入史诗(shī)级加速进程,让AIGC及通用AI这一人工智(zhì)能(néng)发(fā)展的终极目标离得更近。

因(yīn)为(wèi)算力(lì)可以对突破性技术创新提供大(dà)力(lì)的支持(chí)。这方面,多模态大模型是典型(xíng)。作(zuò)为面(miàn)向未来强人工智能、通用人工(gōng)智(zhì)能的重要技术创新,多(duō)模(mó)态(tài)大模型已经在(zài)人工智能(néng)领域提出了(le)很多(duō)年(nián),业界也有不少技术(shù)突(tū)破,但(dàn)是,多模态大模型进一步往下走,算力需求呈几何式上升(shēng),一般的算力(lì)基础设施(shī)很快将(jiāng)难以(yǐ)胜任。

从图像、文字、语音单独一项的训(xùn)练,到双模(mó)态(tài)、三模态的跃迁,让人(rén)工智能可(kě)以灵活应对不(bù)同模态的转化、像人与世界交互(hù)一样自然,这方面,由算力网络(luò)来驱(qū)动(dòng)将(jiāng)有明(míng)显优势。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能量

此外,还(hái)有(yǒu)很多需要爆发式增长(zhǎng)的(de)算(suàn)力(lì)来支撑的(de)技术创新,将(jiāng)在人工(gōng)智能(néng)算(suàn)力网络支撑下快速推进(jìn)。

AIGC已经露出(chū)曙光,期待在大模型和(hé)大算力(lì)的支持下AIGC能持续颠覆内容生产的方式,将创造的边际(jì)成本降低,让万众(zhòng)受益。

未经允许不得转载:橘子百科-橘子都知道 压在玻璃窗边c,在窗户边c

评论

5+2=