橘子百科-橘子都知道橘子百科-橘子都知道

观摩和观看的区别和联系,观摩和观看的区别在哪

观摩和观看的区别和联系,观摩和观看的区别在哪 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以(yǐ)来,微软公司创始(shǐ)人比(bǐ)尔·盖茨已多(duō)次公开谈论人工智能话题。在(zài)最近的一(yī)次采访(fǎng)中,他再次表示(shì):“AI可能(néng)会让科技(jì)行业迎来一次剧(jù)烈的洗牌”。

这个结论是他在当地(dì)时间2月20日接受《In Good Company》节目专访时提出的。

他预期,AI的(de)发展可能(néng)会威(wēi)胁到谷歌的(de)市占率,因为微软在AI方面的行动相当迅速。而最终科(kē)技巨(jù)头将把(bǎ)AI整合成用户的(de)“全能助手”,包揽一切应用(yòng),与人们(men)进行(xíng)沟(gōu)通并(bìng)提供建议,可(kě)以取代(dài)亚马逊、Siri或Outlook等应用。

大佬(lǎo)口中全能(néng)助(zhù)手的(de)到来可(kě)能尚(shàng)需时日(rì),但由ControlNet引发的又一次AI绘画浪潮,让AIGC在ChatGPT的话(huà)题(tí)热点包围(wéi)中杀(shā)出重围。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或进入(rù)可控(kòng)期,将洗牌科技行业?_黑料正能量

01

ControlNet颠覆AI绘(huì)画新玩法

AIGC向可控靠近(jìn)

以AI绘画为代表的AIGC上一次(cì)爆(bào)火的时(shí)候(hòu),还是2022年(nián)8月(yuè),在(zài)美国科罗拉(lā)多州举办的新兴(xīng)数(shù)字艺术家竞赛中,一幅名为(wèi)《太空歌剧院》的作品获(huò)奖。

随后各大厂商的(de)AI绘(huì)画软件(jiàn)被广大网(wǎng)友(yǒu)熟(shú)知并体验,Stable Diffusion便是其中代表。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技(jì)行业?_黑料正能量

用户(hù)们可(kě)以(yǐ)在应(yīng)用中输入一组关键词或者一张照片(piàn),就能获得一幅AI创(chuàng)作的画作(zuò)。

作画的关键就是所输入的文本。同一组(zǔ)关键词也(yě)可以创作(zuò)出很多(duō)张风格(gé)不(bù)一样(yàng)的画作(zuò),这(zhè)让(ràng)创作的过程就像开(kāi)盲盒(hé)。

很多(duō)用户(hù)很喜欢这种不确定的惊喜,他们会将生(shēng)成(chéng)的美图当做头像。而(ér)另一部(bù)分喜欢翻看AI绘画(huà)的“翻(fān)车”作品。在社交媒体(tǐ)上,许多用户分享AI“翻车现场(chǎng)”,例如,一位网友(yǒu)的小(xiǎo)狗照(zhào)片被AI画成(chéng)了“肌肉(ròu)男”,还有(yǒu)网友的(de)个人照片被AI识别成(chéng)了建筑。

而如今(jīn)随着ControlNet的出现与加持,以往AI绘画(huà)的填写关键词(cí)游戏可能要被颠覆了。

ChatGPT之后又(yòu)一应用(yòng)杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业(yè)?_黑料正能量

ControlNet是一位正(zhèng)在(zài)斯坦福读博的中国人张吕敏(mǐn)创作的(de)一(yī)种基于(yú)控制点的(de)图像变(biàn)形算法,主要用于数(shù)字(zì)图像处(chù)理、计算(suàn)机视觉(jué)和计(jì)算(suàn)机图(tú)形学(xué)等领域。

其SD插(chā)件(jiàn)一经发布,在短短的两(liǎng)天内便(biàn)成为(wèi)了AI绘画领(lǐng)域最新(xīn)的热点。

在此之前,大家用了很多方法想(xiǎng)让AI生成的结果尽可能(néng)的符合(hé)要求,但是都(dōu)不尽如人意(yì),它的出(chū)现代表着(zhe)AI生成(chéng)开始(shǐ)进入真正的(de)可控时(shí)期。

因为ControlNet可以直接提取画(huà)面的构图,人物的姿势和画面的深(shēn)度信息等。有了它(tā)的帮助,就不(bù)用频繁(fán)的(de)用(yòng)提示词来碰(pèng)运气,抽盲盒式的创作了(le)。

通俗的说ControlNet相当于给AI绘画加(jiā)了“魔法”,不(bù)少博主的作品(pǐn)已经获得了大量的浏览量,“viggo”就是其中之(zhī)一,他用朋友的照片直接带她们(men)走进动漫世界。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行(xíng)业?_黑料正能量

viggo先(xiān)用StableDiffusion图片转文字(zì)。

再用Text2Prompt插件拓展找到对应的关键词(cí);最后用ControlNet插件绑(bǎng)定(dìng)骨骼(gé)开始换关键词试效(xiào)果。

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入(rù)可(kě)控期,将洗牌(pái)科技行业?_黑料正能(néng)量

通过图片就可以看出(chū)来,效果十分惊艳。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入可控期,将洗牌科(kē)技行业(yè)?_黑料正(zhèng)能量

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业(yè)?_黑料正能量

更厉害(hài)的是,除(chú)了真实的照(zhào)片(piàn),草图也可以加上“魔法(fǎ)”,知乎(hū)大牛“DevPoint”和“逗砂”介绍(shào)到(dào)ControlNet还(hái)能实现线稿转全(quán)彩图。大神(shén)张吕敏其本尊(zūn)也亲自回应。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进(jìn)入可(kě)控期(qī),将洗牌(pái)科技(jì)行业(yè)?_黑料正能量

不(bù)得不说当下AIGC已经变得越来越强大,甚至(zhì)输出的作品都已经能以假(jiǎ)乱真了。

02

难辨虚(xū)实,AIGC技术力爆(bào)发

警惕安(ān)全(quán)问题

近(jìn)日,“苏(sū)州金鸡(jī)湖(hú)有游艇party”的(de)消(xiāo)息(xī)火遍网络(luò),而经过警方(fāng)辟谣这(zhè)所(suǒ)谓的“party”可能是全国(guó)第一起AI绘(huì)图(tú)诈骗。

由于这个活动里面给出的(de)美女照(zhào)片都是AI制(zhì)作的(de)真人照片绘图,因为(wèi)太(tài)逼真,被大(dà)家(jiā)当成真(zhēn)事传播(bō)了

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将<span style='color: #ff0000; line-height: 24px;'>观摩和观看的区别和联系,观摩和观看的区别在哪</span>洗牌科技(jì)行业?_黑料正能量

不过仔细观察可以发现,活动发(fā)起者提(tí)供(gōng)的照片中有个(gè)很大的漏洞可以发现并非(fēi)真人,而是(shì)AI绘图,那便(biàn)是图(tú)片(piàn)中女(nǚ)性(xìng)的(de)手(shǒu)指部分有的存(cún)在异常。

ChatGPT之(zhī)后(hòu)又一应用(yòng)杀(shā)疯了,AIGC或进入(rù)可(kě)控期(qī),将洗牌科技行业?_黑料(liào)正能量

有行(xíng)业(yè)人(rén)事表示:“现在(zài)因为手指部(bù)分的绘画算法比较复杂(zá),AI还不太会(huì)画(huà)人的手,但(dàn)最新看到的图片(piàn)已经有越来越完美的AI模型(xíng)出现(xiàn),以后可能(néng)就(jiù)完全没有漏洞(dòng)了。

类似的(de)AI作(zuò)图诈骗在(zài)国外也已有发生。据英国广播(bō)公司报(bào)道,土耳其地震期间,有Tiktok用户使用AI合成了(le)儿童受灾的假照片(piàn)发布到(dào)网络(luò),以此诱骗善(shàn)良的人打赏(shǎng)“捐助”从而实施诈骗(piàn)。

目前(qián)随着(zhe)技(jì)术发展,AIGC已(yǐ)经能做(zuò)出真人照片(piàn)般的绘图效(xiào)果,如果这样的图(tú)片被用来(lái)诈骗,将非常可怕(pà)。

此外AIGC还引发了很(hěn)多担(dān)忧,一方面,批判者认为AI在“学习”了大量(liàng)前人的作(zuò)品之后,其创作没有任(rèn)何(hé)情绪和(hé)灵魂(hún),难以和人类的艺(yì)术创作相提并观摩和观看的区别和联系,观摩和观看的区别在哪论。

另一方面,AIGC背后的版权、目(mù)前都并没有得(dé)到有效的解决,还(hái)有AIGC会不会(huì)代替人类(lèi)“至高无上”的创意(yì)。

马斯克也强调,人工智(zhì)能的安(ān)全(quán)问题需要(yào)得到(dào)重视,太(tài)晚(wǎn)就来不及了。

03

AIGC下一站(zhàn)除(chú)了视频,还(hái)有远(yuǎn)方

技术(shù)都是有两面性的(de),潜在的危害并不能掩盖其光辉的(de)贡献(xiàn)。现在(zài)看来,人工(gōng)智能技术将(jiāng)是第四次工业革(gé)命的核心驱动力量(liàng),将创造(zào)新的(de)增(zēng)长奇迹。

过(guò)去一年,人工(gōng)智能在技术和商业层面(miàn)都有(yǒu)了巨大进(jìn)展,AI绘画就是人工智能技术发生方向性改变的一个代表。其下一站或许(xǔ)就是视频。

此前,Meta和谷歌先后发布(bù)了几(jǐ)条引爆科技(jì)圈的短视频。这些视频引发关注并非(fēi)内容做得多优秀(xiù),反而都非常简单,比如一(yī)匹正在喝水的马,一只画画(huà)的玩具(jù)熊,或者一段骑摩托车的第一视角录像,随便一个有手(shǒu)机(jī)的人都可以随手录下一段。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或(huò)进入(rù)可控期(qī),将洗牌科(kē)技行业?_黑料正能量

但这些短视频的(de)创作(zuò)方(fāng)式非常简单,创作(zuò)者(zhě)仅(jǐn)仅需要(yào)向AI输入一段(duàn)话,甚至(zhì)只是说一下(xià)要(yào)求,AI就(jiù)可以根据(jù)需要生(shēng)成一段视频。

谷歌发布的两(liǎng)个AI生成视(shì)频分别来自于Imagen Video和Phenaki,前者主要突出的是(shì)高清,与Meta的Make-A-Video没(méi)有(yǒu)太多的差别。

在Make-A-Video公布了AI生(shēng)成的视(shì)频(pín)后,AI圈就已经玩了一波梗(gěng),一个能够做出(chū)更高(gāo)清视频(pín)的(de)AI还不足以(yǐ)在短时间内戳中(zhōng)兴(xīng)奋(fèn)点(diǎn)。

Phenaki更加令人震惊(jīng)的地(dì)方在于,它(tā)可以制(zhì)作出(chū)超过2分钟的连贯的也有确切(qiè)内容的视(shì)频(pín),这才是真正(zhèng)让(ràng)人(rén)们感到惊喜的地(dì)方。因(yīn)为无论(lùn)AI生(shēng)成的视频多么(me)高(gāo)清,也只能(néng)是为内容生产(chǎn)者提供一个灵感,一个(gè)素材,一个过(guò)场(chǎng)动画。

不过能够制作(zuò)出有具(jù)体(tǐ)剧情内容的视(shì)频就意味着,一些视频创作由AI代替人工完成已经(jīng)初步(bù)有了可能。

当下AI的(de)发展速度(dù)已经超过大(dà)部分(fēn)人的想象。内容(róng)产业的本质(zhì)是(shì)供(gōng)给创造需求,AIGC作为(wèi)全新的内(nèi)容生产方式,可以为内(nèi)容产(chǎn)业带来更新的内容风格、更(gèng)快的生产速度,更低的生(shēng)产成本,这(zhè)无疑会驱动内容产业的大爆发。

除了AI绘(huì)图、视频,AIGC技术(shù)还(hái)能应用于音乐、代码(mǎ)、机器人(rén)动作等(děng)多种(zhǒng)内(nèi)容形式的生成。不(bù)难发现(xiàn)该项技术不仅在游戏等(děng)行(xíng)业能(néng)得(dé)到有效应(yīng)用,对于下(xià)一代互联网各种(zhǒng)元素(sù)的构建亦有(yǒu)关键意义。

从商业化的(de)角(jiǎo)度(dù)来看,文化(huà)娱乐、教(jiào)育(yù)、传媒等诸多领域,本身就对基于(yú)AI的可视化内(nèi)容有强烈需(xū)求。

因此,AI绘画及视频或不是(shì)结果,而只是AI进程中的一(yī)块重要(yào)拼(pīn)图,有望在(zài)技术更(gèng)新的加(jiā)持下实现(xiàn)更大的应用价值。

AI从理解内(nèi)容,走向了(le)可以生成(chéng)内(nèi)容(róng),甚至(zhì)能够创造出独立价值(zhí)和(hé)独立视角的内容。AIGC的再次出圈,更代表着未来的先进生产力即将到来。

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑料(liào)正能量

04

紧抓(zhuā)大模型与算力(lì),牢(láo)固AIGC底座

从(cóng)技(jì)术的发展也可以看出,在语言大模型、图(tú)像大模型(xíng)之后(hòu),多模态大模型已经成(chéng)为(wèi)了新的(de)趋势。

大(dà)模型(xíng)被(bèi)誉为当前人工智能发展的智能(néng)底座,是全(quán)球竞争最(zuì)激烈的研究方向(xiàng)之一,包括谷(gǔ)歌(gē)、亚马逊、百度(dù)、阿里、腾(téng)讯等众多头部企业都在竞相(xiāng)发力。

不过训练大模型的确价(jià)格不菲,以国盛证券(quàn)发布的《ChatGPT需要多少算力》报告(gào)估算,GPT-3训练一次的成(chéng)本约(yuē)为140万美元。而对于一些更大(dà)的LLM(大型语(yǔ)言模型),训练成本则(zé)介(jiè)于200万美元(yuán)至1200万美元(yuán)高价之(zhī)间。

以ChatGPT在(zài)2023年1月(yuè)的独立访客(kè)平均(jūn)数1300万计算,其对应芯片需求为3万多(duō)片英伟达(dá)A100 GPU,初始投入成(chéng)本约为(wèi)8亿美元,每日仅电(diàn)费就在5万美元左右。

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能量

此(cǐ)外不(bù)论是ChatGPT还是(shì)AIGC,都离不(bù)开庞(páng)大算力(lì)支持。在关注(zhù)各类大模型(xíng)的发展同时(shí),更应该关注(zhù)算力网(wǎng)络的建设。

算力网(wǎng)络正驱动(dòng)AI产(chǎn)业发(fā)展进(jìn)入史诗级加(jiā)速进(jìn)程,让(ràng)AIGC及(jí)通用AI这(zhè)一人工智能发展的(de)终极目标离得(dé)更近(jìn)。

因为算力可以对突破性技术创新(xīn)提供大力的支持。这方面,多模态大模(mó)型(xíng)是典型。作为(wèi)面向未(wèi)来(lái)强人工智能、通用人工智(zhì)能(néng)的重要技术(shù)创(chuàng)新,多模(mó)态大模型已经(jīng)在人(rén)工智能领域提(tí)出了(le)很多年,业界也有不(bù)少技术突破,但(dàn)是,多模态大模型进一步往下走,算力需求呈几何式(shì)上升(shēng),一般(bān)的算(suàn)力基础设施(shī)很快将难(nán)以(yǐ)胜任。

从图像、文字(zì)、语(yǔ)音单独一项的训练,到双模态、三模态的跃迁,让人工(gōng)智能(néng)可以灵活应对不(bù)同模(mó)态(tài)的转化、像人与世(shì)界交(jiāo)互一样自然,这方面,由算力网(wǎng)络来驱动将有明显(xiǎn)优势。

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或进入可控期(qī),将洗牌科技行业?_黑料正能量

此外(wài),还有很(hěn)多需要爆发式(shì)增长的算力来支撑的技(jì)术(shù)创新,将在人工智能算力网络支(zhī)撑下(xià)快速(sù)推(tuī)进。

AIGC已经露出曙(shǔ)光,期待在大模型和大算(suàn)力的支持下(xià)AIGC能(néng)持续(xù)颠覆内(nèi)容生产的方式,将创造(zào)的边(biān)际成本降(jiàng)低,让万众受益(yì)。

未经允许不得转载:橘子百科-橘子都知道 观摩和观看的区别和联系,观摩和观看的区别在哪

评论

5+2=