橘子百科-橘子都知道橘子百科-橘子都知道

蜗牛是不是昆虫类

蜗牛是不是昆虫类 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器人(rén)ChatGPT火爆(bào)以来,微软公司(sī)创始人比尔·盖(gài)茨已(yǐ)多次公开谈论人工智(zhì)能话题。在最(zuì)近的一次采访中,他再(zài)次表(biǎo)示:蜗牛是不是昆虫类“AI可能会(huì)让(ràng)科技行业(yè)迎来(lái)一(yī)次剧烈的洗牌”。

这个结论(lùn)是(shì)他在(zài)当地时间(jiān)2月20日(rì)接受《In Good Company》节(jié)目(mù)专访时提出的。

他预期,AI的发展可(kě)能会威胁到谷(gǔ)歌的市占率,因为微软在AI方面的行动相当(dāng)迅速。而最终科技巨头将(jiāng)把AI整合成用(yòng)户的“全能(néng)助(zhù)手”,包揽(lǎn)一切应(yīng)用,与人(rén)们(men)进行沟通并提(tí)供建议(yì),可以取(qǔ)代亚马(mǎ)逊、Siri或(huò)Outlook等(děng)应用。

大(dà)佬口中全能助手的到来可能尚需时日,但由(yóu)ControlNet引发的又一次AI绘画(huà)浪(làng)潮,让AIGC在ChatGPT的话题热点包围(wéi)中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科(kē)技行业(yè)?_黑料正能量

01

ControlNet颠覆AI绘(huì)画新玩(wán)法

AIGC向(xiàng)可控靠近

以(yǐ)AI绘(huì)画为(wèi)代表的(de)AIGC上一次爆火的时候,还是2022年8月,在(zài)美国(guó)科罗拉多州(zhōu)举办的新兴数(shù)字(zì)艺术家竞赛中,一幅名为《太空(kōng)歌剧(jù)院》的作品获奖。

随后(hòu)各大厂(chǎng)商的AI绘画软件被广大网友熟知并体验(yàn),Stable Diffusion便是其中代(dài)表。

ChatGPT之后又一应(yīng)用(yòng)杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技行业?_黑料正能量

用户(hù)们可(kě)以在(zài)应用中输入一组(zǔ)关键词或者一张照(zhào)片,就能获得一幅(fú)AI创(chuàng)作的画作(zuò)。

作画的关键就是所输入的文本。同一组关键词也可以创作出很(hěn)多张风格不一样的(de)画作,这(zhè)让(ràng)创作(zuò)的过程就(jiù)像开(kāi)盲盒。

很多用户(hù)很喜欢这(zhè)种(zhǒng)不确定的惊(jīng)喜,他们会将生成的美(měi)图当做头像。而另一部分喜欢翻看AI绘画(huà)的“翻车”作品。在社交媒体(tǐ)上(shàng),许多用户分享AI“翻(fān)车现场”,例如,一位(wèi)网友的小狗照片(piàn)被AI画成了“肌肉男”,还有网友的个(gè)人照片被AI识别成了建筑。

而如今随(suí)着ControlNet的出(chū)现(xiàn)与加(jiā)持,以往AI绘(huì)画的填(tián)写关键词游戏(xì)可(kě)能要(yào)被颠覆了。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能量

ControlNet是一(yī)位(wèi)正在斯坦福读博(bó)的中国人张吕敏创作(zuò)的一(yī)种基于控制点的图像变形(xíng)算(suàn)法,主要用于数字图(tú)像处理(lǐ)、计算机视觉和计算机图(tú)形学等领域。

其SD插件一经发(fā)布,在短(duǎn)短的两天(tiān)内便成为了(le)AI绘(huì)画领域最新的热点(diǎn)。

在(zài)此之前,大家用了很多(duō)方法想让AI生(shēng)成(chéng)的结(jié)果(guǒ)尽(jǐn)可能(néng)的符合要求,但是都不(bù)尽(jǐn)如人意(yì),它的(de)出现代表着AI生成开(kāi)始进(jìn)入真正的可控(kòng)时(shí)期。

因为ControlNet可(kě)以直接提(tí)取画面的构图,人物的姿势和画面的深度(dù)信息等。有了它的帮助,就不用频繁的用提(tí)示词(cí)来(lái)碰运气(qì),抽盲盒(hé)式的创(chuàng)作了。

通俗的说ControlNet相当于给AI绘画(huà)加了“魔(mó)法(fǎ)”,不(bù)少博主的作品已经获(huò)得(dé)了大量的(de)浏览量,“viggo”就是其中之(zhī)一,他用朋友的照片直接(jiē)带她们(men)走(zǒu)进动漫世界。

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌(pái)科技行业(yè)?_黑料正能量

viggo先用StableDiffusion图(tú)片转文(wén)字。

再用Text2Prompt插件(jiàn)拓展找到对应的关键词;最后用ControlNet插(chā)件绑定(dìng)骨骼开始换关键词试效(xiào)果(guǒ)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正能量

通过图片就可以看出来,效果十(shí)分惊艳。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正(zhèng)能量

ChatGPT之后又一应用杀疯(fēng)了(le),AIGC或进入可控期,将洗牌科技行业?_黑料正能量

更厉(lì)害的是,除了真实(shí)的照片(piàn),草图也可以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能实现线稿转(zhuǎn)全(quán)彩图(tú)。大神张吕敏其本尊也(yě)亲自回应。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可(kě)控(kòng)期,将(jiāng)洗牌(pái)科技行业?_黑料正能量(liàng)

不得不说(shuō)当下AIGC已经变(biàn)得越来(lái)越强大,甚(shèn)至输出的(de)作品都已经能以假乱真(zhēn)了。

02

难辨虚实,AIGC技术(shù)力爆发(fā)

<蜗牛是不是昆虫类strong>警惕安全问(wèn)题

近(jìn)日,“苏(sū)州金鸡(jī)湖有游艇party”的消息火遍网络,而经(jīng)过警方辟谣(yáo)这所谓的“party”可能是全(quán)国第一起AI绘图诈(zhà)骗。

由于这个活动(dòng)里面给出的美女照(zhào)片都是AI制作的真人(rén)照片绘图,因为(wèi)太(tài)逼(bī)真,被大家当成真事传播了

ChatGPT之(zhī)后又一应用杀疯了,AIGC或(huò)进入(rù)可控(kòng)期(qī),将洗牌科技行(xíng)业?_黑料正(zhèng)能(néng)量

不过仔细观察可(kě)以发现,活动发起者提供的照片中有个很大的漏洞可以发(fā)现(xiàn)并(bìng)非真人,而是AI绘图,那便(biàn)是图(tú)片(piàn)中女性的(de)手指部分有的存在异常(cháng)。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入(rù)可控(kòng)期,将洗(xǐ)牌科(kē)技行业?_黑料正(zhèng)能(néng)量(liàng)

有行业(yè)人(rén)事表示:“现在因(yīn)为手(shǒu)指部分的绘画算法比较复杂,AI还不(bù)太会画人(rén)的手(shǒu),但最新(xīn)看到的图片已经有越来越完美的AI模型出现,以后可能就完(wán)全没有(yǒu)漏洞了。

类似的AI作(zuò)图诈骗在国(guó)外也已(yǐ)有(yǒu)发生。据(jù)英国广播公司报道,土耳其(qí)地震期间,有Tiktok用户使用AI合成(chéng)了儿童受灾的(de)假照片发布(bù)到网络,以此诱骗善(shàn)良的(de)人打赏“捐助”从而实施诈骗(piàn)。

目前(qián)随着技术发展,AIGC已经(jīng)能做出真人(rén)照片般的绘图(tú)效果,如果(guǒ)这样的(de)图片被用来(lái)诈骗,将非常可(kě)怕。

此外AIGC还引发(fā)了很(hěn)多担忧(yōu),一(yī)方面,批判者认为AI在“学(xué)习”了大量前人(rén)的作品之后,其创作(zuò)没有任何情绪和灵(líng)魂,难以和人类的艺术创(chuàng)作相(xiāng)提(tí)并论。

另一方面,AIGC背后的版权、目前都并没有得(dé)到有效的解决,还有AIGC会不(bù)会(huì)代(dài)替人(rén)类“至高无(wú)上”的创意。

马斯(sī)克也强调,人工智能的安全问题需要得到重视,太晚就来不及了。

03

AIGC下一站除了视频,还(hái)有远(yuǎn)方

技术都是有(yǒu)两面性的,潜在的(de)危害并(bìng)不能(néng)掩(yǎn)盖其(qí)光(guāng)辉的贡(gòng)献。现在看来,人(rén)工(gōng)智能(néng)技术将是(shì)第四次工业革命的(de)核心(xīn)驱动力(lì)量,将创造新的增长奇(qí)迹。

过(guò)去一年,人工智能(néng)在(zài)技术(shù)和商业(yè)层面(miàn)都有了巨大进展,AI绘画就是(shì)人工(gōng)智能技术发生方向性改变的(de)一个代表(biǎo)。其下一站或许就是视频。

此前,Meta和谷(gǔ)歌先后发布了(le)几条引爆科技(jì)圈的短视频。这些(xiē)视频引发关注并非内(nèi)容做(zuò)得多优秀,反而都(dōu)非常简单,比如(rú)一匹正在(zài)喝水的(de)马,一只画(huà)画(huà)的玩(wán)具熊,或(huò)者(zhě)一段骑摩托车的第一视角录像,随便一个有手机的人都可以随手(shǒu)录下一(yī)段。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正能(néng)量

但这些短视频(pín)的创作方式非常(cháng)简单,创(chuàng)作者(zhě)仅仅(jǐn)需要(yào)向AI输(shū)入一段(duàn)话,甚至只是说一下要求,AI就(jiù)可以根据需要生成一段视频(pín)。

谷歌发布的两个AI生成视频分别来自于Imagen Video和Phenaki,前者主要突出的是(shì)高清(qīng),与(yǔ)Meta的Make-A-Video没有太多的(de)差别。

在(zài)Make-A-Video公布了AI生成的视(shì)频(pín)后,AI圈(quān)就已经玩了一(yī)波(bō)梗(gěng),一个能(néng)够做出更高清(qīng)视(shì)频的AI还不(bù)足以在短时间(jiān)内戳中兴(xīng)奋点。

Phenaki更加令人震惊的地方在于(yú),它可以(yǐ)制作(zuò)出超(chāo)过2分钟的连贯的也有确切内容的视频,这才是真正让(ràng)人们感到惊喜的地(dì)方。因(yīn)为(wèi)无(wú)论AI生成(chéng)的视频多么高清,也只能(néng)是(shì)为内容生产者提供(gōng)一个灵感,一个素材,一个过(guò)场(chǎng)动画。

不过能够制作出(chū)有具(jù)体剧情(qíng)内容的视频就意(yì)味着,一些视频创作由AI代替(tì)人工完成已经(jīng)初步有了可能。

当(dāng)下(xià)AI的发(fā)展速度已(yǐ)经超(chāo)过(guò)大(dà)部分(fēn)人的想象。内容产业的本质是供给创造需求,AIGC作为全新的内容生产方(fāng)式,可以(yǐ)为(wèi)内容产业带(dài)来更(gèng)新的内容风(fēng)格(gé)、更快的生产(chǎn)速度,更低的生产成本,这无疑(yí)会驱动内容(róng)产业的大爆发。

除了AI绘图、视频,AIGC技术还(hái)能应用(yòng)于音乐、代码、机器(qì)人动作等多种内容形式的(de)生成。不(bù)难(nán)发现该项技(jì)术不(bù)仅(jǐn)在游戏(xì)等(děng)行业能得到有(yǒu)效应用,对于下一(yī)代互联网各种(zhǒng)元素的构建(jiàn)亦有关键(jiàn)意(yì)义。

从商业化的角度来(lái)看,文(wén)化娱乐、教育、传(chuán)媒(méi)等诸多领域,本身就对(duì)基(jī)于(yú)AI的可视(shì)化内容有强烈(liè)需求。

因此,AI绘(huì)画及视频或不(bù)是(shì)结果,而只(zhǐ)是AI进程中的(de)一块重要拼图,有望在(zài)技术更新的加持下实现更大的应(yīng)用价值。

AI从理解内容,走(zǒu)向(xiàng)了可(kě)以生成内容,甚至(zhì)能够创造出(chū)独立(lì)价值和(hé)独(dú)立(lì)视(shì)角的内容。AIGC的(de)再次(cì)出圈,更代表着(zhe)未(wèi)来的先进生产力即将到(dào)来。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技行业?_黑料正能量

04

紧(jǐn)抓大(dà)模型(xíng)与算力(lì),牢固AIGC底座(zuò)

从技术的发展也可以看(kàn)出,在语言大模型(xíng)、图像大模型(xíng)之后(hòu),多模态大模(mó)型(xíng)已经成为了新的趋势。

大(dà)模型(xíng)被誉为当前人(rén)工智(zhì)能发展的(de)智能底(dǐ)座,是全球(qiú)竞争最激(jī)烈的研究(jiū)方(fāng)向之一(yī),包括谷歌、亚马逊、百度(dù)、阿里、腾讯等众多头部企业都在竞相发(fā)力。

不过训练(liàn)大(dà)模型的确价格不(bù)菲,以国盛证券(quàn)发布(bù)的《ChatGPT需要(yào)多少(shǎo)算力》报(bào)告(gào)估算(suàn),GPT-3训练一次的成本约为(wèi)140万美元(yuán)。而对于一些更(gèng)大的LLM(大型语(yǔ)言(yán)模型),训(xùn)练(liàn)成本则介于200万美元(yuán)至1200万美(měi)元(yuán)高价之间(jiān)。

以ChatGPT在(zài)2023年(nián)1月的独(dú)立访客平均数(shù)1300万(wàn)计算(suàn),其(qí)对应芯(xīn)片需求为3万多片(piàn)英伟达A100 GPU,初始(shǐ)投入成本约为(wèi)8亿美(měi)元,每日仅电费就在5万美(měi)元左右。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或(huò)进入可控期(qī),将洗(xǐ)牌科技(jì)行(xíng)业?_黑料正能(néng)量

此(cǐ)外(wài)不论是ChatGPT还是(shì)AIGC,都离不开庞大算力支持。在关注各类(lèi)大模型的(de)发展同时,更(gèng)应该关注算(suàn)力(lì)网络的建(jiàn)设。

算力网(wǎng)络正驱动AI产业发展进入史诗(shī)级加(jiā)速(sù)进(jìn)程(chéng),让AIGC及通(tōng)用AI这一人(rén)工(gōng)智能发展的终极目(mù)标离得更近。

因为算力可以对突破(pò)性技术创新提供(gōng)大力的支持。这方面(miàn),多模态大模型是典(diǎn)型。作为面向(xiàng)未来(lái)强人工智(zhì)能、通用人工智能的重要技(jì)术创新,多模态(tài)大(dà)模型(xíng)已(yǐ)经在人(rén)工智(zhì)能领域提出了很多年,业界也有不少技术突破,但是,多(duō)模态大模型进(jìn)一步往下(xià)走(zǒu),算力需(xū)求(qiú)呈几何式(shì)上升,一(yī)般的算力基础(chǔ)设施很快将难以(yǐ)胜任。

从图像(xiàng)、文字(zì)、语音单独(dú)一项的训练,到双模态、三模态的(de)跃迁,让人(rén)工智能可以灵活应对不(bù)同(tóng)模态的转(zhuǎn)化、像人(rén)与世界交互一样(yàng)自然(rán),这方面,由算力网络(luò)来(lái)驱动将有明显优势。

ChatGPT之后又(yòu)一(yī)应用(yòng)杀(shā)疯了(le),AIGC或进入可(kě)控(kòng)期,将洗牌科技(jì)行业?_黑料正能量

此外,还(hái)有很(hěn)多(duō)需要爆发(fā)式(shì)增长的(de)算力(lì)来支撑的技术(shù)创新,将在人(rén)工智能算力网络支撑下快速(sù)推进(jìn)。

AIGC已经露出曙光(guāng),期待在大模型和大算力的(de)支持下AIGC能持续颠(diān)覆内容生产的方式,将创造的边际成本(běn)降低,让(ràng)万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 蜗牛是不是昆虫类

评论

5+2=