久久99热精品免费观看麻豆,激情在线视频91网站,欧美人成综合视频在线

AI“百模大戰(zhàn)”風(fēng)向變了？360、美圖先后出招視覺(jué)大模型上演“神仙打架”-當(dāng)前消息

2023-06-22 12:44:20 華夏時(shí)報(bào)

隨著AI大模型研發(fā)應(yīng)用熱潮持續(xù)高漲，記者注意到，賽道內(nèi)的玩家開(kāi)始將重心從語(yǔ)言大模型轉(zhuǎn)向視覺(jué)大模型。近期，Adobe、Meta、360、美圖等多家國(guó)內(nèi)外互聯(lián)網(wǎng)頭部企業(yè)紛紛發(fā)表大模型成果，為本就火熱異常的AI市場(chǎng)再添了一把火。

“人工智能在視頻領(lǐng)域的應(yīng)用越來(lái)越受到重視。”中國(guó)通信工業(yè)協(xié)會(huì)兩化融合委員會(huì)副會(huì)長(zhǎng)吳高斌向《華夏時(shí)報(bào)》記者表示，這些大型AI模型的發(fā)布為企業(yè)間的競(jìng)爭(zhēng)帶來(lái)了新的動(dòng)力。企業(yè)之間的競(jìng)爭(zhēng)將促進(jìn)技術(shù)創(chuàng)新和進(jìn)步，同時(shí)也將帶來(lái)更好的產(chǎn)品和服務(wù)。競(jìng)爭(zhēng)還將促進(jìn)企業(yè)間的合作和共享資源，從而更好地滿(mǎn)足市場(chǎng)需求。

(資料圖)

海內(nèi)外視覺(jué)大模型“神仙打架”

在鱗次櫛比的語(yǔ)言大模型、多模態(tài)大模型紛紛涌現(xiàn)之后，“視覺(jué)大模型”成為又一個(gè)兵家必爭(zhēng)之地。日前，美圖發(fā)布AI視覺(jué)大模型MiracleVision，一同發(fā)布的還有AI視覺(jué)創(chuàng)作工具WHEE、AI數(shù)字人生成工具DreamAvatar、美圖AI助手RoboNeo等7款產(chǎn)品。

據(jù)介紹，MiracleVision具有強(qiáng)大的視覺(jué)表現(xiàn)力和創(chuàng)作力，能從繪畫(huà)、設(shè)計(jì)、影視、攝影、游戲、3D、動(dòng)漫等視覺(jué)創(chuàng)作場(chǎng)景反推技術(shù)演化。與市面上其他大模型不同，它尤其擅長(zhǎng)亞洲人像攝影、國(guó)風(fēng)國(guó)潮、商業(yè)設(shè)計(jì)等生成方向。

美圖公司創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官吳欣鴻在接受《華夏時(shí)報(bào)》記者采訪時(shí)表示：“美圖大模型的核心優(yōu)勢(shì)是‘懂美學(xué)’，C端用戶(hù)基礎(chǔ)足夠大，大模型冷啟動(dòng)的獲客成本低，美圖目前有2.43億的月活用戶(hù)，全球VIP會(huì)員數(shù)為719萬(wàn)，能在短時(shí)間去驗(yàn)證產(chǎn)品成功與否。不同于其他廠商，美圖大模型聚焦于美學(xué)（畫(huà)面畫(huà)質(zhì)設(shè)計(jì)等），未來(lái)如果非要競(jìng)爭(zhēng)，會(huì)在美學(xué)上面去‘卷’?！?/p>

無(wú)獨(dú)有偶，360也日前正式發(fā)布“360智腦－視覺(jué)大模型”。 360創(chuàng)始人周鴻祎表示，大語(yǔ)言模型是構(gòu)建視覺(jué)大模型的基礎(chǔ)，多模態(tài)能力增強(qiáng)的核心是借助了大語(yǔ)言模型的認(rèn)知、推理、決策能力。同時(shí)，視覺(jué)大模型也是“360智腦”的重要能力組成，能夠看懂圖片，未來(lái)還能看懂視頻、聽(tīng)懂聲音。

海外企業(yè)也已經(jīng)開(kāi)始在視覺(jué)大模型上布局。日前，社交媒體巨頭Meta宣布，將向研究人員開(kāi)放一個(gè)名為I-JEPA的“類(lèi)人”人工智能模型的部分組件，該模型可以比現(xiàn)有模型更準(zhǔn)確地分析和完成未完成的圖像，而不是像其他生成式人工智能模型那樣，只根據(jù)附近的像素進(jìn)行推斷。

Meta公司首席人工智能科學(xué)家楊立昆曾公開(kāi)指出，當(dāng)前的GPT自回歸模型存在缺乏規(guī)劃、推理的能力，未來(lái)GPT系統(tǒng)或?qū)⒈粧仐?，并給出了他認(rèn)為的正確答案——世界模型。據(jù)稱(chēng)I-JEPA是第一個(gè)基于其愿景關(guān)鍵組成部分的AI模型，能比現(xiàn)有模型更準(zhǔn)確地分析和完成未完成的圖像。

除此之外，Meta還發(fā)布了語(yǔ)音生成AI模型“Voicebox”，支持從文本中生成語(yǔ)音，能夠根據(jù)僅兩秒長(zhǎng)的樣本匹配音頻風(fēng)格，并將文本樣本轉(zhuǎn)換為另一種語(yǔ)言，在給定單獨(dú)的語(yǔ)音樣本的情況下，并能夠以說(shuō)話者的原始語(yǔ)音朗讀翻譯后的文本內(nèi)容，目前支持六種語(yǔ)言：英語(yǔ)、法語(yǔ)、德語(yǔ)、西班牙語(yǔ)、波蘭語(yǔ)和葡萄牙語(yǔ)。

而早在今年4月，Adobe便將其Adobe Firefly功能（類(lèi)ChatGPT產(chǎn)品）集成在Premiere Pro、After Effects、Audition、Remix等音視頻產(chǎn)品矩陣中，為用戶(hù)提供一鍵生成內(nèi)容、剪輯、調(diào)色、更換音樂(lè)等功能。

從“語(yǔ)言大模型”到“視覺(jué)大模型”

《中國(guó)人工智能大模型地圖研究報(bào)告》顯示，從全球已發(fā)布的大模型數(shù)量及分布來(lái)看，中國(guó)和美國(guó)大幅領(lǐng)先，超過(guò)全球總數(shù)的80%。同時(shí)，歐洲、俄羅斯、以色列等越來(lái)越多的研發(fā)團(tuán)隊(duì)也在投入大模型研發(fā)。但值得注意的是，我國(guó)在計(jì)算機(jī)視覺(jué)等領(lǐng)域的大模型還較少。

究其原因，北京智源研究院訪問(wèn)首席科學(xué)家顏水成向《華夏時(shí)報(bào)》記者表示：“現(xiàn)在視覺(jué)模型發(fā)展稍微滯后的主要原因，是因?yàn)橐曈X(jué)大模型吃算力吃得比文本要大很多，所以我們也期待芯片更快速的發(fā)展，甚至有可能把非GPU其他的芯片融合在一起來(lái)做?，F(xiàn)在大家見(jiàn)到的模型一般千卡級(jí)比較常見(jiàn)，但可能明年就有人會(huì)用萬(wàn)卡級(jí)來(lái)做?！?/p>

而在北京智源人工智能研究院院長(zhǎng)黃鐵軍看來(lái)，視覺(jué)領(lǐng)域是大模型領(lǐng)域下一個(gè)浪潮的重點(diǎn)。他指出，視覺(jué)大模型和語(yǔ)言大模型背后的思想方法和基本路線是異曲同工的，只是輸入的數(shù)據(jù)變成了圖像和視頻，訓(xùn)練出來(lái)的模型則具有一定的通用視覺(jué)語(yǔ)言能力，一種是之前提到的AIGC（人工智能自動(dòng)生成內(nèi)容），可以生成圖像和藝術(shù)品，“還有一種更基本的能力，就是看到世界之后，得首先能把這個(gè)世界（萬(wàn)物）分清?！?/p>

對(duì)于視覺(jué)大模型的發(fā)展，不少機(jī)構(gòu)也表達(dá)出看好的態(tài)度。中金研究發(fā)布的研報(bào)認(rèn)為，計(jì)算機(jī)視覺(jué)未來(lái)有望實(shí)現(xiàn)更高程度的自動(dòng)化、高精度和低功耗，進(jìn)一步豐富元宇宙的內(nèi)容生態(tài)，降低進(jìn)入門(mén)檻。計(jì)算機(jī)視覺(jué)的進(jìn)步引領(lǐng)了三維重建和動(dòng)捕技術(shù)快速成熟，并逐漸在各自的領(lǐng)域積累技術(shù)進(jìn)步。計(jì)算機(jī)視覺(jué)未來(lái)有望迎來(lái)更高程度的自動(dòng)化、更高的精度，以及更低的功耗，逐漸在移動(dòng)端實(shí)現(xiàn)更好的視覺(jué)效果，被應(yīng)用在大量下游行業(yè)，逐漸邁向連接物理世界和數(shù)字世界的長(zhǎng)期愿景。

中信證券研究也表示，在設(shè)計(jì)領(lǐng)域，大模型引領(lǐng)數(shù)字設(shè)計(jì)走向智能設(shè)計(jì)，相關(guān)工業(yè)設(shè)計(jì)軟件結(jié)合GPT等技術(shù)，可應(yīng)用在設(shè)計(jì)規(guī)劃、布局優(yōu)化、插件助手、草圖繪制等場(chǎng)景，工業(yè)設(shè)計(jì)軟件有望在AI升級(jí)的大趨勢(shì)下迎來(lái)新一輪生產(chǎn)力革命。

（文章來(lái)源：華夏時(shí)報(bào)）

關(guān)鍵詞：