為什么是妙鴨?
2023-08-12 16:33:42    騰訊網(wǎng)

「這些應(yīng)用讓AI觸手可及」


(資料圖片僅供參考)

記者 | 何昕曄

編輯 | 王杰夫

Key Points

妙鴨相機(jī)成為生成式AI在國(guó)內(nèi)的首款現(xiàn)象級(jí)應(yīng)用;

妙鴨并非來(lái)自創(chuàng)業(yè)團(tuán)隊(duì),而是由阿里優(yōu)酷內(nèi)部孵化;

妙鴨底層技術(shù)是搭配了LoRA插件的Stable Diffusion開源模型,你在電腦上也能實(shí)現(xiàn);

妙鴨已經(jīng)上線蘋果應(yīng)用商店,并時(shí)刻準(zhǔn)備從9.9元漲價(jià)到29.9元。

終于,在ChatGPT引發(fā)的生成式AI熱潮過(guò)去半年后,國(guó)內(nèi)用戶總算可以通過(guò)「妙鴨相機(jī)」(以下簡(jiǎn)稱「妙鴨」)這款照相應(yīng)用,切切實(shí)實(shí)地感受下這撥浪潮的溫度。

7月17日,這款A(yù)I人像生成應(yīng)用在微信小程序上線。當(dāng)你上傳21張符合標(biāo)準(zhǔn)的個(gè)人照片并支付9.9元后,妙鴨便會(huì)為你生成一個(gè)「數(shù)字分身」——其實(shí)就是一張你的二維頭像;接下來(lái),像在影樓一樣,你可以選擇各種風(fēng)格的裝扮,正裝、校園、古風(fēng)等等,程序會(huì)自動(dòng)將你的頭像與裝扮結(jié)合起來(lái),生出一張張數(shù)字影樓照。

妙鴨相機(jī)生成的數(shù)字寫真

妙鴨相機(jī)一經(jīng)上線便引發(fā)了用戶極大的試用熱情,畢竟誰(shuí)沒(méi)有在朋友圈曬過(guò)幾張裝扮夸張、姿勢(shì)做作的寫真呢,更何況你的數(shù)字分身還挺養(yǎng)眼。

妙鴨相機(jī)從6月30日開始邀請(qǐng)制內(nèi)測(cè),當(dāng)時(shí)就有上千人參與。正式上線小程序后,高峰期排隊(duì)人數(shù)超過(guò)4000人,也在社交媒體平臺(tái)上引發(fā)了新一輪的「曬自拍」熱潮。

7月30日,妙鴨相機(jī)上線蘋果應(yīng)用商店,小程序版本生成的數(shù)字分身可以直接遷移過(guò)來(lái),但無(wú)法再生成新的數(shù)字分身。

妙鴨背后的技術(shù)并非獨(dú)一無(wú)二

妙鴨的團(tuán)隊(duì)并未對(duì)外公開其圖像生成模型的底層技術(shù),只是為這個(gè)模型挑選了個(gè)好名字——「提香」(Tiziano),他是文藝復(fù)興時(shí)期的重要畫家,尤其擅長(zhǎng)色彩鮮艷的肖像畫。

但同樣是AI創(chuàng)業(yè)者的王凱告訴《新皮層》,妙鴨相機(jī)實(shí)際用到的技術(shù)并不復(fù)雜,應(yīng)該是搭配了LoRA插件的Stable Diffusion開源模型。王凱是一位連續(xù)創(chuàng)業(yè)者,擔(dān)任過(guò)日事清運(yùn)營(yíng)負(fù)責(zé)人,最近創(chuàng)立VentureAI,提供圖像生成應(yīng)用Midjourney API服務(wù)。

Stable Diffusion模型是Stability AI公司推出的在行業(yè)內(nèi)使用最廣泛的開源圖像生成模型,而LoRA是對(duì)這種大模型的微調(diào)方法。LoRA全稱是Low-Rank Adaptation of Large Language Models,最早在2021年由微軟的研究人員提出。它只需很少的數(shù)據(jù),就可以訓(xùn)練出具有特定風(fēng)格或特征的模型。

具體實(shí)現(xiàn)方式是,利用低秩適配(low-rankadaptation)技術(shù),只訓(xùn)練新加入的數(shù)據(jù)(比如用戶上傳的21張照片),之后將由此形成的新參數(shù)和已有模型合并。這樣的好處在于,服務(wù)提供者(比如妙鴨)不必耗費(fèi)大量算力重新訓(xùn)練模型,只需要用戶提交的少量數(shù)據(jù)(即21張照片)就能夠生成特定風(fēng)格的圖像。這就是妙鴨相機(jī)只用到了21張照片,就能為不同用戶生成個(gè)性化數(shù)字分身的原因。

其實(shí),在妙鴨相機(jī)出圈前,已經(jīng)有不少用戶嘗試用LoRA技術(shù)生成數(shù)字分身。例如在小紅書或嗶哩嗶哩上,搜索「LoRA定制自己的形象方法」就能發(fā)現(xiàn),早在半年前,就己經(jīng)有AI愛好者推出手把手的視頻教程。

B站與小紅書上早就有大量LoRA使用教程

而從妙鴨目前實(shí)現(xiàn)的效果來(lái)看,團(tuán)隊(duì)并沒(méi)有對(duì)LoRA技術(shù)做進(jìn)一步優(yōu)化。理論上,如果用龐大的人臉數(shù)據(jù)庫(kù)訓(xùn)練一個(gè)基于Diffusion Model的垂直模型,妙鴨能實(shí)現(xiàn)更好的數(shù)字分身效果?!傅@樣處理需要高昂的算力成本?!雇鮿P說(shuō),「以妙鴨現(xiàn)在的數(shù)據(jù)看,很難下決心投入做這件事?!?/p>

妙鴨出圈其實(shí)是產(chǎn)品的勝利

其實(shí),妙鴨并非是一支創(chuàng)業(yè)團(tuán)隊(duì)。從用動(dòng)物給產(chǎn)品起名的習(xí)慣看,不難猜出它來(lái)自阿里巴巴。

公開資料顯示,妙鴨相機(jī)的主體公司是未序網(wǎng)絡(luò)科技(上海)有限公司,法定代表人為張龍同時(shí)擔(dān)任優(yōu)酷視頻(西安)傳媒科技有限公司的法定代表人、執(zhí)行董事兼總經(jīng)理,其監(jiān)事馮云樂(lè)也同時(shí)擔(dān)任了多家阿里系公司的監(jiān)事職務(wù)。所以,妙鴨相機(jī)其實(shí)是優(yōu)酷的內(nèi)部創(chuàng)業(yè)項(xiàng)目。

妙鴨的出圈,背后并沒(méi)有創(chuàng)新性的技術(shù),主要還是基于用戶洞察的產(chǎn)品創(chuàng)新。妙鴨相機(jī)創(chuàng)始人張?jiān)鹿馐腔ヂ?lián)網(wǎng)圈內(nèi)一位資深產(chǎn)品經(jīng)理,曾在今日頭條與阿里巴巴工作,負(fù)責(zé)過(guò)今日頭條紅包雨、字節(jié)時(shí)光相機(jī)、支付寶「集五?!沟戎a(chǎn)品策劃。通過(guò)此次妙鴨的爆紅,也能看出他老辣的產(chǎn)品經(jīng)驗(yàn)。

一是價(jià)格便宜。9.9元,一杯奶茶的價(jià)格,降低了用戶的付費(fèi)門檻。早在今年5月,美圖秀秀推出的同類產(chǎn)品「美顏相機(jī)」App就上線了「AI寫真」功能,價(jià)格也是9.9元,但只能獲得一張同風(fēng)格、同姿勢(shì)的照片,并沒(méi)有太多用戶付費(fèi)試用。目前,美顏相機(jī)已經(jīng)調(diào)低了價(jià)格,從9.9元降到了3.9元。出圈后,妙鴨相機(jī)則反過(guò)來(lái)提升了價(jià)格。小程序頁(yè)面顯示,妙鴨目前提供的服務(wù)的標(biāo)準(zhǔn)價(jià)是29.9元——9.9元是限時(shí)特惠價(jià)格。王凱稱,妙鴨9.9的定價(jià)肯定是在虧錢的,國(guó)內(nèi)AIGC類的應(yīng)用想在C端出圈,低價(jià)是決定性的因素。

二是嘗試零門檻。妙鴨相機(jī)初期搭載在微信小程序之中,不需要下載App即可體驗(yàn),降低了試用成本。此外,用戶只需上傳照片并選擇想要的風(fēng)格,將輸入Prompts提示詞的過(guò)程隱藏在了產(chǎn)品背后,降低了用戶對(duì)于陌生技術(shù)的緊張感。

三是產(chǎn)品有傳播屬性。相比于文字內(nèi)容,自拍類圖像自帶社交屬性,可以滿足自我形象展示的需求,用戶有更強(qiáng)的動(dòng)機(jī)在社交媒體上傳播這類內(nèi)容。妙鴨還推出了分享鼓勵(lì)機(jī)制,通過(guò)朋友圈分享邀請(qǐng)好友,就可以獲得更多鉆石,這也加速了用戶的自發(fā)傳播。

四是痛點(diǎn)捕捉準(zhǔn)確?!笓碛幸惶赘咂焚|(zhì)的寫真需要多少錢?699?1299?3699?除了金錢,拍寫真又需要多少步?定檔期、化妝、造型、拍攝、選圖、修圖、交片……不僅如此,很多女生在約拍時(shí),還可能會(huì)遇到騙子,錢財(cái)甚至安全都得不到保障?!挂陨鲜敲铠喒俜綄?duì)于用戶痛點(diǎn)的介紹,團(tuán)隊(duì)精準(zhǔn)地捕捉到了拍寫真對(duì)于大多數(shù)消費(fèi)者來(lái)說(shuō),是一項(xiàng)在金錢和時(shí)間方面都有很高成本的活動(dòng),消費(fèi)者希望能更便宜、更便捷地得到拍寫真的體驗(yàn)。

妙鴨對(duì)天真藍(lán)會(huì)是「降維打擊」么?

無(wú)需妝造,僅需上傳已有的個(gè)人照片,就能收獲不同風(fēng)格的寫真。妙鴨相機(jī)推出的功能引發(fā)了討論,天真藍(lán)和海馬體這類線下照相館,還有存在的必要嗎?

妙鴨相機(jī)的確想要做目前海馬體們正在做的事。從官方公布的信息來(lái)看,團(tuán)隊(duì)對(duì)妙鴨相機(jī)的定位是「每個(gè)人的AI攝影師」,希望可以幫助用戶「便宜、快捷、安全地追求美」。而社交媒體上的曬圖熱情也體現(xiàn)了大眾對(duì)妙鴨生成效果的肯定?!副砬樽匀弧埂赶褡约河直茸约好酪稽c(diǎn)」是常見的對(duì)其的評(píng)價(jià)。

但是,有很多用戶表示,妙鴨相機(jī)的生成效果并不穩(wěn)定,只有幾個(gè)模版生成的圖像是「能看得過(guò)去的」,而很多模版生成的照片完全不像本人,「有的很像,有的似像非像,有些瘆得慌」,這是試用者小潔的評(píng)價(jià)。有些試用者甚至反饋在生成的所有照片中,找不到一張像自己的,「從數(shù)字分身環(huán)節(jié)開始生成的就是另一個(gè)人」。此外,雙眼皮弧度不太流暢、手部細(xì)節(jié)粗糙是用戶普遍反應(yīng)存在的問(wèn)題。

目前妙鴨相機(jī)的小程序評(píng)分是2.4分(滿分5分),在近3000條評(píng)價(jià)中,可以看到多條「照片失真」的評(píng)價(jià)。

不過(guò),天真藍(lán)和海馬體的寫真照就足夠「寫真」么?

其實(shí)去過(guò)這兩家照相館拍照的人在拿到他們的照片后,也常有這樣的疑惑,好看是好看,但這像我嗎?和AI生成的照片一樣,在線下拍照,成片失真的情況也非常普遍,還有人拿到的照片在辦簽證、考試報(bào)名等環(huán)節(jié)根本無(wú)法通過(guò)。

一位客戶在海馬體照相館門店觀看產(chǎn)品介紹

其實(shí),線下照相館也早已用上了AI技術(shù)。早在2019年,天真藍(lán)的創(chuàng)始人周揚(yáng)就表示過(guò),天真藍(lán)的競(jìng)爭(zhēng)力在于AI人臉識(shí)別修圖技術(shù),能實(shí)現(xiàn)1分鐘修圖,97% 替代人工,并保證100%通過(guò)人臉識(shí)別的標(biāo)準(zhǔn)化運(yùn)作,天真藍(lán)將這套系統(tǒng)稱為「AI修圖中央廚房」。所以,在這些照相館獲得的照片,也不是個(gè)性化的——AI提供了標(biāo)準(zhǔn)化、模版化的流水線作業(yè),這正是照片同質(zhì)化、失真的原因。

所以,AI生成器有的問(wèn)題,線下照相館也少不了。王凱說(shuō),妙鴨相機(jī)目前的技術(shù)水平要代替線下照相館還有一段距離,但圖像生成的技術(shù)一直在發(fā)展進(jìn)步,未來(lái)是很有可能的。比如,如果AI技術(shù)可以幫助用戶生成在公安系統(tǒng)可以過(guò)審的證件照,那會(huì)是一個(gè)非常大的進(jìn)步。

妙鴨還能火多久?

目前,妙鴨主要針對(duì)拍寫真等場(chǎng)景,但對(duì)于大多數(shù)消費(fèi)者,這并不是高頻的、需要經(jīng)常復(fù)購(gòu)的需求。用戶愿意為此類產(chǎn)品付費(fèi),主要還是因?yàn)樾迈r,但再次付費(fèi)的意愿沒(méi)有保證。

在妙鴨出現(xiàn)之前,去年底國(guó)外就有過(guò)同類的圖像生成應(yīng)用Lensa,也是基于Stable Diffusion模型,是同類應(yīng)用中的開創(chuàng)者。Lensa去年11月底推出「魔法頭像」功能,用戶上傳10到20張個(gè)人照片,Lensa 就可以生成各類AI自畫像或頭像。12月,Lensa登頂 App Store「照片和視頻」分類下載榜單榜首。

Lensa按次付費(fèi)的收費(fèi)標(biāo)準(zhǔn)是,生成50個(gè)頭像3.99美元、100個(gè)頭像5.99美元、200個(gè)頭像7.99美元。此外,Lensa還推出了訂閱制的模式。

去年12月,Lensa的下載量突破1700萬(wàn)次,單月收入就達(dá)800萬(wàn)美元。但是,這撥熱度很快沉寂,到今年1月,其下載量跌至不足200萬(wàn)。

圖片來(lái)源:Sensor Tower《2023年AI應(yīng)用市場(chǎng)洞察》

所以,從Lensa的先例來(lái)看,這類產(chǎn)品在用戶留存方面很難持續(xù)。王凱分析,妙鴨相機(jī)之所以定價(jià)9.9元更多是因?yàn)閼?yīng)用處于測(cè)試期,如果想保障產(chǎn)品受歡迎就不能定價(jià)太高,所以虧錢降低使用門檻,當(dāng)然能否讓用戶長(zhǎng)期使用是非常大的挑戰(zhàn)。

目前,妙鴨采取的留存用戶的方式是不斷開發(fā)出新的模版。最近一周,妙鴨上新了多款國(guó)風(fēng)系列模版。7月29日,趁著電影《芭比》的熱度,妙鴨還上線了美式芭比風(fēng)和Y2K風(fēng)格的模版。

妙鴨相機(jī)新推出的兩款造型風(fēng)格

王凱認(rèn)為,在AI圖像生成的市場(chǎng)中,很多賬都已經(jīng)被算得很清楚了,「比如,能生成在線下場(chǎng)景可用的證件照,能加 10 億的市場(chǎng);能生成游戲圖,能加1萬(wàn)億的市場(chǎng);能生成商業(yè)海報(bào),能多幾千億的利潤(rùn)」。所以,妙鴨相機(jī)這種并沒(méi)有技術(shù)創(chuàng)新的應(yīng)用,對(duì)市場(chǎng)的影響甚微。

「Lensa作為一個(gè)開創(chuàng)性的應(yīng)用在國(guó)外推出的時(shí)候,能為市場(chǎng)在圖形生成的應(yīng)用層帶來(lái)啟發(fā),所以能帶動(dòng)一撥商業(yè)行為。但妙鴨這樣的后來(lái)者,其實(shí)對(duì)當(dāng)下全社會(huì)關(guān)注、投資大模型沒(méi)什么影響,大家都能看到大模型帶來(lái)的巨大變革。」王凱說(shuō)。

不過(guò),妙鴨的走紅證明了,當(dāng)下的國(guó)內(nèi)市場(chǎng),或許并不缺乏先進(jìn)的技術(shù),要知道最近發(fā)布的每款國(guó)產(chǎn)開源模型都號(hào)稱在基準(zhǔn)測(cè)試中勝過(guò)美國(guó)競(jìng)品;缺少的反而是對(duì)用戶需求的精準(zhǔn)洞察和將生成式AI落地成產(chǎn)品以滿足這個(gè)需求的能力。

在移動(dòng)互聯(lián)網(wǎng)浪潮初期,正是依靠這種能力才誕生了微信、抖音、美團(tuán)、小紅書這些現(xiàn)象級(jí)應(yīng)用;在生成式AI浪潮下,我們期待下一款「妙鴨」。

-END-

本文版權(quán)歸第一財(cái)經(jīng)所有,

未經(jīng)許可不得轉(zhuǎn)載或翻譯。

2023年金字招牌大調(diào)查已經(jīng)啟動(dòng)啦,

關(guān)鍵詞: