(相關(guān)資料圖)
7月6日消息,2023世界人工智能大會開幕式上,香港中文大學(xué)湯曉鷗教授回顧了在大模型中,中國學(xué)者所做的原創(chuàng)的貢獻。
例如,他的學(xué)生王曉剛2011-13年在CVPR和ICG兩個視覺最重要的會議上,全球共有29篇文章做深度學(xué)習(xí),其中有14篇出自他們實驗室。當(dāng)時,團隊的18項工作在全世界第一次將深度學(xué)習(xí)用到視覺問題上,包括人臉識別、人臉檢測、人臉重建、物體檢測、人體姿態(tài)等計算機視覺最核心的問題。
此外,湯曉鷗談到,2009年學(xué)生何愷明博士曾在碩士期間取得了CVPR最佳論文,這是CVPR25年歷史上從亞洲出來的第一篇最佳論文。此后,何愷明在微軟和Facebook工作后,還解決的深度網(wǎng)絡(luò)梯度傳遞的問題,獲得了2016年的最佳論文。在此基礎(chǔ)上,人們可以有效的訓(xùn)練超過百層的深度學(xué)習(xí),在大模型時代,以Transformer為核心的大模型,包括GPT系列,普遍采用了這個結(jié)構(gòu)。
湯曉鷗表示,兩周前,我們自動駕駛大模型從9155篇文章中脫穎而出,獲得了CVPR2023年的最佳論文獎。根據(jù)谷歌學(xué)術(shù)統(tǒng)計,這是改革開放40多年來第一篇全部由中國學(xué)者完成的國際計算機視覺三大頂級論壇最佳論文。(湯姆)
關(guān)鍵詞: