過往曾經把元宇宙(Metaverse)當成第一發展重點的Facebook,連公司的名字都改成Meta,表現出推動元宇宙的決心,雖然公司在元宇宙的努力沒有其想像的成功,但公司似乎有通過推動生成式AI(AIGC) 從而推動元宇宙發展的想法。公司在幾個月前甚至創建了AIGC團隊,並且發佈了一系列AIGC開源工具。
AIGC的佈局方面,相對於對手OpenAI和Google等日益注重保密,Meta則在開源領域積極分享AI研究,繼這幾個月來發佈了開源的大語型言模型LLaMA和線上圖片分塊工具Segment Anything、電腦視覺領域的預訓練大模型DINOv2等資源後,又再有一個與AI相關的開源模型ImageBind,是第一個能夠整合6種類型數據的AI模型,它的6種模式包括文字,聲音,影片,圖像,深度圖,熱力圖和慣性運動,這樣不需要開發人員對每一個模式組合的資料進行訓練,也能製作出跨模式的應用。它的出現能夠提高AI的搜索能力,VR體驗以及更高級的AI技術。它可以將3D感測器和IMU慣性感測器結合,實現元宇宙等沉浸式虛擬空間。
舉例,聽到汽車引擎聲音然後給一些沙的照片可以生成汽車在沙灘等對應的深度圖和文字描述,甚至可以光是使用音頻便能產生圖像。相對於MidJourney, Stable Diffusion等使用簡單文字於圖像配對的圖像生成器,它能夠更加接近人類的思考和擁有感知能力。通過集齊6種模態,可以實現一些只靠文本的GPT-4無法實現的花式功能。
ImageBind雖然是Meta的開源項目,但表面上不能商用,而隨著AIGC的多元化的迅速發展,對於META和Google這些廣告平台更有利,因為可以產生更精準更個人化的營銷廣告。過往是通過用戶特徵喜好等資料個性化推送廣告,以後AIGC的盛行,可以讓每個用戶所瀏覽同一個商家的廣告內容更不一樣,例如雖然每個香水目標用戶被推送的都是賣香水,但是用戶A可能是把香水放在喜歡的海灘,用戶B可能是喜歡的高級西餐廳,產生千人千面的營銷內容,這樣可能有助提高廣告轉化率,讓廣告平台和商家雙雙得益。據其首席技術官Andrew Bosworth稱:「公司打算推出工具來使用AI製作廣告內容,幫助公司為不同的受眾製作不同的圖像,並且希望能把公司開發的生成式AI商業化,亦計劃與Google等業者共同構思相關應用可能性。」
由此可見,AIGC除了能產生AIGC廣告服務收入和把AIGC工具商業化外,Meta公司推動AIGC也是其元宇宙發展戰略的重要一環,雖然目前元宇宙只是一個過氣炒作,但是以後真的可能可以創造出全新虛擬社交場景,這是由於AIGC的誕生,以前人類創造人機交互體驗需要通過程序員去開發構建,隨著程序員開發了這些讀懂人類感知體驗,人類語言等的大模型以及工具,普通人便能夠演變成程序員並且跨行業跨專業的進行多模態的人機交互,輕鬆創造多樣化的內容。
簡志健,持證監會持牌人士,博立聯合創辦人/中原資產管理投資總監
傅可怡,持證監會持牌人士,博立研究團隊/中原資產管理高級分析員