不僅是大模型本身,Meta 也要成為 AI 基建大廠(chǎng)。作者:靖宇
「21 世紀(jì)最貴的是什么?人才!」多年前葛優(yōu)在《天下無(wú)賊》里臺(tái)詞的含金量,還在不斷提升。當(dāng)?shù)貢r(shí)間 6 月 10 日,媒體曝光 Meta 將以 149 億美元(折合人民幣約 1066 億元)的價(jià)格收購(gòu) Scale AI 49% 的股權(quán),而后者的聯(lián)合創(chuàng)始人 Alexandr Wang,將成為 Meta 新成立的「超級(jí)智能小組」的掌門(mén)。按照股權(quán)比推算,此次交易 Wang 和團(tuán)隊(duì)有可能獲得 74 億美元,堪稱(chēng)是硅谷成本最高的「挖角」——要知道,谷歌在 2014 年收購(gòu) DeepMind 團(tuán)隊(duì)不過(guò) 6 億美元。扎克伯格在內(nèi)部信中寫(xiě)道:「我們將共同構(gòu)建 AI 的未來(lái)?!乖?Llama 4 模型折戟、AI 團(tuán)隊(duì)人員不斷流失的現(xiàn)實(shí)下,Meta 此次大舉押注 Scale AI,圖的是什么?有了 Scale AI 和 Alexandr Wang,Meta 能在接下來(lái)的 AI 大戰(zhàn)中,重新找到自己的位置嗎?
01 最貴的「搖擺人」
作為 AI 時(shí)代硅谷躥升最快的公司,Scale AI 的估值一直以火箭速度躥升,短短 5 年時(shí)間就膨脹至 138 億美元。然而,此次 Meta 收購(gòu)前者 49% 的股權(quán),就需要付出 149 億美元的成本。49% 顯然是為了反壟斷審查考慮,但 Meta 和扎克伯格想要的,是聯(lián)合創(chuàng)始人之一 Alexandr Wang 這個(gè)人——這位 19 歲創(chuàng)業(yè)的天才將成為 Meta 新成立的超級(jí)智能實(shí)驗(yàn)室的負(fù)責(zé)人,帶領(lǐng) Meta AI 進(jìn)入新時(shí)代。
說(shuō) Meta 徹底買(mǎi)下 Wang 并不確切,因?yàn)?Wang 將繼續(xù)擔(dān)任 Scale AI 的 CEO 一職,代表 Wang 和 Scale AI 還將繼續(xù)保持「獨(dú)立」,這可能也是歷史上成本最高的「腳踏兩只船」,而 Scale AI 如果保持增長(zhǎng)勢(shì)頭,Wang 則可能成為硅谷身家增長(zhǎng)最快的創(chuàng)業(yè)者,沒(méi)有之一。扎克伯格如此急不可耐地、以 Meta 以罕見(jiàn)的金額出手押注 Scale AI 和 Wang,體現(xiàn)出的是他因 Meta 在 AI 競(jìng)賽中逐漸掉隊(duì)的焦慮。
盡管 Meta 在 2024 年推出了參數(shù)規(guī)模達(dá) 1.8 萬(wàn)億的 Llama 4 Behemoth,但其在多模態(tài)理解、長(zhǎng)文本推理等關(guān)鍵指標(biāo)上仍落后 GPT-4.5 約 12%。更尷尬的是,Llama 訓(xùn)練數(shù)據(jù)的質(zhì)量問(wèn)題被曝光:業(yè)內(nèi)估算約 30% 的語(yǔ)料來(lái)自低質(zhì)量社交媒體內(nèi)容,導(dǎo)致模型頻繁輸出錯(cuò)誤信息。「我們?nèi)钡牟皇撬懔?,是干凈的?shù)據(jù)和頂尖工程人才?!挂晃?Meta AI 研究員匿名吐槽。這解釋了為何扎克伯格要砸重金請(qǐng)來(lái) Wang——一個(gè)以數(shù)據(jù)標(biāo)注技術(shù)聞名的「基建狂魔」。
作為估值最高的數(shù)據(jù)標(biāo)注公司,Scale AI 的躥紅不是沒(méi)有道理。根據(jù)報(bào)道,Scale AI 的護(hù)城河在于其將原始數(shù)據(jù)轉(zhuǎn)化為 AI 可用燃料的能力:軍事級(jí)標(biāo)注精度:通過(guò)混合人類(lèi)標(biāo)注員+AI 質(zhì)檢的「雙保險(xiǎn)」,其數(shù)據(jù)錯(cuò)誤率僅 0.3%,而行業(yè)平均為 5%(公司自述)。多模態(tài)數(shù)據(jù)壟斷:擁有全球最大的視頻動(dòng)作標(biāo)注庫(kù)(含 1.2 億條人體動(dòng)作數(shù)據(jù))和跨語(yǔ)言文本數(shù)據(jù)集(覆蓋 217 種語(yǔ)言)。
花 149 億美元巨資買(mǎi)下「半個(gè)」Scale AI 和 Wang 本人,Meta 的野心不僅僅在于 AI 大模型本身。
02 轉(zhuǎn)型 AI 基建,彌補(bǔ) B 端短板
數(shù)據(jù)、算力和模型,是大模型領(lǐng)域的三要素,Meta 作為社交巨頭,在數(shù)據(jù)和算力上有著天然優(yōu)勢(shì),不過(guò)在「數(shù)據(jù)」上需要打個(gè)引號(hào),因?yàn)?Meta 的數(shù)據(jù)量雖然大,但如果質(zhì)量不行,對(duì)于 AI 模型訓(xùn)練作用不大?!改銈兛吹降拿總€(gè) GPT 回復(fù),背后都有我們標(biāo)注的 500 個(gè)數(shù)據(jù)點(diǎn)。」Wang 的這句話(huà),解釋了 Meta 的焦慮。當(dāng) OpenAI 用 Scale AI 的數(shù)據(jù)訓(xùn)練出更聰明的模型時(shí),Meta 卻困在自家社交數(shù)據(jù)的孤島里。收購(gòu) Scale AI,等于直接接管了競(jìng)爭(zhēng)對(duì)手的「彈藥庫(kù)」。
Scale AI 手握全球 35% 的 AI 訓(xùn)練數(shù)據(jù)流量,服務(wù)著從五角大樓到 OpenAI 的頂級(jí)客戶(hù)。Meta 研究院的工程師私下吐槽:「我們用 Llama 3 訓(xùn)練時(shí),30% 算力浪費(fèi)在清洗垃圾數(shù)據(jù)上,而 Scale AI 的標(biāo)注精度能達(dá)到 99.7%。」
有了 Scale AI 精準(zhǔn)的數(shù)據(jù)清洗和標(biāo)注,業(yè)內(nèi)估計(jì) Meta 將訓(xùn)練數(shù)據(jù)污染率從 15% 降至 2%,下一代 Llama 5 的訓(xùn)練周期縮短 40%。知情人士透露,正在測(cè)試的「Llama 5 Behemoth」參數(shù)規(guī)模達(dá) 3 萬(wàn)億,專(zhuān)門(mén)用于攻克 AGI。同時(shí),Scale AI 的標(biāo)注系統(tǒng)已深度適配 Meta 定制 AI 芯片架構(gòu),形成「數(shù)據(jù)標(biāo)注-模型訓(xùn)練-硬件優(yōu)化」閉環(huán),有可能使 Llama 模型推理成本降低至 GPT-4o 的 1/3。
可以說(shuō),引入 Scale AI 后,Meta 的 Llama 模型從訓(xùn)練質(zhì)量、效率和成本上都將獲得大幅優(yōu)化。事實(shí)上,Scale 的接入,甚至可能重塑 Meta 在 AI 競(jìng)爭(zhēng)中的整個(gè)戰(zhàn)略。相比于 Google 和微軟,缺少云計(jì)算平臺(tái)的 Meta 一直只能在 C 端撒野。而有了 Scale 的能力,Meta 計(jì)劃通過(guò) AWS/Azure 等云平臺(tái)對(duì)外提供 Scale AI 數(shù)據(jù)服務(wù),構(gòu)建類(lèi)似微軟「Copilot+OpenAI」的生態(tài)閉環(huán),將競(jìng)爭(zhēng)對(duì)手轉(zhuǎn)化為客戶(hù)。
如果說(shuō)數(shù)據(jù)是新時(shí)代的石油,那么 Meta 通過(guò)購(gòu)買(mǎi) Scale AI 這家份額最大的「數(shù)據(jù)精煉廠(chǎng)」,已經(jīng)掌握了大半個(gè) AI 基建體系。
當(dāng)然,OpenAI、Anthropic 等競(jìng)爭(zhēng)對(duì)手到底會(huì)不會(huì)買(mǎi)賬目前仍未可知,雖然 Meta 僅僅買(mǎi)下半個(gè) Scale AI(和半個(gè) Wang),但顯然已經(jīng)足夠讓前者警惕 Scale AI 的中立地位,所以 openAI 也在加緊和 Scale AI 的競(jìng)爭(zhēng)對(duì)手 Handshake 合作。不過(guò),鑒于 Scale AI 在數(shù)據(jù)標(biāo)注方面的壓倒性?xún)?yōu)勢(shì),OpenAI 等公司要想馬上和 Scale AI 斷聯(lián),也不太現(xiàn)實(shí)。至少在短期內(nèi),AI 巨頭們依然需要 Scale AI 的服務(wù)。
即便 Scale AI 之前的客戶(hù)們逐漸減少下單,Meta 和 Scale AI 已經(jīng)謀劃新的收入來(lái)源——政府和國(guó)防客戶(hù)。根據(jù)報(bào)道,Scale AI 合作,已經(jīng)獲得來(lái)自美軍方超過(guò) 2 億美元的政府訂單。同時(shí),Scale AI 本身也在向國(guó)防定制等垂直領(lǐng)域的 AI 應(yīng)用層擴(kuò)展,而 Meta 的企業(yè)級(jí)銷(xiāo)售能力和背書(shū),無(wú)疑會(huì)對(duì) Scale AI 未來(lái)的發(fā)展提供足夠動(dòng)力。
業(yè)內(nèi)人士傳言,Meta 和 Scale AI 的巨額交易還有一個(gè)隱藏對(duì)賭:若 Scale AI 未來(lái)三年收入增速低于 80%,Meta 有權(quán)以折扣價(jià)收購(gòu)剩余股份——這代表 Wang 不僅要「讓 Meta AI 再次偉大」,同時(shí)自己的 Scale AI 在收入上也要繼續(xù)高速增長(zhǎng)。而 B 端業(yè)務(wù)顯然會(huì)成為雙方的新增速來(lái)源。
對(duì)于 Meta 團(tuán)隊(duì),Wang 即便作為「腳踏兩只船」的超級(jí)智能實(shí)驗(yàn)室負(fù)責(zé)人加入,也能產(chǎn)生極強(qiáng)的「鯰魚(yú)效應(yīng)」。在硅谷 AI 界,Meta 向來(lái)以學(xué)術(shù)氛圍濃厚著稱(chēng),Llama 的開(kāi)源和普惠正是其學(xué)術(shù)思考的結(jié)果。但 Wang 極力推崇的「數(shù)據(jù)思維」無(wú)疑將對(duì) Meta 現(xiàn)有的 AI 團(tuán)隊(duì)產(chǎn)生沖擊和改變。根據(jù)媒體報(bào)道,Wang 剛剛加入 Meta,反手就砍掉三個(gè)學(xué)術(shù)項(xiàng)目,推動(dòng)團(tuán)隊(duì)向更「現(xiàn)實(shí)」的方向轉(zhuǎn)型。
如果不考慮反壟斷的阻撓,此次 Meta 對(duì)于 Scale AI 和 Wang 本人的巨額押注,可能重塑 Meta 在激烈的 AI 競(jìng)爭(zhēng)中的角色和發(fā)展方向,不僅讓 Meta 快速縮短和競(jìng)爭(zhēng)對(duì)手在模型領(lǐng)域的差距,更能使這個(gè)社交巨頭,完成從應(yīng)用到 AI 基建角色的轉(zhuǎn)變。這場(chǎng)豪賭的本質(zhì),是 Meta 試圖用資本力量重寫(xiě) AI 競(jìng)爭(zhēng)規(guī)則。正如硅谷分析師 Sarah Guo 所言:「當(dāng)所有人都在造車(chē)時(shí),Meta 買(mǎi)下了整條高速公路——不管車(chē)上坐的是誰(shuí),都得交過(guò)路費(fèi)?!?/p>
本文網(wǎng)址:http://www.iy168.cn/news/10652.html