為什麼 Meta 要開放 Llama 模型?

Louis
5 min readSep 21, 2024

上週 (2024/09/10) 去看了 Aquired podcast 的現場 (Chase Center @ SF)。這場訪談解開了一個困擾我很久的商業策略問題:為什麼 Meta 要開放 Llama 模型? (後述,中間讓我建立情境)

開頭的第一段是訪問 Spotify 創辦人 Daniel Ek,無聊到我一度以為是在參加 Spotify 的 All-hands meeting。考慮這是 content provider (Acquired) 與 content platform (Spotify) 互相拉抬吹捧的場子,我就邊吃炸雞邊喝可樂配著聽 (對訪談內容完全忘光了)。

第二段則是我最喜歡的彭博台裔主持人張秀春 (Emily Chang),她的逆向訪問兩位主持人,剾洗 (挖苦) Acquired 主持人當年看走眼的幾家公司 (Starlink … 等),非常有意思。

重頭戲則是目前身受中年危機之苦的 Meta 創辦人 Mark Zurkerberg (人到中年還在衣服裝飾上面搞怪,不是外遇就是中年危機)。

(台下肯定有很多 Meta 的員工,平日 all-hands 聽不夠,自己還掏腰包來會場聽老闆 all-hands)。

有關 Mark 的訪談部份,這幾天的新聞報導陸續出來,Acquired 也放到網路上了,有影片也有逐字稿:

https://www.acquired.fm/episodes/the-mark-zuckerberg-interview

回到我的主題。各大媒體都有不同角度報導,看了幾天,都沒有提到我的問題,所以我決定來寫一下這個遺漏的角度:開源/開模的商業考量。

註:開源與開模略有不同。開源 (open source) 是指把軟體程式碼公開;而開模是指「開放模型 (open model)」,任何人可以下載使用。

大企業的開源/開模都有其戰略目地(畢竟投入大量資本,必須有合理的回報),例如:

  • Android 是為了讓更多硬體廠商加入,也培養更多的系統整合人才,建立龐大的生態圈:增加市佔率,人才來源庫,以及更多的手機廠牌與半導體加入 (對比封閉的 iOS 系統,Android 的整體生態圈更多元),最終從廣告收入回收成本。
  • Meta 的 Open Compute 也是為了讓更多的廠商加入供應鍊,最終節省資料中心的伺服器成本。
  • Meta 的 Pytorch 開源的目地則是讓外面的開發人員一起貢獻,優化軟體效率與增加功能,某種程度也是降低人力成本。

總結來說,大企業開源的目地不外乎「降低成本 (人才或硬體)」或是「把市場做大,讓自己的營收增加」,最終讓企業純利增加。

但是 Llama 卻沒有落入這些範疇,Meta 只開放了訓練完的 Llama 模型:

  • 所有人下載完模型後就離開,Meta 不收一分錢。
  • 但是 CSP (Cloud Service Provider)…

--

--

Louis

A maker who believes that software can change the world. Love science, engineering and economics. From Taiwan. Living in Bay Area.