理解 AI 的開放性 – Gabriel Toscano

理解 AI 的開放性:探討 AI 模型釋出的理論、政策與資料

清晰的定義對於涉及複雜技術的法律與政策決策至關重要。藉由將「開源 AI」(Open Source AI)奠基於透明、可驗證且標準化的標準之上,本研究有助於在法律、政策和技術領域之間建立更一致的解讀。本專案為與政策制定者的溝通提供了基於證據的建議,並致力於支持在實務與政策中採用「開源 AI 定義」(Open Source AI Definition,簡稱 OSAID)。

用理論理解開放性:作為邊界物件的開源定義

邊界物件(boundary objects)理論

是指不同群體以不同方式使用、並藉此進行協作的事物或概念。AI 的開放性可以被視為一種邊界物件,作為連結人們與實務運作的黏著劑。

將 OSAID 視為邊界物件,解釋了它為何能同時對法律與合規專業人士以及開發者發揮作用。這兩個群體的實務經驗、關注焦點和知識背景大相徑庭,但都能從使用同一個共享概念中受益。

然而,在競爭激烈的 AI 領域中,關於什麼才算「開放 AI 」的分歧依然存在。重要的是,由於邊界物件具有彈性且可被解讀,因此它們可能會受到質疑、被挪用或被誤解。事實上,我們對於 AI 開放性的標準或定義尚未達成共識。

基礎建設翻轉(infrastructural inversion)

理論提供了一套實用的工具,用以剖析標準與分類是如何建立的。作為一種分析理論,基礎建設翻轉聚焦於技術、技術設計,以及標準與分類被接受並常態化的習慣之間,所存在的相互依賴關係。

根據 Bowler 和 Starr 的說法,「好用且實用的系統幾乎在定義上就會消逝(融入背景)」。這表明實用的標準會被常態化並獲得廣泛認可,即使不一定被所有人深入理解。隨著標準所設定的分類被應用於不同的群體、組織和實例中,標準便逐漸走向常態化。因此,標準是以遞迴(recursive)的方式演進的——它們必須實用才能被接受,而當它們被越廣泛地接受時,就會變得越實用。

AI 開放性的競爭概念

在理解下游的政策影響時,必須注意開放性的定義有何不同。雖然開源軟體(OSS)已經存在了數十年,但 AI 系統中「開放性」的概念才剛起步且充滿爭議。目前至少具體出現了四種定義開放性的體制,這些體制呼應了促進透明度與廣泛參與的利益。不同的開放性概念反映了不同層級和種類的資訊揭露。

1 | 開放權重(open weights)和 2 | 公開權重模型

對於當今的許多 AI 從業者來說,開源 AI 通常是指透過 GitHub 和 Hugging Face 等儲存庫取得的開放權重(open weights) 和公開權重模型。

開放權重模型提供了程式碼與權重的組合,允許對 AI 進行某種程度的使用與修改,但同時也施加了使用限制,例如在特定地區或商業用途的限制。

雖然公開取得模型權重是開放的必要條件,但在實務上,開放權重模型看似秉持著開放的哲學,卻未能提供確保 AI 釋出符合「四大自由」的機制。理想情況下,定義應該提供適度的具體性與通用性,以減少「非預期性」,並增加應用於持續演進之 AI 系統的可能性。

3 | 開源促進會(OSI)推動 OSAID

對於開源促進會(OSI)的 OSAID 的框架而言,系統要麼是開放的,要麼不是。其分類取決於提供了哪些材料以及如何發布。與傳統的開源軟體一樣,這意味著在適用情況下,必須在 OSI 認可的授權條款下,以「便於進行修改的首選形式」提供產出物。

4 | 模型開放性框架(Model Openness Framework, MOF)

模型開放性框架(Model Openness Framework, MOF)將開放性劃分為三個「級別」(classes),每個級別要求不同數量的產出物與資訊揭露,範圍涵蓋程式碼、學術論文,以及詳細記錄訓練與測試程序的模型卡(model cards)。

現行對 AI 和開源 AI 的法律定義存在巨大的分歧潛力,這可能會轉化為截然不同的監管方法。

雖然提出的 AI 和大型語言模型(LLM)法案數量呈上升趨勢且毫無放緩跡象,但儘管被提及的頻率增加,開源尚未扮演核心角色。然而,行政命令、機構指令以及州級新興立法一方面對開放模型的安全性表示擔憂,但同時也強調了在 AI 領域促進近用、創新、去中心化與競爭的必要性。

值得注意的是,現行不論在州級或聯邦級的政策中,都沒有明確使用任何現有標準來區分開源 AI。儘管定義鬆散,但提及「開放」與「開源 AI」表明了無論如何解讀,都有激勵其開發與布署的意圖。