理解 AI 的開放性:AI 模型發布的理論、政策與資料

理解 AI 的開放性

探索 AI 模型發布的理論、政策與資料

面對複雜科技,清楚的定義是制定法律與政策決策的必要基礎。這項研究以透明、可驗證且標準化的準則界定開放原始碼人工智慧(Open Source AI),協助法律、政策與技術領域形成更一致的解釋。此計畫提出以實證為基礎的政策溝通建議,也投入推動「開放原始碼人工智慧定義」(Open Source AI Definition,OSAID)落實於實務與政策的工作。

以理論理解 AI 的開放性

作為邊界物件的開放原始碼定義

「邊界物件」(boundary object)理論所指的是由不同社群以不同方式使用,並讓這些社群得以合作的事物或概念。AI 的開放性可以被視為一種邊界物件,成為串連不同人員與實務的運作黏著劑。

將 OSAID 視為邊界物件,可以解釋它為何對法律與法遵專業人士及開發者同樣有用。這兩個社群的實務、關注議題與知識背景差異很大,卻都能因採用共同概念而受益。

然而,在競爭激烈的 AI 領域,對於什麼才算是「開放」AI,始終存在許多爭議。尤其邊界物件具有彈性且可被詮釋,因此也可能受到挑戰、挪用或誤解。事實上,我們目前對 AI 開放性的標準或定義仍未達成共識。

「基礎設施反轉」(infrastructural inversion)理論提供了一套實用工具,用來剖析標準與分類如何建立。這套分析理論著重於科技、設計,以及促使標準與分類獲得接受並成為常態的習慣,三者之間的相互依存關係。

Bowler 與 Starr 指出:「好用的系統幾乎必然會隱而不見。」這意味著,實用的標準會成為常態並獲得廣泛認可,但不一定受到廣泛理解。當標準所設定的分類被不同群體、組織及案例採用時,標準便會逐漸常態化。因此,標準會以遞迴方式演進:它必須實用才能獲得接受,而愈多人接受,它也會變得愈實用。

AI 開放性的不同主張

若要理解後續的政策影響,就必須注意各種開放性定義之間的差異。開放原始碼軟體(Open Source Software,OSS)已存在數十年,但 AI 系統的「開放性」仍是新興且備受爭議的概念。目前至少出現四種界定開放性的體系,分別呼應促進透明度與廣泛參與的不同訴求。各種開放性主張所反映的,是不同程度及類型的資訊揭露。

對今日許多 AI 實務工作者而言,開放原始碼 AI 通常是指開放權重,以及透過 GitHub、Hugging Face 等儲存庫公開提供權重的模型。開放權重模型會以不同組合提供程式碼及權重,讓使用者能在一定程度上使用及修改 AI,但同時設有使用限制,例如限制在特定地區使用或用於商業用途。

開放模型權重雖是實現開放性的必要條件,但實務上,開放權重模型看似秉持開放理念,卻未能提供足以保障 AI 發布內容符合四項自由的機制。理想上,定義應在明確性與通用性之間取得適當平衡,以減少「非預期情況」,並提高定義持續適用於不斷演進之 AI 系統的可能性。

依照開放原始碼促進會(Open Source Initiative,OSI)及 OSAID 的二元框架,一套系統不是開放,就是不開放。分類結果取決於發布了哪些材料,以及各項材料以何種方式發布。如同傳統 OSS,這代表相關成果必須以「適合進行修改的首選形式」提供,並在適用時採用 OSI 核准的授權條款。

「模型開放性框架」(Model Openness Framework,MOF)以三個「級別」定義開放性。各級別要求提供不同數量的成果與揭露資訊,涵蓋程式碼、學術論文,以及詳述訓練與測試程序的模型卡等內容。

現有的 AI 與開放原始碼 AI 法律定義之間,存在極大的分歧空間,而這很可能進一步導致不同的監管方式。

AI 與大型語言模型(LLM)相關法案的提出數量持續上升,且沒有減緩跡象。儘管開放原始碼受到愈來愈多關注,卻尚未成為政策核心。然而,行政命令、政府機關指示,以及各州逐漸出現的立法,一方面顯示對開放模型安全性的疑慮,另一方面也強調有必要在 AI 領域促進近用、創新、去中心化與競爭。

值得注意的是,目前州政府或聯邦政府的政策,都尚未明確採用任何現有標準來區分開放原始碼 AI。儘管如此,即使「開放」與「開放原始碼 AI」的定義仍相當寬鬆,政策中提及這些概念,仍顯示出鼓勵其開發與部署的意圖,無論這些概念最終如何界定。