AI 對文化資產社群而言並不陌生。二十多年來,圖書館、博物館與檔案館已開發並應用特定領域的機器學習技術,包括擴充後設資料、語音轉文字、影像辨識、手寫文字辨識與光學字元辨識。

正在改變的是 AI 的規模、速度、應用範圍及其社會影響力;大型語言模型(LLM)與生成式 AI 的發展,使這些變化成為可能。

AI 已成為無所不在的社會文化技術,正在重塑知識、文化與歷史的生產、取用及詮釋方式。AI 模型日益介入意義的建構,汲取社會共享的知識與文化產出。AI 也正在改變文化內容於網路上呈現的方式。

僅僅讓內容可供取用已不再足夠:作品日益透過平台介面、策展系統及演算法路徑被人發現,而這些機制可能強化甚至加劇平台把關、能見度不均與關注失衡等問題。

因此,AI 系統的設計必須能夠呈現、推薦並提升文化與語言多樣性的能見度。1

當每六人中就有一人2使用生成式 AI 回答問題、翻譯或協助決策時,AI 所帶來的影響便不再只是技術問題,而是社會、文化與政治問題。AI 工具也日益成為具有重大影響力的資料儲存庫。

1 European Commission: Directorate-General for Education, Youth, Sport and Culture, Panteia, KEA European Affairs, Vrije Universiteit Brussel, DELab – University of Warsaw, Erasmus University Rotterdam, IDEA Consult, Clarke, M., Vroonhof, P., Byrne, C., Petrov, L., Le Gall, A., Antonucci, F., Albertelli, A., Rolando, E., Ranaivoson, H., Salganik, R., Wiratama, V., Afilipoaie, A., Hardy, W., Paliński, M., Rożynek, S., Berkers, P., Calkins, T., Wijngaarden, Y., Vuijlsteke, C., Valintelyte, E. Janssens, J.,《數位環境中多元歐洲文化內容的可發現性研究——最終報告》(Study on the discoverability of diverse European cultural content in the digital environment – Final report),歐盟出版局,2026,https: //data.europa.eu/doi/10.2766/8868773

2 Microsoft AI Economy Institute:《2025 年全球 AI 採用情況——持續擴大的數位落差》(Global AI Adoption in 2025—A Widening Digital Divide)。

一份近期發布的報告說明了這個現象:2025 年,維基百科的人類流量下降了 8%,機器人活動卻激增 50%。3 AI 不只是在取用或閱讀維基百科的內容,更可能正在取代維基百科,成為人們取得知識的介面。這引發了迫切的問題:AI 系統使用哪些知識進行訓練、在什麼條件下進行,又是為誰的利益服務?肩負文化記憶保存責任的機構,不能繼續只是中立的旁觀者。

這些機構必須做出選擇:是適應由他人設計的基礎設施,還是積極參與塑造這些基礎設施的運作方式。參與 AI 發展不只是採用技術的問題,更關乎機構定位、民主責任,以及長期文化主權的維護。1950 年代的菸草工人——1950 年,希臘薩索斯市——CC BY。3 Wikimedia、IMD、Open Future:《集體智慧與人工智慧》(Collective Intelligence vs Artificial Intelligence)。

文化遺產領域啟動了「文化與 AI 對齊大會」(Alignment Assembly on Culture for AI)1.1,5 這是一項集體智慧行動,自 2025 年 5 月起已有超過 400 位專業人士參與。首批洞見於 2025 年 10 月發布,盤點了整個領域中的共識、摩擦與不確定之處,同時也找出後續集體工作的優先事項。建立本領域對 AI 的信心:「文化與 AI 對齊大會」。

文化遺產社群從來不是數位變革的被動旁觀者;它一直積極建構以公共價值為基礎的基礎設施、標準與工具,其影響往往超越自身領域,成為其他領域的典範。4 大會顯示,本領域希望運用自身的專業知識與價值觀,積極塑造更公平、更健全的資訊生態系,同時管理相關風險。

本文支持這項願景,並提出明確主張:在 AI 時代,文化遺產領域應成為積極的行動力量,既維護公共價值,也塑造未來的發展機會。如今,本領域同樣面臨挑戰,必須以明確且一致的立場參與 AI,並共同塑造其發展方向。第一步是建立共同歐洲文化遺產資料空間。4 相關貢獻包括制定 IIIF 等技術標準,以及推廣創用 CC(Creative Commons)授權條款。

5 「對齊大會」(Alignment Assembly)透過專門規劃的交流管道,蒐集文化資產專業社群的見解與回饋。

這些管道包括透過 polis.eu 進行的線上立場調查,以及後續數場線上與實體聚會:2025 年 10 月於哥本哈根舉行的歐洲數位文化協會(Europeana Network Association,ENA)「文化與 AI」(Culture for AI)跨社群工作坊、2025 年 12 月的 AI4LAM Fantastic Futures 大會、2025 年 11 月及 2026 年 3 月與 ENA 會員委員會及 Europeana 聚合機構論壇進行的諮詢,以及針對白皮書本身撰寫工作的諮詢。

文化資產領域對可用、互惠且可靠 AI 的觀點

可靠

文化資產資料能提供可追溯性、可信度、脈絡資訊,以及具歷史根據的知識。這是 AI 系統提供溯源資訊的關鍵,讓輸出結果可追溯至其來源與脈絡。

互惠

資料治理必須確保資料的使用能創造集體利益,並尊重社群與機構決定資料如何使用的權力,同時以責任與倫理關懷為基礎。

可用

文化資產內容與詮釋資料必須易於取得、具互通性,並有充分的文件紀錄,以支援有意義的再利用,包括依循 FAIR 原則用於 AI 開發。

互惠性目前尤其承受壓力,因為文化資產資料正遭到大規模再利用,卻缺乏充分的回饋。為此,本領域必須為文化資產資料如何用於 AI 設定明確的界線與條件。

這些規範應防止資料被納入不透明、具掠奪性、不符合本領域價值,或未對負責維護資料的公共機構提供任何回饋的 AI 系統。

AI 機器人要求存取文化資產資料的情況日益增加,顯示這類資料在 AI 生態系中的關聯性與戰略重要性持續提升。

Europeana 與資料空間協助文化資產機構開放典藏,促成新的再利用方式,包括用於 AI 開發。

本領域也必須主動與 AI 接軌,以開創新的近用、參與方式與社會價值。這類互動應以本領域的公共利益使命與價值為指引。

可用性(Usability)是指,在尊重創作者的權利與意願,以及遵循相關法規框架的同時,確保內容與詮釋資料易於存取、具互通性,並有充分完善的文件,讓資料得以有意義地再利用,符合 FAIR 原則(可發現、可存取、可互通、可再利用)。Europeana 與資料空間建立在三項價值之上:可用、互惠與可靠。在 AI 時代,這些價值不僅是促進創新的必要條件,也有助於建立更多元、更具代表性、更能理解情境的 AI 系統,從而維護公共利益並創造更多公共價值。這與 CARE 原則(集體利益、控制權、責任與倫理)完全一致。CARE 原則提醒我們,資料治理不能只著眼於存取與再利用,還必須確保資料的使用能創造集體利益,尊重社群與機構決定資料使用方式的權力,並以責任和倫理關懷為基礎。

再利用環境的轉變也帶來了新的壓力。

正如 Alignment Assembly 所呈現的,即使開放符合公共利益,文化遺產機構仍可能將其感受為控制權的喪失。對許多機構而言,挑戰已不再是是否應允許再利用,而是如何在不斷變化的條件下,維持資料的開放性與可用性。這也涉及維護基礎設施、改善資料品質、擴大數位化,以及確保更多館藏能被有意義地再利用等實際成本。

文化遺產資料被廣泛再利用,本身並不是問題:這些機構保存並分享所照管的館藏,是基於其公共使命,而不是因為期待獲得補償。當這種關係從互惠轉為單方面攫取,並耗損無法同時負荷一般使用者與 AI 機器人程式的基礎設施時,問題才會出現。

互惠

文化遺產機構大多由公共資金支持,透過分享知識與基礎設施來服務公眾。現今的資訊生態系日益由少數私人業者主導;這些業者受益於資訊的開放存取,卻沒有……

以能維繫共享資源服務的方式回饋,但這也揭示了一項新現實:人工智慧(AI)系統正取用這些資源。缺乏互惠的開放模式,可能強化既有的權力集中;AI 已成為公共知識基礎設施的重要受眾,而支援這類受眾需要特定的資金與協助。這也會破壞長久以來塑造開放知識生態系的協作與共享利益原則。

部分生成式 AI 公司仰賴大規模資料抓取,使用文化資產機構數十年來透過公共投資建立的資源,卻未回饋其所創造的價值。值此假訊息增加、信任下降之際,文化資產資料能提供可追溯性、可信度、脈絡化資訊,以及具歷史根據的知識。

相反地,公帑資助的機構必須承擔伺服器負荷、基礎設施壓力、防禦性技術措施、法律不確定性,以及其所維護館藏遭再利用而衍生的聲譽風險。這可能使未提供來源及其脈絡等出處資訊的 AI 系統失去正當性。最終形成結構性失衡:公共機構承擔責任與成本,私人實體卻獲取不成比例的利益。同時,為 AI 提供可靠的文化資產資料,也有其自身的挑戰。

文化資產機構不一定能完全確定其數位館藏或後設資料的正確性與來源。這不僅會危及機構提供健全公共服務的能力,其資料也並非中立:數位化、典藏與編目實務,反映了歷史與當代的權力結構、偏見與缺漏。6 以現有資料訓練的 AI,可能在輸出中強化這些不平等,將歷史上的缺聲與帶有偏見的描述轉化為機器可讀的「事實」。

這些限制顯示,文化資產機構並非絕對不會出錯;然而,憑藉其專業能力與公共使命,它們有充分條件辨識缺漏並處理偏見,為建立更可信賴的數位知識基礎設施作出貢獻。「文化資產領域應發展自己對 AI 的論述,並使其具有包容性。

而是植基於我們的價值,而非僅著眼於效率與商業利益。」綜合來看,這些發展顯示,協作大會(Alignment Assembly)的價值聲明所體現的「可用」、「互惠」與「可靠」,不僅攸關文化資產領域如何採用 AI,也影響該領域如何參與形塑更廣泛的 AI 生態系。6 Taes, S., Truyen, F., Da Milano, C., Herlt, K., Rose, K., & Welter, J.(2024)。

在後設資料中呈現多樣性:給文化資產機構與專業人員的建議及實施策略。

互惠關係:AI 服務文化,文化形塑 AI

AI 可以服務文化資產機構及其業務(AI for Culture),而文化資產領域也能反過來形塑 AI 及其使用方式(Culture for AI)。

AI 服務文化

AI 在文化資產領域的效益與多元應用,已有廣泛的盤點與論述。7 AI 工具能大規模支援館藏的註記、分類、策展、內容增補與探索。

這些工具能協助專業人員更有效地處理規模日益龐大、內容愈加複雜的數位語料庫。Pavol Socháň,《Dievčatá v Brezovej》。它們也能提升實體與線上館藏的可近用性。斯洛伐克國家美術館(Slovak National Gallery),斯洛伐克—公有領域。7 例如參見 Münster, S.; Maiwald, F.; di Lenardo, I.; Henriksson, J.; Isaac, A.; Graf, M. M.; Beck, C.; Oomen, J. Artificial Intelligence for Digital Heritage Innovation: Setting up a R&D Agenda for Europe. Heritage 2024, 7, 794–816。

https://doi.org/10.3390/heritage7020038

它們能改善館藏管理流程,從重複資料排除與品質控管、權利聲明管理,到偵測既有後設資料中敏感或有害的語言。最終,它們能增進文化資產機構內部的能力。

文化形塑 AI

「文化形塑 AI」(Culture for AI)的概念,反映文化資產機構在為公共利益打造更公平的 AI 生態系方面所能扮演的角色。本文歸納出四項主要貢獻。

第一項貢獻在於資料層。文化資產機構守護著一項策略性資源:規模龐大、經過策展整理,且涵蓋多種語言的典藏。這些典藏內容多元、紀錄完善,並具有豐富的脈絡知識。若以這類高品質資料訓練 AI 系統,本領域便能直接影響系統的真實性、代表性,以及以資料來源為基礎的應用。儘管文化資產資料已被用於訓練 AI,在許多訓練資料集中仍明顯缺乏代表性。

若將這些工具審慎整合至工作流程中,它們並不會取代專業判斷,而是加以強化,讓實務工作者能專注於脈絡化、詮釋及公眾參與。

本領域長期投入負責任的 AI 整合與實驗,包括 EuropeanaTech、AI4LAM8、AI4Culture9、Transkribus10 等倡議,以及各國圖書館、博物館與檔案館主導的計畫。

8 https: //ai4lam.org/.9 https: //ai4culture.eu/.

10 https: //www.transkribus.org/about/members.

本領域能為 AI 提供的遠不只資料。第二項貢獻,是長久以來以公平、互惠的方式管理資料存取與再利用的實務經驗:提供以公共利益與民主問責為核心所設計的規範與治理原則,完全符合本領域致力維護的 FAIR 與 CARE 原則。

第三,文化資產專業工作者應參與塑造專為文化資產領域打造的小型專用 AI 模型11,而不應被貶抑為單純的訓練資料來源。

最後,第四項貢獻是協助公民理解 AI,並以批判性觀點與 AI 互動,藉此支持知情參與、批判性思考與民主韌性。

文化資產機構可透過展覽、教育計畫、公共活動及數位參與,在機構與社會層面推動公共 AI 素養。

「圖書館 AI 策略的這項關鍵面向,目前大多仍未受到注意——然而,這恰恰是圖書館應發揮領導作用之處。在讓後設資料能由機器讀取、讓典藏可在線上取用之後,

這些模型可以透過 API 提升資料互通性。下一步很明確:在開放、共享的語料庫中,讓資料與詮釋資料達到 AI-ready(適用於 AI)的狀態!如此一來,AI 模型便能更加多元、以公共利益為導向,並更符合教育、研究與文化近用的目標,12 同時提升該領域的能力與自主性。——資料顧問暨數位史學家 Sebastian Majstorovic,出自「Alignment Assembly 11:小型 AI 倡議——集體盤點」。

12 美國數位圖書館員、網際網路檔案館(Internet Archive)創辦人 Brewster Kahle,引自 Caroline de Cock 所著〈AI Tools, Not Gods. Why Artificial Intelligence Hype Threatens Global Governance—and How to Fix It〉。

Morón Artisan Lime,計畫負責人:Manuel Gil Ortiz

歐洲文化遺產獎檔案,奧地利——公共

1.2 歐洲的策略背景

當今全球地緣經濟格局由少數幾家強大的民營企業主導,它們掌控了多數其他組織所依賴的基礎設施。公開資料經常遭這些公司以榨取價值或有害的方式使用,有時甚至涉及非法行為。目前缺乏足夠的保障措施,以確保民間業者負責任地使用開放資料與公共資料。

相反地,當前主流趨勢偏向從資料中榨取價值,卻未將所得重新投入知識生產,也未保障其長期永續性——這種模式缺乏互惠性。13

為降低對非歐洲科技巨頭的依賴,歐盟執委會於 2025 年推出《AI 大陸行動計畫》(AI Continent Action Plan),14 並由約 2,000 億歐元的公私部門投資提供支持。歐盟希望藉此成為全球 AI 領導者,同時維護其獨特的歐洲 AI 路線:可信賴、以人為本,並成為一股「向善的力量」。15

該計畫另有《AI 應用策略》(Apply AI Strategy)作為補充,承諾歐盟將開發前沿 AI 模型(Frontier AI models)16,為建立以公共原則為基礎、以人為本,並服務多元社群的模型創造契機。

雖然《AI 大陸行動計畫》向前邁出了重要一步,但對於公共領域中的 AI,仍缺乏清晰的願景。

13 Alek Tarkowski、Zuzanna Warso(2024)。〈Commons-based data set governance for AI〉。Open Future Foundation。https: //openfuture.eu/wp-content/uploads/2024/03/240325_Commons_Based_Data_Set_Governance_for_AI.pdf。

14 《AI Continent Action Plan》(2025)。

歐盟執委會致歐洲議會、歐盟理事會、歐洲經濟暨社會委員會及歐洲區域委員會的政策文件。15 關於巴黎 AI 行動高峰會,請參閱 https: //ec.europa.eu/commission/presscorner/detail/lt/speech_25_471。16 前沿 AI 模型(Frontier AI models)指目前正在開發或使用中最先進、位居技術尖端的人工智慧系統。

公共利益,17 而我們的領域正適合為此倡議。

此外,新興的 AI 生態系——包括資料空間、資料工廠、資料實驗室,以及由歐盟資助的大型語言模型(LLM)衍生企業——仍處於分散且缺乏協調的狀態。18 最後,該生態系優先發展大規模與通用模型,卻忽略了針對文化遺產等優先領域,進行更聚焦、特定領域投資的潛力。

在歐洲的 AI 生態系中,資料空間是重要的一環。除了更廣泛的 AI 基礎設施,包括 AI 工廠、19 資料實驗室與 AI 超級工廠(AI giga-factories)20,能為 AI 提供高品質資料存取管道的資料空間,也是《AI 大陸行動計畫》(AI Continent Action Plan)的關鍵組成部分。

以歐洲文化遺產共同資料空間為例,原因顯而易見。該資料空間已提供高品質、文件紀錄完整、多語且可信賴的資料,其專業社群也持續維護並擴充資料相關的脈絡知識。

17 公共 AI 研究與歐洲數位政策辯論也提出相同疑慮:若缺乏明確以公共價值為導向的治理機制,對運算、資料與部署的大規模投資,最終可能只會複製、而非改變目前 AI 生態系中權力集中的現況。請參閱 Alek Tarkowski 為 Open Future Foundation 撰寫的評論文章〈From AI Factories to Public Value: What’s Missing in the AI Continent Action Plan?〉(2025),以及 Amba Kak、Sarah Myers West、Leevi Saari 與 Frederike Kaltheuner 合著的《Redirecting Europe’s AI Industrial Policy: From Competitiveness to Public Interest》(紐約:AI Now Institute,2024)。18 Open Future:〈Who Controls Europe’s AI Future? How the Gigafactories Bet Shapes the EU’s AI Trajectory〉。19 AI 工廠運用歐洲高效能運算聯合事業(EuroHPC Joint Undertaking)的超級電腦資源,開發可信賴且位居技術尖端的生成式 AI 模型。

目前,16 個會員國共設有 19 座 AI 工廠,獲得 26 億歐元投資支持。AI 工廠將整合針對 AI 最佳化的超級運算能力、高品質資料資源、研究機構與產業,推動策略性領域的創新。

20 座公私協力設施,旨在以前所未有的規模訓練下一代 AI 模型;每座設施規劃投資 30 億至 50 億歐元,以強化歐洲的自主運算能力,以及在關鍵技術上的策略自主性。

《資料聯盟策略》(Data Union Strategy)明確認可文化遺產資料對 AI 應用的高度價值,並訂下具企圖心的目標:在 2026 年底前,提供 3,000 萬件數位化文化物件供 AI 使用。要達成這項目標,需要策略夥伴關係、歐盟支持,以及會員國進一步投資高品質的數位化工作。

資料空間已提供一套健全的框架,可管理各種著作權狀態,並明確區分與 AI 應用相關的三類素材:1)已進入公眾領域的素材;2)採用開放授權的素材;以及 3)受著作權保護的素材。前兩類素材適合用於 AI,但對於第三類素材,文化遺產機構應審慎留意權利人可能提出的權利保留。至於屬於照片類的素材。

工人操作金屬壓床。愛沙尼亞帕爾努博物館(Pärnu Museum)— CC0。

對於前兩類素材,文化遺產領域必須扮演可信賴的中介角色,也就是「資料實驗室」(data lab)。這類機制仍有待建立,並應善用資料空間,擔任資料管理者,確保資料實驗室能在資料持有者與 AI 基礎設施之間搭起橋梁,使相關作品由公共價值所治理,而不是任由追求私人利益的預設邏輯主導。

透過資料實驗室,資料空間可向 AI 工廠提供預先整理好的資料與中繼資料,例如經過策展、法律權利確認、附有參照資訊並完成編目的資料集,供大型語言模型(LLM)訓練及特定 AI 應用情境使用;作為交換,則可取得運算能力、模型開發與專業知識。資料空間也能運用其在整體 AI 生態系中的位置,與使用文化遺產資料的參與者合作,並確保這類協作。

如此一來,資料便能遵循透明、互惠與公共利益原則。資料空間透過彙整並預先封裝文化資料,供 AI 工廠再利用,可在現有資料供應者中扮演先行者角色,同時尊重創作者、權利人及既有監管框架。

此外,部分 AI 工廠已明確將文化與語言納入其職責範圍,而資料空間也正與這些機構建立連結,包括芬蘭、希臘、義大利、盧森堡、波蘭與西班牙的 AI 工廠。[^21] 資料空間將界定資料再利用的標準與實務,涵蓋資料策展、資料主權、存取控制,以及契約上的法律先例。

透過這些連結,文化遺產資料空間將支持一套可追溯且具主權的歐洲 AI 發展模式。實務上,資料空間可透過專用管道,與 AI 工廠共享文化遺產資料。

[^21]: 芬蘭的 LUMI、希臘的 PHAROS、義大利的 IT4LIA、盧森堡的 LAIF、波蘭的 PIAST-AI,以及西班牙的 BSC。

這些合作關係將是推動《資料聯盟策略》(Data Union Strategy)AI 願景的關鍵,並展現透過資料空間提供的文化遺產資料,如何成為歐洲主權 AI 資料供應鏈的重要一環。

目前,歐洲的語言在網路內容中占比不到 0.6%。[^22] 如果 AI 系統持續主要依賴英語,其呈現的世界觀將是不完整的,並使歐洲的語言與文化多樣性遭到邊緣化。資料空間的資料可優先提供多語言且多元的素材,協助縮小這些代表性落差,同時向使用者與開發者清楚揭示資料的限制。

這項工作不應被視為單向的資料供應管道,而應是互惠生態系的一環;在這個生態系中,資料空間有助於形塑 AI 基礎設施開發與使用時所遵循的價值與條件。資料空間也可倡議投入數位化經費,以確保資料基礎更具多元性與代表性。

這也包括以透明的方式……