三位科技前瞻者談如何用 AI 建立信任與問責

ZDNET 的重點摘要:設計人類與 AI 之間的健康關係,需要將商業實務正式制度化。未來的工作模式會是人類與 AI 成為同事,共同創造價值。代理型 AI 治理必須釐清共同責任與問責。

首先,網際網路共同創造者之一 Vint Cerf 博士觀察到,面對 AI,「感覺像是我們遇到了一種新的生命形式,正在試著弄清楚它如何思考。」值得注意的是,我們與 AI 的工作和商業關係,可能不同於人與人之間的關係。其次,David Bray 博士是一位科技領袖,曾在包括 9/11 應變、2001 年炭疽事件,以及 FCC 現代化等艱難環境中取得成果;他建議:「也許我們不該稱它為人工智慧,而該稱為外星互動。因為這樣一來,我們就不會試圖把機器擬人化。」另見:要從 AI 試點走向全企業價值,需要一條超級高速公路——如何擴大推進。

把這兩項觀察放在一起看,意味著我們如何面對 AI,將決定哪些公司能在未來勝出。第三,獲獎調查記者、決策科學公司 Decisive 創辦人兼執行長 Cheryl Strauss Einhorn 強調:「當槌子落下時,它會落在我們身上。AI 不在乎。到頭來,我們所有人都必須出面解釋,也必須承擔後果。」這是一個清楚而有力的呼籲:我們必須認知到,如何處理與 AI 的關係,對決定商業成功至關重要。綜合來看,這三位專家都強調,我們如何與 AI 共事,以及讓 AI 參與哪些工作,將決定未來十年個人與公司的成功。對執行長、公司董事會與高階政策制定者而言,在決定是否以及何時信任 AI 輸出時,良好的人類判斷力至關重要。最近,Constellation Research 的 R「Ray」Wang 與我有機會在我們每週的 Podcast 節目 DisrupTV 上,邀請 Vint、David 與 Cheryl 參與討論。這場節奏明快、但極其細膩的對談,聚焦於為什麼我們需要避免混淆人類給 AI 的指令(以及 AI 給另一個 AI 的指令)、我們如何判斷是否信任 AI 的輸出,以及如果 AI 做出錯誤或有害的事,應該由誰負責。

避免 AI 指令中的混淆至關重要

Vint 首先說明,為什麼我們需要主動思考如何避免由人類或 AI 對另一個 AI 下達指令時產生混淆。

他指出:「我擔心的大問題,是代理(agents)彼此使用自然語言溝通。我們不需要代理彼此誤解,然後以遠超人類的速度執行。」

從最早的 ARPANET 到今日全球網路,Vint 親身經歷了網際網路的起源。他也強調,不論是確定性的電腦程式,還是更具生成能力的 AI,都可能做出並非原本意圖的事。

他特別說:「程式,至少是那些確定性的程式,會照你告訴它們的方式去做。問題是,有時候你告訴它們做的事,並不是你真正想要它們做的事。這就叫 bug。」

另見:自主型企業即將到來。以下是為什麼這項轉變對專業人士是好消息

接續 Vint 的說法,

David 指出:「我對治理的定義,是我們如何避免無政府狀態。我們需要防止無政府狀態,不只是為了人類,也包括代理。」David 曾在動盪且經常混亂的環境中推動正向改變,包括與美國情報界合作;他也用一個貼切的畫面描述目前的情況:「這有點像 1910 年的重演。那時我們還沒有發明紅綠燈,甚至還沒有搞清楚停止標誌、路權或人行道。」

在 1910 年代,紐約和芝加哥的街道上,有電車與私人汽車、行人和馬匹並行;這就像現代企業裡,不同的雲端 AI 模型、本地 AI 模型、人類使用者,以及其他分析軟體工具同時並存。Cheryl 提醒我們,了解自己理解世界的預設方式非常重要。

>「我們每個人都有自己的獨門配方。那是我們做決策的方式。而我們大多數人其實並不真正意識到那是什麼。」

為了避免在提示 AI 時產生誤解,理解自己的「獨門配方」至關重要。身為《 》的作者,

Cheryl 進一步說明:「如果你要引導機器,你實際上需要做的,是花更多時間去探究自己的獨門配方……這樣一來,它就不會給你別人的答案……而是真的能夠專門為你工作。」

我們該如何判斷是否信任 AI 的輸出?

延續他「我們正試著弄清楚它是怎麼思考的」這項觀察,

Vint 指出:「我把這些視為一群新的工作者,我們可以與之互動。對我來說,它很像一個非常聰明的研究代理人。」

Vint 在 2017 至 2020 年間擔任 People Centered Internet 聯盟主席;對他而言,這番話顯示他已意識到 AI 不只是工具,也可能是一位數位同事,能強化一個專案的研究能力。這項關鍵觀察凸顯,面對未來工作型態,如何激勵並引導工作者(包括與人類工作者協作的 AI 代理人)將變得重要。另見:在失控之前,請把你的 AI 代理人當成熱切但方向錯誤的人類實習生。David 則借鑑他過去與情報單位和 FCC 合作的經驗,

指出當我們要判斷是否信任 AI 的輸出時:
>「在這個時代,社會比較健康的反應會越來越是:不要相信你第一眼看到的東西,除非你能從多方交叉驗證它……CIA 就是這樣做的。」

對 David 來說,這個訊息與他自己的職業經歷很接近,因為他曾經歷大量由機器人產生的留言湧入公共意見系統;當時的要求是,無論發言者是人類還是數位機器人,都必須記錄提交進來的全部 2,300 萬則留言。對於即將面對 AI 代理型未來的企業而言,知道代理人何時能為顧客與客戶互動增添價值,將會非常關鍵。David 曾帶領 IT 團隊,在大量留言湧入時仍維持系統運作,讓人類意見得以被提交;這段經驗很好地提醒我們,AI 代理人既能放大人類聲音,也可能干擾、遮蔽人類聲音。

Cheryl 也強調,必須退到隱喻上的「陽台」來看清全局,並認識到 AI 遠遠不只是某種數位能力。「這不只是某個新軟體。這其實是一場文化變遷……關乎問題解決。」Cheryl 的評論承接了 Vint 和 David 所分享的觀點:在決定是否信任 AI 輸出、並將其用於企業、社群與公司的問題解決時,健全的人類辨識力與判斷力非常重要。他們各自的專家觀察都凸顯出,要分辨有生產力的 AI 關係與無助益的 AI 關係,良好的人類判斷,以及人類與 AI 之間的良好默契,都至關重要。如果 AI 做錯了事,我們要追究誰的責任?

在成功人類與 AI 關係的三大要素中,最後一項是 Vint、David 與 Cheryl 討論的關鍵問題:一旦出錯,責任該由誰承擔。Cheryl 用一個視覺化對比來說明 AI 的兩種使用風格:「人們使用 AI 其實有兩種截然不同的方式:外科醫師,以及藍寶堅尼駕駛。當我們去找 AI 時,我們想要一個特定答案……這時我們是在像外科醫師那樣使用它。」外科醫師可能會犯錯,這是一種風險;但也可能外科醫師一切都做對了,病人仍然出現不良結果。至於 AI 的另一種用法,Cheryl 接著說:「有些時候……你面對的是非常高風險的決策,而你想經歷一個過程。那一刻,你就是藍寶堅尼駕駛。」在第二種情境中,使用 AI 就像駕駛高性能賽車;要避免相當於 AI 車禍的事故,必須具備穿越急彎的技巧,也要了解 AI 引擎的能力與限制。另見:打造真正有回報的代理式 AI 策略,同時避免企業失敗風險。

此外,David 分享了來自懸掛船旗商船的一個教訓:「這個 AI 代理在做事時,掛的是誰的旗?它代表的是哪個組織?」在這個例子裡,如果某個組織雇用了 AI 代理,只要提供了良好的指示,該組織也要為這個代理負責。他也觀察到,在不久的將來,要分辨哪些資料不是合成產生的,會變得越來越困難。「到 2030 年,地球上超過 40% 的資訊都會是由 AI 合成產生的……這會替 CEO 和董事會帶來龐大的問題。」最後,Vint 也指出,當事情出錯時,個人與組織都需要有申訴或補救途徑。「在各種情境中建立補救機制,可能會帶來非常高的效益,甚至可能是必要的。」身為 Google 首席傳教士,Vint 一直鼓勵採取這類 AI 做法;Vint 與 David 也都承認,Salesforce、Google 等公司在職場與客戶情境中,正採取類似的善意 AI 路線。Vint 也延伸談到他與 David 都關心的一項問題:在判定哪些資訊應標示為 AI 生成資訊 vs.

來自真人或由人類策展來源的資訊,並指出「失去取得數位資訊的管道,是一個嚴重問題。」對 Vint 來說,這也包括失去用來解讀資料的軟體,以及失去資料來源脈絡的風險。

給執行長與董事會的重點 Vint 警告說:「我們不需要代理彼此誤解,然後以相較於人類速度如光速般的速度執行」,

這凸顯出我們身為人類在與 AI 互動時所建立的關係,以及 AI 彼此互動時的關係,都將決定能否取得成功結果。Vint、David 與 Cheryl 共同指出三大重點:顯然有必要確保給生成式 AI 的指令清楚、精確,而且不會造成非預期後果。想像 1910 年代紐約與芝加哥的街道:有軌電車與私人汽車、行人和馬匹共用同一條道路,卻沒有停止標誌、明確路權或人行道;這幅畫面同樣適用於我們當前的時代。良好的人類判斷,對於辨別是否應該信任 AI 輸出正變得越來越關鍵,而分辨人類生成與 AI 生成內容也越來越困難。人類與 AI 之間良好的協作默契,有助於區分哪些 AI 關係具生產力,哪些則沒有幫助。若 AI 做錯了事,努力建立清晰性,以及個人與組織層級的申訴與補救途徑,將是改善公司內部與公司之間人機關係的重要因素。

人類與 AI 互動會出現在不同情境中;有些情境更著重於尋找特定答案,另一些則像是在高速駕駛高性能賽車通過急彎。另見:為什麼 AI token 會讓你的企業雲端帳單再次飆高三位專家也都強調,成功的公司、社群與國家會採用「群體中的 AI」,也就是理解人類與 AI 之間的網絡化互動,其中包含基於意圖與問責的關係。Vint 與 David 也強調,我們需要超越圖靈測試,把焦點放在能放大個人與集體人類能力、並幫助我們強化自身優勢的 AI。

本文由 LeadDoAdapt(LDA)Ventures 負責人暨執行長、Accelerator 主席、Stimson Center 傑出研究員 Dr. David Bray 共同撰寫。