模板驅動的資料擷取已宣告死亡:接下來是什麼?
請輸入專案名稱:
2. 標準輸出
標準輸出會直接從資料自動化管線提供模型的預設、非結構化回應(文字、影像、音訊或影片)。
在標準輸出中,每種模式都有其各自的選項來定義所需的輸出。
現在讓我們測試文件模式用於標準輸出:
首先,點擊右上角的「測試」。
然後,選擇系統、樣本或 S3 中的文件,並從下拉選單中選擇模式。
點擊「產生結果」按鈕:
處理完成後,會顯示文件的摘要和內容:
自訂輸出(藍圖):
自訂輸出讓您使用藍圖定義結構化、可預測的格式,確保輸出符合您的精確範本、欄位和業務規則。
讓我們用相同的文件測試自訂輸出:
前往「自訂輸出」並點擊「新增藍圖」:
從這裡會出現兩個選項。您可以選擇使用 LLM 力量生成藍圖(它會檢查文件),或手動輸入欄位名稱、指令和其他資訊。
以下是 LLM 生成的藍圖,已從文件中擷取所有可能的欄位和表格:
它使用了藍圖將資訊擷取出,包括欄位名稱、指令和結果:
它還提供擷取的類型(可為明確或推論)、信心百分比及其他相關資訊。
此外,它可以以表格的形式擷取資訊,例如帳戶摘要或交易資訊:
程式碼範例
文件藍圖的類型
在處理文件時,BDA 支援五種類型的核心自動化操作:
- 分類:發票、銀行對帳單、身分證、合約、人力資源信件等。
- 擷取:擷取實體、欄位、表格、中繼資料。
- 例如:從銀行對帳單 → 日期、描述、金額、餘額。
- 轉換:修改或重組資料。
- 例如:將住址轉換為獨立欄位 -> 街道、城市、郵遞區號等。
- 正規化:標準化資料值。
- 例如:將多種日期格式(MM/DD/YYYY → YYYY-MM-DD)轉換。
- 驗證:根據規則驗證擷取欄位。
範例說明:資料量必須為數值;日期格式需與欄位搭配;餘額必須能核對。
具體商業價值的應用情境
以下是一些實務案例,說明人工智慧流程自動化(BDA)能帶來顯著投資報酬率的情況:
- 金融服務:自動處理銀行帳單、發票和貸款申請,減少人工勞力並加速結算或授信。
- 保險業:從理賠表單、醫療報告及受損資產照片中擷取資料。
- 人力資源/法律部門:處理履歷表、合約與聘僱函;擷取結構化資料,包含技能、條款、薪資和當事人資訊。
- 客戶支援:自動轉錄並摘要電話會議,提取意圖與情緒分析,並將這些洞察回饋至 CRM 或案例系統。
- 安全與合規性:分析監控影片或會議記錄以偵測關鍵動作、提供情境摘要,並標記違規問題。
人工智慧流程自動化(BDA)的彈性與強大之處在於它既能支援基本工作流程的標準輸出,又能透過藍圖客製化精細的工作流程。它具備可擴展性與穩健性(參考資料),能在批次處理和開發環境/生產環境版本之間切換,以確保測試的安全性和準確性。此外,其設計也友善於稽核,提供具有類型標籤的結構化欄位、標準化規則與驗證邏輯。
相較於基於規則的系統,基礎模型在各方面的語意擷取能力都更為出色。
真正的關鍵優勢是,人工智慧流程自動化(BDA)在格式上具備多模態特性。使用者可利用此框架處理文件、圖片、音訊與影片。且最重要的是,其準確度極高。相較於基於規則的系統,基礎模型在各方面的語意擷取能力都更為出色。
Amazon Bedrock Data Automation 讓企業能將非結構化、多模態內容轉化為結構化、可信且具操作性的資料。只需簡便設定,即可高度客製化的藍圖,並搭配可擴展的專案架構,BDA 能幫助組織減少人工負擔,並更快地發掘洞察。
社群開發者指南與資源:
- 協助開發者選擇發展路徑與職涯成長的文章、路線圖與學習資源。
