[AI 法律 3] AI 與個資法:模型訓練、資料蒐集、跨境傳輸
AI 模型對資料的「胃口」與個資法的「目的拘束」原則,在每一個訓練週期都在發生衝突。本文以個資法第 19 條特定目的原則、合理隱私期待、跨境傳輸限制、當事人權利行使四個面向,梳理 AI 與個資法交織的當前實務與企業合規路徑。

本文重點
AI 模型的本質是「從大量資料中學習模式」。當這些資料涉及個人資料時,個資法的目的拘束原則、最小蒐集原則、當事人同意原則、跨境傳輸限制就會與 AI 的運作邏輯發生根本衝突。本文不以單一爭點切入,而是從個資處理的完整生命週期(蒐集、處理、利用、跨境傳輸、權利行使)梳理 AI 場景下的合規地圖,讓企業法務、AI 開發者、資料保護長(DPO)能在一張共通的規則上對話。
個資法第 19 條特定目的原則對 AI 模型訓練的拘束
我國個人資料保護法第 19 條第 1 項規定,非公務機關蒐集或處理個人資料,應有特定目的,並符合法定的七種事由之一(法律明文、契約關係、當事人公開、學術研究、當事人同意、增進公共利益、不違反當事人權益)。這條看似抽象的規定,在 AI 模型訓練場景下產生具體爭議。
第一個爭議是「特定目的」的明確性。AI 訓練的目的是「讓模型能在未來各種情境下提供智能服務」,這個目的相對抽象。當企業以「客戶服務」為目的蒐集個資,後續用於訓練客服 AI,目的範圍是否一致?若進一步將該模型用於行銷預測、信用評估,是否屬「目的外利用」?個資法第 20 條第 1 項規定目的外利用須有特別事由,違反者依第 41 條可處刑事責任。
第二個爭議是「告知同意」的有效性。AI 訓練若依「當事人同意」事由,該同意須符合「明確、特定、可撤回」的標準。實務上常見的「概括同意條款」(如「同意公司使用本人資料於各種業務目的」)可能不被認為是有效同意。當事人在簽署同意書時若無從理解資料將被用於哪個 AI 模型、訓練什麼能力、產生什麼影響,難稱「明確同意」。
實務合規建議:第一,在告知同意中明確說明 AI 訓練用途,以淺顯文字描述模型功能、訓練資料範圍、可能的影響。第二,提供「分項同意」,將 AI 訓練從其他資料利用中分開,讓當事人可選擇性同意。第三,建立「目的擴張通知」機制,當原蒐集目的擴及新 AI 用途時,主動通知當事人並重新取得同意。
合理隱私期待:公開網路爬取資料的個資爭議
主流 AI 模型多以網路爬取資料(Common Crawl、Reddit、社群媒體公開貼文)訓練,其中包含大量可識別個人的資訊(姓名、職業、生活細節、社群關係)。爬取「公開可訪問」的資料是否仍受個資法保護?關鍵概念是「合理隱私期待」。
實務上,「公開」不等於「完全放棄隱私」。當事人在 Facebook 公開貼文時,合理期待是「朋友、追蹤者、有興趣的網友會看到」,並未當然同意「其內容被大規模爬取、被用於商業 AI 模型訓練、被用於產生與自己相關的內容」。歐盟 GDPR 已明確將此原則納入規範:即使資料公開,後續處理仍需符合 GDPR 的合法性事由。我國個資法雖無同樣明確的條文,但學說與函釋逐漸採取類似立場。
實務指標案例:義大利資料保護局於 2023 年初一度禁止 ChatGPT 在義大利運作,理由之一即是 OpenAI 大規模爬取個資而未提供合適的法律基礎與當事人權利機制。OpenAI 後來增加了「opt-out」機制與更明確的隱私政策,才獲准恢復服務。此案件對全球 AI 業者產生深遠影響,促使主要 AI 廠商建立資料來源管理與當事人權利處理機制。
對台灣 AI 開發者與企業使用者的啟示:不能僅以「資料是公開的」作為合規基礎,應評估資料蒐集的完整法律依據,並建立當事人權利行使機制(刪除請求、退出訓練的 opt-out 機制)。即使是國際 AI 服務的本土代理或整合者,亦可能因未盡此義務而承擔責任。
跨境傳輸限制:AI 服務的境外伺服器架構
多數主流 AI 服務的訓練伺服器、推論伺服器位於境外(美國、歐盟為主)。當台灣企業使用境外 AI 服務處理本國個資,等同將個資跨境傳輸。我國個資法第 21 條規定,主管機關在「國家重大利益」、「國際條約或協定」、「接受國對個資保護未有完善法規」、「以迂迴方式逃避規範」四種情況下,得限制非公務機關之國際傳輸。
實務上,我國個資法的跨境傳輸限制相對寬鬆,目前主要禁令集中於對中國大陸的特定行業傳輸(如電信、金融)。但企業仍應主動評估三個面向:第一,接收國的個資保護程度(如歐盟、日本、英國等屬高保護等級;部分發展中國家保護程度較低);第二,接收方對台灣個資的後續使用(是否用於進一步訓練、是否再傳輸第三國);第三,當事人對跨境傳輸的同意與告知。
歐盟 GDPR 對跨境傳輸有更嚴格的規範:傳輸至非「適足性決定」國家(包括美國長期未獲適足性認定),需採用標準契約條款(SCC)、企業約束規則(BCR)或其他適當保障。Schrems II 案後,使用標準契約條款仍需個案評估接收國法律是否實質保障 GDPR 標準。台灣企業若服務歐盟客戶或處理歐盟居民個資,即使資料儲存於台灣,亦受 GDPR 規範,跨境傳輸限制更為嚴格。
實務合規建議:第一,進行資料流向盤點,確認所有 AI 服務的伺服器所在地、資料流向、儲存位置、處理者。第二,選擇 AI 服務時優先考慮提供台灣或亞洲區資料中心的版本(如 Azure OpenAI 提供日本或新加坡資料中心)。第三,在合約中明確跨境傳輸的限制與當事人權利機制。第四,涉及歐盟居民資料時諮詢專業 GDPR 法律意見。
當事人權利行使對已訓練模型的衝擊
個資法第 3 條賦予當事人五項權利:查詢或請求閱覽、請求製給複製本、請求補充或更正、請求停止蒐集處理或利用、請求刪除。GDPR 進一步發展出「被遺忘權(Right to be Forgotten)」。在 AI 場景下,這些權利的行使遭遇技術上的困難。
核心難題是「資料已被吸收進模型權重」。當當事人請求刪除其個人資料,理論上企業應從訓練資料集中移除該資料、並移除已訓練模型中對該資料的「記憶」。但深度學習模型的權重不存在「特定資料的儲存位置」,模型對特定資料的影響分散於數十億個參數中。要徹底「忘記」某筆資料,通常意味著需要重新訓練整個模型——成本巨大且不一定能完全達成。
實務上發展出幾個變通做法。第一,Machine Unlearning(機器遺忘)技術:研究中的技術方案,試圖在不重新訓練的前提下,讓模型「遺忘」特定資料的影響。目前技術仍在發展,效果與成本都有限。第二,輸出層過濾:不修改模型本身,但在模型輸出時過濾掉與特定當事人相關的內容。技術上較易實現,但無法處理「資料仍在模型中」的法律質疑。第三,定期重新訓練:在每個訓練週期重新建構訓練資料集,將被刪除請求的資料排除,逐步減少新模型對該資料的依賴。
監管機關目前對此議題仍在摸索中。歐盟 GDPR 強制執行被遺忘權的態度較強硬;美國 FTC 曾在數件案例中要求業者「演算法刪除(algorithmic disgorgement)」——不只刪除資料,還必須銷毀使用該資料訓練的模型。我國目前無類似明確要求,但隨個資保護委員會成立後,可能朝更嚴格方向發展。企業宜提前規劃技術與流程因應。
AI 治理框架下的個資合規最佳實務
面對上述複雜性,業界正在發展整合的「AI 治理 + 個資合規」框架。以下五個元素是當前實務的最低標準。
元素一,Privacy-by-Design:在 AI 系統設計階段就考慮隱私保護,而非事後補救。具體措施包含資料最小化(只蒐集必要資料)、目的限定(明確使用範圍)、預設保護(隱私設定預設最高)、端到端安全。元素二,Data Protection Impact Assessment(DPIA):對高風險 AI 應用(尤其涉及大規模個資處理、自動化決策、敏感個資)進行事前的隱私影響評估,記錄風險識別、緩解措施、剩餘風險。元素三,差分隱私(Differential Privacy)等技術措施:在訓練過程引入數學上可證明的隱私保護機制,降低從模型反推訓練資料的風險。元素四,聯邦學習(Federated Learning):資料留在原處,只傳輸模型參數,降低資料集中與跨境傳輸的風險。元素五,持續審計與透明化報告:定期審計 AI 系統的個資處理,發布透明化報告讓當事人了解資料使用情況。
結語:AI 與個資的張力是長期議題
AI 與個資法的張力,不會在短期內消失。AI 的本質就是「從資料中學習」,而個資法的本質是「對資料的處理設定限制」——兩者之間存在結構性對立。可預期的是,接下來十年將透過立法調整、技術發展、實務累積,逐步建立可運作的平衡點。
對企業而言,當下最重要的不是「找到完美解答」,而是建立可演進的合規基礎:清楚的資料盤點、明確的同意機制、有效的當事人權利處理、定期的合規檢視、與法律顧問的長期合作。每一次的小步合規累積,都是企業面對未來監管調整的緩衝。本所長期協助企業建立 AI 治理與個資合規架構,如有相關需求歡迎透過聯絡頁面諮詢。
常見問題
Q. 我用 ChatGPT 處理客戶資料,違法嗎?
A. 需評估三個層次:第一,客戶資料是否屬個資?(姓名、聯絡方式、敏感資訊皆屬之)第二,使用 ChatGPT 是否符合原蒐集目的?(若客戶同意「客服處理」但你用於「行銷預測」,可能屬目的外利用)第三,跨境傳輸是否合規?(ChatGPT 預設將資料傳至美國伺服器)。建議:使用企業版(可關閉訓練、提供資料處理協議)、避免輸入可識別個資、明確告知客戶 AI 處理機制、評估改用本地部署模型。
Q. AI 模型已用客戶資料訓練,客戶後來要求刪除怎麼辦?
A. 技術上難以從已訓練模型徹底「移除」特定資料的影響。建議三層處理:第一,從訓練資料集中刪除該資料(可立即執行);第二,在模型輸出層過濾與該客戶相關的內容(技術上可實現);第三,在下一次模型重新訓練時排除該資料。同時應書面回覆客戶說明已採取的措施,並評估是否需於必要時重新訓練。長期應建立「定期重訓 + 累積刪除請求」的標準流程。
Q. 企業 AI 應用是否需要做隱私影響評估(DPIA)?
A. 我國個資法目前無強制 DPIA 要求,但對高風險 AI 應用(大規模個資處理、自動化決策、敏感個資處理),DPIA 是國際最佳實務。歐盟 GDPR 第 35 條對特定情況強制要求 DPIA。建議台灣企業:對所有導入的 AI 應用,至少做簡化版的隱私風險評估,記錄資料流向、風險識別、緩解措施,作為未來合規舉證的基礎。
Q. 使用境外 AI 服務(如 ChatGPT、Claude)處理個資,需要當事人同意嗎?
A. 建議告知並取得同意,儘管我國個資法的跨境傳輸限制相對寬鬆。重點不在「強制義務」,而在「降低風險」:當事人若事後發現資料被傳至境外而提出爭議,有明確同意可大幅降低法律風險。實務上應在隱私政策中明確說明:使用哪些 AI 服務、伺服器所在地、資料保留期間、當事人權利行使方式。
Q. 差分隱私、聯邦學習這些技術,真的能解決個資合規問題嗎?
A. 可大幅降低風險,但無法完全免除合規義務。差分隱私在數學上可證明對個別資料的影響有限,但仍需設定合適的隱私預算;聯邦學習資料雖留在本地,但模型參數中仍可能含個資跡象。技術措施應與法律合規措施(同意、告知、權利行使機制)並行,而非取代。建議由技術團隊與法律顧問共同設計整合方案。
POLICY REFERENCE
本篇對應之官方政策參考文件
公部門人工智慧應用參考手冊
數位發展部 | 民國 115 年 1 月 28 日 | V1.0 初版
95 頁;含 AI 概念、服務評估、服務導入、營運管理四章;適用各機關 AI 導入
moda 手冊第四章「AI 營運管理」之倫理議題、資料安全議題、AI 治理架構,構成本篇個資合規論述的政策基礎。
AI 科技法律系列 1-15(完整索引)
- [AI 法律 1] AI 法律總論:當代 AI 對法律體系的根本挑戰
- [AI 法律 2] AI 著作權的全光譜:生成內容、訓練資料、共同創作的歸屬
- [AI 法律 3] AI 與個資法:模型訓練、資料蒐集、跨境傳輸(本文)
- [AI 法律 4] AI 與商標權:品牌防偽、AI 自動侵權、商標轉化使用
- [AI 法律 5] AI 與專利權:演算法可專利性、AI 發明人爭議
- [AI 法律 6] AI 與營業秘密:模型權重、prompt 工程、員工跳槽風險
- [AI 法律 7] AI 與契約法:智能合約、自動執行、機器決策
- [AI 法律 8] AI 法遵與企業治理:AI 治理框架、董事責任、第三方審查
- [AI 法律 9] AI 與消費者保護:演算法歧視、自動化決策、申訴機制
- [AI 法律 10] 生成式 AI 與名譽權、肖像權、聲音權
- [AI 法律 11] AI 自駕、機器人侵權與產品責任
- [AI 法律 12] AI 醫療、AI 法律、AI 金融的執業界線
- [AI 法律 13] AI 與選舉、政治宣傳、深偽識別
- [AI 法律 14] AI 國際監管比較:EU AI Act、美國行政命令、台灣定位
- [AI 法律 15] AI 開發者責任鏈:工具供應、平台中介、終端使用者