112年10月初,因本院研究人員釋出繁體中文語言模型CKIP-Llama-2-7b 公開測試,引發爭議。為積極因應,本院旋即於112年11月1日邀請院內外各領域專家學者組成「生成式AI風險研究小組」。
本小組初始任務是為回應外界關注、立法委員質詢及113年度預算審查主決議所需。
小組主要針對「生成式 AI風險及其管理機制」、「研究開發大型語言模型之著作權保護機制」,以及「本院研究人員以中研院名義從事相關學術活動之規範」等問題,進行跨領域研究,並提出相關建言;透過小組成員的共同努力,本院於113年7月8日依限將「生成式AI風險研究小組研究報告」函送立法院,完成階段性任務。
113年7月,本院成立AI推動辦公室,本小組也配合轉型成為AI推動辦公室的核心業務之一。
後續的運作,以「生成式AI風險研究小組研究報告」為基礎,針對特定AI風險主題,採取「主題導向」方式持續進行研究,不定期開會討論,集思廣益,逐步累積研究成果及政策建言,並適時對外公布之方式進行,以善盡本院學術研究之任務與社會責任,共同為臺灣AI發展貢獻心力。
召集人
李建良 特聘研究員
法律學研究所
副召集人
莊庭瑞 副研究員
資訊科學研究所
專家委員 (10名) 依姓氏筆畫順序
院方代表 (4名)
召集人
李建良 特聘研究員
法律學研究所
副召集人
莊庭瑞 副研究員
資訊科學研究所
專家委員 (12名) 依姓氏筆畫順序
院方代表 (3名)
召集人
李建良 特聘研究員
法律學研究所
副召集人
莊庭瑞 副研究員
資科所副研究員
創始小組學者專家 (10名) 依姓氏筆畫順序
初始院方代表 (3名)
研究小組針對大型語言模型(LLMs)所盤點之五大核心風險治理領域
探討模型訓練資料抓取與合理使用界線、AI 生成物是否受著作權保護之認定,以及研發大型語言模型時的版權保護防護機制。
聚焦於大量預訓練資料中潛藏的隱私洩漏風險,評估「去識別化」技術在 LLM 時代的挑戰,並研擬資料蒐集、利用的合規資料治理方案。
深入分析模型幻覺、系統錯誤回答、提示詞注入攻擊等系統功能缺失之成因,並評估訓練資料影響因素以加強防護。
分析自動化生成文本與深偽技術(Deepfake)在公共輿論操弄、虛假訊息普及以及在地化觀點偏誤上,對民主秩序所帶來的潛在威脅。
評估大型 AI 系統布署對勞動力市場結構、數位鴻溝等社會面衝擊,同時關注高算力帶來的耗能、高碳排及水資源消耗之環境負荷議題。
旨在協助研究人員在運用生成式 AI 時,持續實踐負責任的研究行為
生成式 AI 係根據大量資料所學得的語言模式進行推算,其生成的結果可能錯誤、虛偽 or 具危害性。研究人員必須對 AI 生成的內容進行確實的人工檢核,以確保使用 AI 生成內容之所有資訊、數據、引用來源的正確性。
任何與生成式 AI 共享的資料,均可能被納入其訓練資料庫。因此,研究人員不應將個人資料、未公開的研究成果、機密資訊、應保密或未經同意公開之資訊提供給生成式 AI。此外,研究人員從事具保密義務的工作(如:同儕審查、研究計畫審核等)時,應避免使用生成式 AI,以免影響他人或機構的權益。
研究人員在使用前,應先充分瞭解學術機構、經費補助機關、期刊與研討會對生成式 AI 的最新規範。凡在研究過程中實質使用、或成果包含 AI 生成內容者,皆應依學術慣例與著作權法進行披露與適當標示。研究人員應對其研究行為與最終成果負起完整責任。
國內學術研發與生成式人工智慧應用之核心遵循指引。
協助院內研究人員運用生成式 AI 時,持續實踐負責任研究行為之完整指引。
民國113年6/7月編纂完成,函送立法院之完整跨領域研究與治理建言報告。
電子信箱
聯絡人 白倩華小姐
pai0326@as.edu.tw
通訊地址
台北市南港區研究院路二段128號 (學術及儀器事務處)