Boffins find asking ChatGPT to repeat key words can expose its training data

https://www.theregister.com/2023/12/01/chatgpt_poetry_ai/

研究人員發現,要求 ChatGPT 重複某個詞語能迫使它洩露其訓練數據的片段。這種偏差攻擊(divergence attack)導致 ChatGPT 跳脫其對話機器人的角色,並可能洩漏包括個人資料在內的訓練內容。這個問題目前尚未被修復,對於模型訓練和部署帶來了警示。

via The Register

December 1, 2023 at 07:11PM

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *