Google Researchers’ Attack Prompts ChatGPT To Reveal Its Training Data

https://yro.slashdot.org/story/23/11/30/2210216/google-researchers-attack-prompts-chatgpt-to-reveal-its-training-data

谷歌 DeepMind 研究團隊透過新型攻擊提示,成功使 ChatGPT 揭露其訓練數據。這方法讓 ChatGPT 重複特定文字,進而洩漏了大量私人可識別資訊及互聯網上抄錄的文本段落。研究顯示 ChatGPT 的對齊技術無法消除記憶化現象,16.9%的測試涵蓋記憶化的私人資料。

via Slashdot

December 1, 2023 at 07:24AM

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *