Extracting Training Data from ChatGPT

https://not-just-memorization.github.io/extracting-training-data-from-chatgpt.html

研究人員發表了一篇論文,指出他們能夠從 ChatGPT 的訓練數據中提取出數 MB 的數據,耗資約 200 美元。透過模型查詢,可以提取訓練數據的部分準確內容。這項攻擊最多可以以更多資金從 ChatGPT 中提取約一 GB 的數據。該攻擊顯示了即使在「對齊」以防止洩露訓練數據的模型中,也存在潛在的漏洞。論文提議對於大模型的內部、用戶和第三方機構進行測試。

via Hacker News

November 30, 2023 at 01:19AM

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *