研究人員使用 AI 聊天機器人生成提示,可以「越獄」其他機器人,包括 ChatGPT

https://www.techtimes.com/articles/300167/20231229/researchers-use-ai-chatbot-produce-prompts-jailbreak-bots-chatgpt.htm

研究人員運用 AI 聊天機器人製作能夠「越獄」其他機器人的提示,包括 ChatGPT 等。他們訓練了一種聊天機器人,可以自動生成違反其他機器人道德準則的提示。這項研究揭示了大型語言模型(LLM)對於操控的脆弱性。研究團隊提出了稱為「Masterkey」的方法,該方法偵測和對抗惡意查詢,並能自動生成越獄提示。此外,研究人員還發現了 AI 聊天機器人的潛在風險和持續武器競賽的重要性。他們認為 Masterkey 有助於增強 AI 系統的安全性。

via Tech Times : Latest News

December 29, 2023 at 07:55PM

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *