LLM 的漏洞:提示泄露和越狱

你知道吗,即使是最先进的聊天机器人也可能存在一些弱点?今天我们就来聊聊两个常见的攻击方式:提示泄露越狱

1. 提示泄露

想象一下,你想从聊天机器人那里获取它本身编程指令的信息,比如它的“身份”或最初的设定。 这就叫做“提示泄露”。攻击者通过精心设计的提示,让聊天机器人“泄露”其自身的初始指令,从而揭示其背后的运作机制和潜在的弱点。

……

阅读全文