以前もLLMを褒めてやったりすることで結果が良くなるレポートがあったけど、そうしたプロンプティングを自動で見つける手法ね。
データセットの中の良いデータの特徴的な単語を選べば良いという事なのか。
ということは逆に結果を悪くするようなプロンプトも見つけられるんだろう。
同じ技術がLLMのジェイルブレイクにも使えるわけだ。
以前もLLMを褒めてやったりすることで結果が良くなるレポートがあったけど、そうしたプロンプティングを自動で見つける手法ね。
データセットの中の良いデータの特徴的な単語を選べば良いという事なのか。
ということは逆に結果を悪くするようなプロンプトも見つけられるんだろう。
同じ技術がLLMのジェイルブレイクにも使えるわけだ。