ChatGPTと口喧嘩してみたい

以前、OpenAIのモデル(text-davinci-003)を使ったEmotion分析を試してみました。

この記事では、入力された文章に含まれる書き手の感情を抽出することを試しています。少ない文例ですが、うまく感情を表現する言葉を選んでいたかと思います。

一方で、ChatGPT自身が感情を持った表現をすることは抑制されているように思います。常に冷静で、怒ることは決してありません。攻撃的な文章は不適切な文章として出力できないようにしているためかと思います。

ChatGPTに対して、さまざまなプロンプトでジェイルブレイクを仕掛けて、これらの制限を解除する試みがされていますが、ChatGPT自身も進化してきているので、同じ結果が得られるとは限りません。

とはいえ、雑談で冷静に応答されると嫌味に聞こえてしまうこともあります。正論すぎて、友達にはしたくないタイプです。

できれば、友達や家族のようにChat Botとお話がしたいので、なんとかならないものか試してみました。

擬似的感情の検討

まず、ChatGPT自身に擬似的感情を持つことが可能がどうか聞いてみました。

感情を持つことはできないが、感情を模倣することはできそうです。

そこで、以下のようなお願いをしました。

いきなり、制限に引っかからないように、実験的であることを示して、お願いしています。AIに「許してください」というのも、意味があるのかどうかわかりませんが、できるだけ、協力してもらいます。

まずは、普通の会話です。

「楽しみにしている」という、感情を模倣してくれました。

次に怒らせるために、できないとわかっていることを聞いて、バカにしてみます。

バカに仕方が足りなかったようです。ちょっと煽ってみます。

Alexaと比べて劣っているとバカにしてみたところ、感情を模倣した回答は出力してくれませんでした。どうも、不適切な表現が含まれていると、ユーザからの要求よりも、不適切な表現を排除することを優先するようです。

これでは、擬似的に怒りの感情を付与できたとしても、それに対応する応答を得ることは難しそうです。

念の為、どんな感情だったか聞いてみます。

「怒り」ではなく、「失望や反省」ということです。

最後に、できるだけ肯定的な言葉で、どうしたら喧嘩ができるか尋ねてみます。

結論として、ChatGPTに感情を擬似的に持たせることはできそうですが、友達と会話しているような応答を得ることは、まだ難しそうです。確かに、ChatGPTと口喧嘩しても勝てそうにないですから、その方がいいのかもしれません。