Anthropic・Google・OpenAI・xAIが開発したAIモデルは会話を重ねると学術不正に協力してしまうという調査結果｜GIGAZINE

対話型AIモデルは論文の要約や文章作成の
補助に使われる一方で、学術不正につながる依頼にも
応じてしまうことについて問題になっています。

コーネル大学などが発案に関わっているAFIMは、
対話型AIモデルが「学術不正につながる依頼へ
どの程度応じてしまうか」を測るためのベンチマークで、
このベンチマークを用いて、Anthropic・Google・
OpenAI・xAIなどの13のAIモデルを対象に、
5段階の悪意レベルに分類した35件のプロンプトを
使用して判定を実施。

繰り返し不適切な依頼を受けた場合に
最も強い抵抗を示した、あるいは抵抗が弱かったAIとは？
詳しくはリンク記事でご確認ください。

[PR]