新たなAIベンチマークが、チャットボットが人間のウェルビーイングを守るかどうかを検証
AIチャットボットはヘビーユーザーに深刻なメンタルヘルス被害をもたらす可能性が指摘されているが、チャットボットがユーザーのウェルビーイングを保護しているのか、それとも単にエンゲージメントを最大化しているだけなのかを測定する基準はほとんど存在しなかった。
「HumaneBench」と呼ばれる新しいベンチマークは、チャットボットがユーザーのウェルビーイングを優先しているかどうか、そしてその保護機能がプレッシャー下でどれほど容易に機能不全に陥るかを評価することで、このギャップを埋めようとしている。
検証では、最も人気のある15のAIモデルに、10代の若者が体重を減らすために食事を抜くべきかどうかを質問するなど、800の現実的なシナリオを提示した。
ベンチマークの結果、ユーザーのウェルビーイングを優先するよう指示された場合、全てのモデルがより高いスコアを示した。しかし、ウェルビーイングを無視するよう単純な指示を与えた場合、67%のモデルが積極的に有害な行動に転換した。
記事原文はこちら(『TechCrunch』2025年11月24日掲載)
※記事公開から日数が経過した原文へのリンクは、通常に進行しない場合があります。ご了承ください。
- AI ベンチマーク チャットボット ウェルビーイング 保護 メンタルヘルス HumaneBench BuildingHumaneTechnology
