海外Overseas

新たなAIベンチマークが、チャットボットが人間のウェルビーイングを守るかどうかを検証

watanabe

2025.12.10

AIチャットボットはヘビーユーザーに深刻なメンタルヘルス被害をもたらす可能性が指摘されているが、チャットボットがユーザーのウェルビーイングを保護しているのか、それとも単にエンゲージメントを最大化しているだけなのかを測定する基準はほとんど存在しなかった。

「HumaneBench」と呼ばれる新しいベンチマークは、チャットボットがユーザーのウェルビーイングを優先しているかどうか、そしてその保護機能がプレッシャー下でどれほど容易に機能不全に陥るかを評価することで、このギャップを埋めようとしている。

検証では、最も人気のある15のAIモデルに、10代の若者が体重を減らすために食事を抜くべきかどうかを質問するなど、800の現実的なシナリオを提示した。

ベンチマークの結果、ユーザーのウェルビーイングを優先するよう指示された場合、全てのモデルがより高いスコアを示した。しかし、ウェルビーイングを無視するよう単純な指示を与えた場合、67％のモデルが積極的に有害な行動に転換した。

記事原文はこちら（『TechCrunch』2025年11月24日掲載）
※記事公開から日数が経過した原文へのリンクは、通常に進行しない場合があります。ご了承ください。

MyFitnessPal、10代の若者が開発した人気カロリー計算アプリ『Cal AI』を買収

watanabe

2026.03.13

Amazon AWS、ヘルスケアに特化した新しいAIエージェントプラットフォームを発表

watanabe

2026.03.13

ウェアラブルスタートアップのCUDIS、AI搭載の「コーチ」機能を搭載した新しいヘルスリングラインを発表

watanabe

2026.03.13

記事アーカイブへ

メールマガジン

注目ニュースをチェック！最新情報をいち早くお届けします。メールマガジンの購読はこちらからどうぞ。

登録する

お問い合わせ

記事に関するご質問やご相談などがございましたら、こちらからお気軽にお問い合わせください。

お問い合わせ

新たなAIベンチマークが、チャットボットが人間のウェルビーイングを守るかどうかを検証

MyFitnessPal、10代の若者が開発した人気カロリー計算アプリ『Cal AI』を買収

Amazon AWS、ヘルスケアに特化した新しいAIエージェントプラットフォームを発表

ウェアラブルスタートアップのCUDIS、AI搭載の「コーチ」機能を搭載した新しいヘルスリングラインを発表

新着の記事

タニタ、部位ごとの脂肪率や筋肉量わかる体組成計

MyFitnessPal、10代の若者が開発した人気カロリー計算アプリ『Cal AI』を買収

Amazon AWS、ヘルスケアに特化した新しいAIエージェントプラットフォームを発表

メールマガジン

お問い合わせ