※本記事にはアフィリエイトリンクが含まれています。
なぜ今、医療系AIツールを2週間ガチ検証したのか
正直に告白します。
筆者は3ヶ月前まで「ai 医療 診断 支援 ツールなんて、まだ実用レベルじゃないでしょ?」と思っていました。
でも、家族が原因不明の症状で病院をたらい回しにされた経験をきっかけに、**「素人でも使える医療AIって、本当にどこまで使えるの?」**という疑問が頭から離れなくなったんです。
そこで先月、話題の医療診断支援AI「Glass Health」と「Hippocratic AI」、そして汎用AIのClaude 3.5を医療文脈で使い倒すという、計14日間のガチ検証をやってみました。
つい先日「ChatGPTがシェア4割を切る 急伸するClaude、安定のGemini」というニュースが出ましたが、医療領域でもこの勢力図、ハッキリ反映されていてびっくりしましたよ。
結論から言うと、想像の3倍は実用的でした。ただし、致命的な落とし穴も発見したので、最後まで読んでくださいね。

Photo by Vitaly Gariev on Unsplash
初日〜3日目: 期待と裏切りの連続
初日: 「思ったより賢くない」
初日に試したのはGlass Healthの無料版。
症状を入力すると鑑別診断(考えられる病気のリスト)を出してくれるツールです。
試しに「38度の発熱、右下腹部痛、嘔吐、24時間継続」と入れてみると、虫垂炎を含む5つの候補を3秒で提示してきました。
速い。でも、ここで「あれ?」と思ったんです。
どれも教科書通りすぎて、「経験豊富な内科医のあのカン」みたいなものが全然ないんですよね。
2日目: Claudeとの併用で世界が変わった
2日目、ふと思いついてClaude 3.5 Sonnetに同じ症状を投げてみました。
衝撃でした。
Claudeは候補疾患だけでなく、**「次に確認すべき身体所見」「鑑別に必要な追加質問」「緊急度の判定」**まで整理して返してきたんです。
医療特化ツールよりも、汎用AIの方が「考えるプロセス」を見せてくれる。これは2026年現在の医療AI業界の、ひとつの重要な示唆だと感じました。
3日目: GPT-5.2との比較で見えた格差
話題のGPT-5.2でも同じ検証をしてみました。
医療文献の引用は最も正確。ただし**「ハルシネーション(もっともらしい嘘)」が時々混じる**のが怖いところ。
実際に存在しない論文を「2024年のNEJM掲載」と堂々と引用してきて、ヒヤッとしました。
深掘り検証: 5つの機能を実測してみた
1. 鑑別診断の精度(10症例で検証)
筆者が用意した架空の10症例で、3ツールの正答率を比較しました。
- Glass Health: 8/10(80%)
- Claude 3.5: 9/10(90%)
- GPT-5.2: 7/10(70%、ただし1件ハルシネーションあり)
Claude勝利です。意外でしょう?
2. レスポンス速度(平均値)
- Glass Health: 2.8秒
- Claude 3.5: 4.1秒
- GPT-5.2: 5.6秒
速度ではGlass Healthが圧倒的。緊急時の判断支援なら速度は正義です。
3. 説明のわかりやすさ(家族に見せて評価)
医療知識ゼロの妻に画面を見せて「理解度」を5段階評価してもらいました。
- Claude 3.5: 4.8点
- GPT-5.2: 4.2点
- Glass Health: 2.5点(専門用語だらけ)
ここでも汎用AIの強さが際立ちました。

Photo by Trnava University on Unsplash
4. プライバシー設計
ここは見逃せないポイントです。
Glass HealthはHIPAA準拠(米国の医療情報保護法)を明記。Claudeは医療データの学習利用を停止する設定が可能。
GPT-5.2は…正直、規約が複雑すぎて読み切れませんでした。
5. コストパフォーマンス
月額換算で並べると:
- Glass Health Pro: 約$29
- Claude Pro: 約$20
- ChatGPT Plus: 約$20
価格対性能比ではClaude 3.5が頭ひとつ抜けている印象です。
意外な発見: 使い込んで初めてわかった3つの真実
発見1: AIは「診断」より「問診」が得意
2週間使ってわかったのは、医療AIは病名を当てるよりも、「医師に伝えるべき情報を整理する」用途で本領を発揮するということ。
受診前にAIで症状を整理しておくと、診察時間が体感で半分くらいになりました。
発見2: 画像診断は「まだ」素人が触るべきでない
試しに皮膚の写真を撮ってAIに見せたら、良性のホクロを「悪性メラノーマの疑い」と判定されて軽くパニックに。
皮膚科で診てもらったら何でもなかったんですが、画像診断系は専門医のサポートツールとしてのみ機能すると痛感しました。
発見3: 「セカンドオピニオン代わり」が一番の使い道
これが最大の発見。
医師の診断に納得いかない時、AIに同じ症状を伝えて**「他に考えられる病気はある?」**と聞くと、医師が見落とした可能性を3〜5個出してくれます。
もちろん最終判断は医師ですが、患者側の武器として超優秀でした。
他ツールとの使い分け: 場面別の最適解
先日読んだ「Gemini、ChatGPT、Claudeどれに何を任せるか」という記事の医療版を作るとこうなります。
緊急時の判断支援
→ Glass Health一択。速度が命。
慢性疾患の管理・服薬相談
→ Claude 3.5。説明の丁寧さが圧倒的。
医学論文の要約・調査
→ Gemini 2.5。長文処理と引用精度が高い。
家族への説明資料作成
→ Claude 3.5。わかりやすさで他を圧倒。

Photo by 1981 Digital on Unsplash
失敗談: 筆者が2週間で犯した3つのミス
正直に書きます。
ミス1: AIの診断を鵜呑みにして市販薬を買ったら全然違う病気だった(結局病院へ)
ミス2: 個人情報を含む症状をうっかり無料版に入力してしまった
ミス3: 英語の医学用語を日本語訳させたら微妙にニュアンスが違っていた
どれも**「AIは補助、判断は人間」**という鉄則を破った瞬間に起きました。
結論: 「買い」か「見送り」か
判定: 条件付きで買い。
具体的には:
- 家族の健康管理担当の人 → 絶対買い
- 慢性疾患を持っている人 → 買い
- 健康診断で引っかかった人 → 買い
- 完全に健康な人 → 様子見でOK
月$20のClaude Proを起点に、必要に応じてGlass Healthを追加するのが筆者のおすすめ構成です。
2026年の現時点で、ai 医療 診断 支援 ツールは「医師の代わり」ではなく「自分の体を守る武器」として完成度が一気に上がってきました。
2025年までの「まだ早い」という評価は、もう古い情報です。
触ってみないと損する時代に、確実に入りましたよ。



