論文 Hugging Face 発表: 2026-04-15 HF ↑4

RadAgent: 胸部CT画像の段階的解釈のためのツール利用AI エージェント

RadAgent: A tool-using AI agent for stepwise interpretation of chest computed tomography

著者: Mélanie Roschewitz, Kenneth Styppa, Yitian Tao, Jiwoong Sohn, Jean-Benoit Delbrouck ほか8名

要約

Vision-Language Model (VLM)は医療画像解釈を進歩させたが、既存手法では臨床医が最終出力を受け身で観察するのみで、推論過程の検証が困難である。本論文では、段階的で解釈可能なプロセスでCTレポート生成を行うツール利用型AIエージェント「RadAgent」を提案する。各レポートは中間的な判定とツール相互作用の追跡可能な痕跡を備え、臨床医が発見がどのように導出されたかを検査できる。実験結果から、RadAgentは3D VLM「CT-Chat」と比べ、macro-F1で6.0ポイント(相対36.4%)、micro-F1で5.4ポイント(相対19.6%)の臨床精度向上、敵対的条件下で24.7ポイント(相対41.9%)のロバスト性向上を達成した。さらに、既存VLMには存在しない忠実性(Faithfulness)で37.0%を達成し、放射線科における透明で信頼性の高いAIへの進展をもたらす。

#agent#multimodal

RadAgent: 胸部CT画像の段階的解釈のためのツール利用AI エージェント

要約

同じカテゴリの記事

Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks

On-Policy Self-Evolution via Failure Trajectories for Agentic Safety Alignment

World-R1: テキストから動画生成における3D制約の強化学習による整合