RadAgent: 胸部CT画像の段階的解釈のためのツール利用AI エージェント
RadAgent: A tool-using AI agent for stepwise interpretation of chest computed tomography
要約
Vision-Language Model (VLM)は医療画像解釈を進歩させたが、既存手法では臨床医が最終出力を受け身で観察するのみで、推論過程の検証が困難である。本論文では、段階的で解釈可能なプロセスでCTレポート生成を行うツール利用型AIエージェント「RadAgent」を提案する。各レポートは中間的な判定とツール相互作用の追跡可能な痕跡を備え、臨床医が発見がどのように導出されたかを検査できる。実験結果から、RadAgentは3D VLM「CT-Chat」と比べ、macro-F1で6.0ポイント(相対36.4%)、micro-F1で5.4ポイント(相対19.6%)の臨床精度向上、敵対的条件下で24.7ポイント(相対41.9%)のロバスト性向上を達成した。さらに、既存VLMには存在しない忠実性(Faithfulness)で37.0%を達成し、放射線科における透明で信頼性の高いAIへの進展をもたらす。