A Herd of Language Models Makes a Better Zero-shot Annotator for Clinical Named Entity Recognition
Findings of ACL 2026
奈良先端科学技術大学院大学(NAIST)博士後期課程に在籍し, ソーシャル・コンピューティング研究室 (指導教員:荒牧 英治 教授)にて臨床自然言語処理(Clinical NLP)を研究しています.
研究の主なテーマは,臨床ドメインにおけるデータの希少性・ドメインシフト・データ共有制約への対処と患者プライバシーの保護です. 特に,言語モデルの ドメインシフト下での頑健性 に関する研究に興味があり, 特定の病院のデータ・一般ドメインで学習したモデルを,さまざまな病院や診療科のテキストに適応させる方法について研究しています. また,臨床テキストの研究利用と患者プライバシー保護の両立を目指し, 合成臨床コーパス生成 にも取り組んでいます.
日本語臨床テキストを対象とした 言語資源構築 も進めています. 具体的には,日本語の実臨床タスク向けベンチマーク (J-ClinicalBench) の構築・評価, 専門家の注釈負荷を軽減するアノテーション手法の研究などを行っています. 最終的には, 臨床現場において, 言語処理システムを実用的かつ信頼性の高い形で社会実装することを目指しています.
Findings of ACL 2026
LREC 2026
Findings of ACL 2025
Findings of ACL 2025