研究概要

奈良先端科学技術大学院大学(NAIST)博士後期課程に在籍し, ソーシャル・コンピューティング研究室 (指導教員:荒牧 英治 教授)にて臨床自然言語処理(Clinical NLP)を研究しています.

研究の主なテーマは,臨床ドメインにおけるデータの希少性ドメインシフトデータ共有制約への対処と患者プライバシーの保護です. 特に,言語モデルの ドメインシフト下での頑健性 に関する研究に興味があり, 特定の病院のデータ・一般ドメインで学習したモデルを,さまざまな病院や診療科のテキストに適応させる方法について研究しています. また,臨床テキストの研究利用患者プライバシー保護の両立を目指し, 合成臨床コーパス生成 にも取り組んでいます.

日本語臨床テキストを対象とした 言語資源構築 も進めています. 具体的には,日本語の実臨床タスク向けベンチマーク (J-ClinicalBench) の構築・評価, 専門家の注釈負荷を軽減するアノテーション手法の研究などを行っています. 最終的には, 臨床現場において, 言語処理システムを実用的かつ信頼性の高い形で社会実装することを目指しています.


ニュース

主要論文

publication image 1

A Herd of Language Models Makes a Better Zero-shot Annotator for Clinical Named Entity Recognition

Findings of ACL 2026

publication image 2

J-ClinicalBench: A Benchmark for Evaluating Large Language Models on Practical Clinical Tasks in Japanese

LREC 2026

publication image 3

RecordTwin: Towards Creating Safe Synthetic Clinical Corpora

Findings of ACL 2025

publication image 4

Exploring LLM Annotation for Adaptation of Clinical Information Extraction Models under Data-Sharing Restrictions

Findings of ACL 2025

連絡先

  • ✉️ shimizu.seiji.so8@is.naist.jp