調査分析レポート
論文データを活用した共同研究者探索プロセスの提案
~生成AIによるデータ処理の可能性~02研究方法著者:中辻 裕 株式会社ジー・サーチ
研究方法
本研究では、仮想テーマとして「気象分野で気候変動をテーマに取り組む学術研究者の探索」を設定し進めることとした。学術論文検索サービスはJDreamⅢを使用、検索実施日は2025年5月5日、抽出対象の論文は国内外問わず過去10年間分とした。検索の結果、2,688件の論文を抽出した。そのうち、共著者を含む著者の所属機関が日本国内の機関と想定される論文は378件に絞られた。この378件における著者と所属機関の情報に対して施した生成AIもしくは手作業によるデータ処理と分析を以下に示す。
- (1) 機関名の抽出と翻訳
- JDreamⅢから抽出した著者および所属機関のデータは、概ね「著者名(所属機関, 所属部門, 所属地域, 所属国)」の様式で記録されており、共著者は「,(カンマ)」で区切られている。そこで、英語表記の翻訳に加え、出力結果が「著者名(所属機関(所属国))|著者名(所属機関(所属国))」となるようプロンプトを作成し、生成AIで処理した。なお、一度に処理させるデータは100件(100論文)とした。
- (2) 名寄せ処理
- 出力結果に基づき、機関名の揺らぎの有無をExcel上で確認した。機関名リストを作成し、アルファベット・五十音順にソートすることで、同一機関の表記揺れを特定し修正した。具体的には、略称の修正や国名の追加、下部組織名の削除などを実施した。
- (3) 所属機関の分析と所属機関・著者ネットワーク図の作成
- Excelと専用の集計ツールを活用し、機関名を投稿論文数の多い順に整理した所属機関ランキングと、主たる所属機関・研究者それぞれの共著関係を可視化した図(ネットワーク図)を作成した。

