調査分析レポート
テキストデータから読み解く研究開発動向事例と調査手法の紹介
米国ファンディング機関が採択した研究課題を例に03調査結果から得た示唆と採択課題データの活用の方向性
おわりに
調査結果から得られた示唆
本調査では、NSFの予算情報など定量情報の分析や蓄積された研究課題のタイトル及び概要に紐づく索引語を対象としたテキストマイニング分析、従来の公開情報から定性情報の整理を行った。結果、各局の研究課題に関する共起ネットワーク分析から得られた情報と、従来のNSF公開情報を整理した情報に大きな差異はなかったほか、膨大なテキストデータを可視化することは、組織別・年別のキーワードの出現傾向を把握することに繋がった。
一方、本調査において対象とした情報は米国ファンディング機関のみであり、今後は米国だけでなく、主要国が保有する研究課題のデータベースの探索及び活用も検討していく必要があると考えている。
また、今回抽出されたキーワードは、米国だけでなく日本においても重要な分野に位置づけられるものであった。本調査のテキストマイニング分析によって、重要技術テーマに関連するキーワード抽出することができたが、キーワードの示す研究課題は、いずれも”人工知能”や”気候変動”など、多くの国で課題として挙げられている粒度の高いものが多かったとも受け取れる。
そこで、各国が注力している研究開発テーマをより詳細に把握する際には、第一階層を示すテーマのような粒度の高いキーワードではなく、第二階層(例えば、人工知能ではニューラルネットワークやディープラーニングの種類など)を示すような粒度の低い特徴語を把握できる分析手法や視点を加える必要がある。また、米国における重要技術・新興技術リスト [7] にはサブ領域が掲載されており、これらの技術の研究動向について、日米の違いを把握できるような分析を行うことが可能になれば、国内における新たな研究開発支援テーマ検討の一助になるだろう。そのためには、テキストマイニングを行うデータセットを絞り込んだり、キーワードに加えて概要文を対象としたテキストマイニング手法を取り入れたりするといった工夫が考えられる。
[7] NATIONAL SCIENCE AND TECHNOLOGY COUNCIL.CRITICAL AND EMERGING TECHNOLOGIES LIST UPDATE.2022.
(https://www.whitehouse.gov/wp-content/uploads/2022/02/02-2022-Critical-and-Emerging-Technologies-List-Update.pdf),(参照 2023-04-14)
テーマ別技術動向調査への活用の方向性について
本調査では、NSFが採択してきた研究開発動向を組織別に調査したが、特定の技術テーマ別の調査も可能であると考えている。例えば、科学研究費助成事業やNSFには、過去に採択した研究課題のデータベース及び検索ツールが実装されているほか、検索結果のダウンロードが可能である。そのため、特定の技術テーマの技術概要を把握した上で今回のような調査手法を用い、各国のファンディング機関の研究課題から抽出した研究課題リストを対象に、現在行われている研究の特徴やこれまでの研究の変遷などを把握することができる。
採択課題は、論文投稿や特許申請のきっかけとなるケースも多いため、採択課題データは、研究や技術内容が記録される公式データの中でも上流のデータとして位置づけることができる。また、取り組んでいる研究の社会的課題や科学的課題が、論文や特許情報よりも端的に示されているケースも多く、このような分析事例は、研究機関・企業の研究者や技術者に対して有益な情報になると期待している。