調査分析レポート
テキストデータから読み解く研究開発動向事例と調査手法の紹介
米国ファンディング機関が採択した研究課題を例に01米国ファンディング機関(NSF)の採択課題に関する分析調査の概要
本稿は「令和4年度文部科学省 科学技術調査資料作成委託調査「国際競争力のある研究開発戦略の立案に向けたNSF採択課題分析業務(委託業務成果報告書)」(以下、調査報告書) [1] 及び一般社団法人情報科学技術協会が主催する第20回情報プロフェッショナルシンポジウム口頭発表 [2] を基に加筆・修正したものである。
文部科学省では、米国のファンディング機関である米国国立科学財団(National Science Foundation:NSF)がこれまでに採択してきた研究課題データを対象に、テキストデータの分析調査を実施している。本稿では、その調査報告書を例に、研究課題データのテキストデータを対象とした研究開発動向調査結果と研究開発動向調査手法の今後の展望及び課題について紹介する。
[1] 令和4年度文部科学省 科学技術調査資料作成委託調査「国際競争力のある研究開発戦略の立案に向けたNSF採択課題分析業務」.2022,
(https://www.mext.go.jp/content/20221102-mext-chosei1-100000404.pdf)
[2] 中辻裕 他.テキスト情報から読み解く研究開発動向事例及び調査手法の紹介―米国ファンディング機関が採択した研究課題を例に―.第20回情報プロフェッショナルシンポジウム.2023,
(https://doi.org/10.11514/infopro.2023.0_55)
はじめに
研究開発動向調査とは、企業や大学、研究機関における研究開発状況の把握を目的とする調査であり、技術動向調査の一つである。技術動向調査とは、科学技術分野全般や特定の技術領域を対象とした研究・技術開発状況を、政策や市場、研究開発、技術開発の視点から調査するものである。技術動向調査の活用場面や調査手法、主な調査対象は様々で、行政機関や研究機関、企業などが広く取り入れている調査の一つであり、利用者によって活用場面や取り入れる手法も異なっている(図表 1)。
目的 | 活用場面 |
---|---|
政策立案 | 科学技術戦略、産業戦略、安全保障戦略 |
戦略立案 | 研究開発戦略、M&A戦略、知的財産戦略 |
研究テーマ探索 | 研究開発計画等 |
一般業務利用 | 知的財産業務等 |
技術動向調査に含まれる手法及び主な調査対象 | |
---|---|
政策動向 | 各国の政策や規制情報 |
市場動向 | 市場規模や企業活動情報 |
研究開発動向 | 論文動向など、研究開発分野の活動情報 |
技術開発動向 | 特許動向など技術開発分野の活動情報 |
出典:第20回情報プロフェッショナルシンポジウム口頭発表資料より
技術動向調査のリソースには、特許出願情報や論文発表情報、行政・研究機関の研究開発情報といった定量情報と、研究機関や企業のプレスリリース、行政機関や公的研究機関が公開する調査報告書などといった公開されている定性情報が存在する。
一般的な調査は、技術俯瞰図を用いた技術概要のほか、定量情報を可視化することで傾向を把握し、定性情報を用いて特筆すべき具体的な取り組みを整理・体系化する形で構成されている。定性情報は主にテキストデータであることが多いが、時間や費用などかけられるコストに制約がある中で読み取り可能な分量が限られ、十分に活用できていないデータも多いと考える。また、AIなど単一の領域に留まらない融合領域への着目により、対象となる定性情報が増加していることにより、さらに活用不十分になっている可能性もあるだろう。
定性情報をビッグデータとして読み取り可視化した事例として、特許庁が実施する特許出願技術動向調査 [3] が挙げられる。この調査では、検索式から抽出した母集団の特許情報を一つ一つ読み込んだ上で、ノイズ排除および技術区分付与を行うことにより、精度の高い解析を行っている。一方で、大量の情報を対象とした場合には時間や費用といったコストがかかり、情報を読み込む専門人材のスキルレベルに影響され、調査精度は高いものの簡単に取り入れられる手法ではない。
もうひとつ、定性情報を可視化した例として、大量のテキストデータの自然言語処理により有益な情報を取り出す、テキストマイニング解析に特化したソフトウェアが公開され、技術動向調査にもテキストマイニングを活用した分析が取り入れられるようになった。例えば、NISTEPでは、最新の科学技術動向を科学研究費助成事業の採択課題データや学会発表の抄録等の情報を用いた国内における先端研究動向調査として、研究助成プログラムの分析と可視化を目的としたARAKIシステムを開発し、研究動向などの状況把握を行っている [4] 。この取り組みに関連して、文部科学省ではNISTEPと連携し、米国国立科学財団(National Science Foundation)(以下、NSF)のファンディング情報を基にした、海外における研究開発動向の調査を行っている。
そこで本稿では、上述した文部科学省の取り組みについて、定性情報であるテキストデータをビッグデータとして分析した研究開発動向調査事例のうち、令和4年度に株式会社ジー・サーチが受託した調査(以下、本調査)を取り上げ紹介する。そして、研究課題のテキストデータを対象とした研究開発動向調査結果及び研究開発動向調査手法について、今後の展望と課題についても紹介する。
[3] 特許庁.特許出願技術動向調査. 2023,
(https://www.jpo.go.jp/resources/report/gidou-houkoku/tokkyo/)(参照 2023-04-14)
[4] 荒木寛幸.米国における研究動向の調査研究-NSFを事例とした共起ネットワーク分析から見る研究動向-.STI Horizon.2022, Vol.8, No.1, p.56-58.
(https://doi.org/10.15108/stih.00288)
調査背景及び調査方法
調査背景
本調査の目的は、今後の科学技術行政において中長期的に重要となる新興・融合領域へ対応するために、国外の最新の研究開発動向を分析し、先見性と戦略性を備えた国際競争力のある研究開発戦略の立案に資する基礎資料の作成である。具体的には、米国のファンディング機関であるNSFに着目し、(1)NSFプログラムの実施手法や予算推移などといった運営面の取り組みの把握(以降、NSFプログラム調査)、および(2)NSFがこれまでに採択してきた研究課題の動向調査(以降、NSF採択課題動向調査)を実施した。
調査方法
NSFプログラム調査では、NSFが公開している予算報告書や財務諸表、2022-2026戦略計画に加え、科学技術振興機構 研究開発戦略センター(CRDS)などの調査機関が公開する調査報告書も参考に情報を整理した(図表 2)。
調査項目 | 調査視点 | |
---|---|---|
(1) | NSFについて |
|
(2) | NSFプログラム概要 |
|
(3) | NSFプログラム立ち上げから課題採択までのプロセス整理 |
|
上記調査項目は、NSFが公開する予算報告書や概要報告書、財務諸表、 |
||
(4) | 近年のNSF組織改編等のまとめ |
|
上記調査項目は、米国が公開する関連法案などの公開情報をもとに把握。 |
出典:調査報告書(2022)及び第20回情報プロフェッショナルシンポジウム口頭発表資料より
NSF採択課題動向調査では、NSFのホームページ [5] から、2018年及び2021年に採択された研究課題データをダウンロードした。その後、NSF採択課題のタイトルと概要を翻訳し、内容を表す日本語キーワード(索引語等)の自動抽出を行った。翻訳後のデータは、日本語キーワード数の伸び率の分析(以下、キーワード分析)や、NSF及びNSF内の各局が実施した研究課題について共起ネットワーク分析を実施した。なお、2018年採択課題は2022年6月5日時点、2021年採択課題は、2022年7月21日時点のデータを活用している。
キーワード分析では、2018年及び2021年のキーワード出現数を把握し、各年一課題当たりのキーワード出現率を算出した。一課題当たりのキーワード出現率は、2018年と2021年の割合差を算出し、ランキング方式で整理した。また、2021年に新たに出現したキーワードも抽出し、ランキング方式で整理した。
共起ネットワーク分析では、テキストマイニング分析ツールであるKH Coder [6] を用いて、キーワードを対象とした共起ネットワーク図を作成し、可視化されたキーワードをグルーピングすることで、各局が採用した研究課題の動向を年別に調査した。
[5] NSF. Download Awards by Year,
(https://www.nsf.gov/awardsearch/download.jsp)(参照 2023-04-14)
[6] 樋口耕一.テキスト型データの計量的分析 ―2つのアプローチの峻別と統合―『理論と方法』.数理社会学会.2004,19(1),p.101-115.
(https://doi.org/10.11218/ojjams.19.101)