JDreamⅢ

日本最大級の科学技術文献情報データベース

人工知能(AI)関連サービス

  • 要申込

当社は長年のビジネス/サイエンスデータベース事業を背景に、 データ調達、自然言語処理で豊富な実績を持っております。人工知能(AI)・機械学習分野でキーとなるプロセスに取り組むことができる経験と技術を強みとしています。

人工知能(AI)・機械学習プロジェクトの成否は「学習データの量と品質」にかかっています。データ起点のアプローチでお客様のプロジェクト成功を支援いたします。

学習用ビッグデータ調達・著作権処理サービス

機械学習の基本となる『学習用ビッグデータ』確保を支援いたします。

学習データの提供

ジー・サーチ保有データの提供

  • G-Search(新聞/雑誌記事 1億件), JDreamⅢ(医学/科学技術文献情報 7,000万件), RightFind(論文原著 600万件), 読売新聞(同社発行の「The Japan News」との日英文対応コーパス 70万件)をはじめとするジー・サーチ提供データベースサービスを構造化データとして提供。
  • 学習データの性格により、媒体や情報種別、テーマやキーワードによる情報抽出をコンサルティング。
  • 各情報提供会社との著作権処理交渉の実施。

学習データの調査・調達

オープン/ネイティブデータの調査

  • 学習データとして最適なデータの存在可否を調査。
  • 海外オープンデータなど、グローバル調査の実績。

オープン/ネイティブデータの調達

  • プライベート/ネイティブデータの調達交渉。
  • 調達データの正規化作業を実施。
  • 各情報提供会社との著作権処理交渉。
  • 学習データ 「作成」 サービス

学習データの作成

記事/企業DBの知識構造化データ

  • 新聞、企業情報などファクトデータから抽出した知識データ(構造化データ、モデル)を作成・提供。

学習データの作成(自然文)

  • 固有表現・意味抽出のための専用学習データの作成。
  • 表現、用語配置などルールに沿った教師データの作成。
  • 類似する検証データの作成(自然テキスト)。

アノテーションサービス

学習の質を向上させる各種自然言語処理を実施いたします。

アノテーション

専門家による専門情報のアノテーション

  • 医学/薬学/化学などの各技術分野の専門家による高品質なアノテーション(タグ付け・ラベル付け・正解付け)を提供いたします。
テキストアノテーションツール「Brat」を使用した医学文献アノテーション例

データクレンジング

自然言語処理での実績

  • G-Searchサービスの新聞・企業検索サービスや、JDreamⅢの科学技術論文情報検索サービス上で提供するデータ整備ノウハウを活かしたデータクレンジングを提供。
  • 企業文化などが反映されたお客様データの性格を把握し、最適な形式でデータを標準化。
  • 当社保有の辞書や同義語集などの活用により、重複や誤記、表記ゆれなどを抽出し、正規化、補正・補完、削除を実施。

オープン/ネイティブデータの調達

  • プライベート/ネイティブデータの調達交渉。

ルール抽出・作成

非構造化データの構造化

  • 非構造化データに対して人手、または機械により意味解析を行い、自動で分類付与。
  • 形態素解析などの自然言語処理を用いた業務内容や行動様式になど利用目的に合わせてモデル化。
  • 異なるデータベース間の要素を自然言語処理を用いてキーワード抽出を行い、類似度で紐付け。

ご利用までの流れ

ご利用までの流れ

お申込み

「費用感を知りたい」、「もう少しサービス内容を詳しく知りたい」という方も、お気軽にお問い合わせください。お客様のご要望にあったプランをご提案いたします。

先頭へ戻る

ご利用を検討されている方

専門スタッフによるサポート