心をつなぐ、社会をつなぐ

検索5 6 7
ページ内移動ナビゲーション
  1. ナビゲーションへ移動 (アクセスキー 1)1
  2. 本文へ移動 (アクセスキー 2)2
  3. カテゴリーごとのナビゲーション・関連リンクへ移動 (アクセスキー 3)3
  4. サイト補助説明(ご利用規約、個人情報について、サイトの使い方)のナビゲーションへ移動 (アクセスキー 4)4


NTTコムウェアの研究・開発


研究分野:クラウド基盤技術 ビッグデータを手軽に活用するための処理基盤・分析技術

ビッグデータを分析することによる革新的な知見の導出

近年、ビッグデータと呼ばれる大量かつ多様なデータを用い、新しいビジネスにつなげる流れがさまざまな業界で生まれています。例えば2012年のアメリカ合衆国大統領選挙、オバマ陣営の大勝を握った鍵は、選挙権者のデータ分析を行い膨大な数の選挙シミュレーションを実施した、ビッグデータの活用にあるとといわれています。
これまでも、ログなどを分析して新たな知見を得る取り組みは行われていましたが、大量かつ多様なデータを分析するには、データ収集および分析手法が確立されておらず、実現が困難という現状がありました。
NTTコムウェアでは2009年度より、ビッグデータに対応した分散処理基盤と、大規模システムのオペレーションノウハウから培ったデータ分析の研究に取り組んでいます。これにより、従来まで未活用であったデータを用いた分析が可能となり、革新的な知見を導き出すことが期待されます。

ビッグデータの活用には、蓄積する仕組みと分析手法が重要

ビッグデータ技術は、大量のデータを分析し、サービスへの付加価値を見つけるための技術です。一般的にビッグデータとは、常に発生している多種多様な大量のデータのことを指します。具体的には、「SNSやTwitterなどのソーシャルメディアのデータ」、「車や携帯のGPSや、気温・雨量などのセンサーデータ」、「オンラインショッピングなどの検索、購入履歴のログデータ」などがあります。これらのデータを分析し活用することで、新しいサービスに生かそうとする取り組みがさまざまな業界で積極的に行われています。

NTTコムウェアでは、NTTグループが所有する膨大な数の設備情報および常時発生する大量の通信データを分析することで、機器故障の早期発見や通信の品質向上につなげる取り組みを行っています。分析の際には通信データに含まれる個人情報を保護するセキュリティー対策もビッグデータを利用する上で重要な技術です。
ビッグデータを活用するためには、「データを集めて蓄積する仕組み」と「データを分析する手法」が重要です。NTTコムウェアでは、ビッグデータ分析技術とビッグデータ基盤技術の両面に取り組んでおり、データの収集・蓄積から分析までを一括して提供することで、お客さまのビッグデータ活用をお手伝いしています。

NTTコムウェアのビッグデータ分析

NTTコムウェアのビッグデータ分析

ポイント

(1)ビッグデータ分析技術

ビッグデータでは多種多様なデータを集めて分析するため、従来の分析手法では相関あるいは因果関係を見つけ出すことが難しく、これらの関係を見つけ出す新たな分析手法が必要となります。NTTコムウェアではその要求に応えるため、統計解析、自然言語処理、機械学習などの技術を応用したレコメンドエンジンや高度な分析アルゴリズムの開発を行い、積極的に国際学会など*1に論文を投稿し、発表を行っています。
たとえば、分析手法の一つとして、ソーシャルメディアのつぶやきなどといった非構造化データ*2から、つぶやき内容とつぶやき時間を用いて各ユーザーの嗜好(しこう)を推定し、嗜好が似たユーザーをコミュニティーにまとめ(クラスタリング)、そのコミュニティーの中で流行している言葉(トレンド)のランキングを抽出する技術を考案しました。この技術を使うことで、あるグループが今興味を持っているものが分かるので、広告配信やマーケティングに活用することが可能になります。

ビッグデータ分析アルゴリズム

ビッグデータ分析アルゴリズム

また、新規技術の研究開発だけでなく、お客さまへのコンサルティングや分析手法の提案、ビジネス適用まで支援可能なデータサイエンティスト*3の育成に取り組んでいます。

(2)ビッグデータ基盤技術

ビッグデータを活用するためには、分析手法だけでなく、分析するためのデータを収集・蓄積する仕組み(基盤)が必要になります。ビッグデータは既存のデータと比べて量が多いだけでなく、生成頻度が高く、データの種類・形式が多様であるという特徴があります。こういった特徴のあるデータは、従来のRDBMS*4などの基盤では扱うことが困難です。そこにデータ分散処理基盤であるHadoop*5が登場したことにより、従来よりも容易に大規模データの蓄積・分析ができるようになりました。
現在では多数のビッグデータ分散処理基盤が登場しています。それぞれの基盤は長所短所があるため、ビッグデータの活用目的に合わせた基盤の選定・組合せが重要になってきます。適切な分散処理基盤を活用するため、代表的な分散処理基盤であるHadoopを中心に、データベース製品HBase*6、ストリームデータ処理のStorm*7など複数のOSS製品の目利き調査や活用方法の研究に取り組んでいます。

ビッグデータ処理基盤全体像

ビッグデータ処理基盤全体像

NTTコムウェアでは、お客さまの要望に合わせて適切なOSSを組み合わせたソリューションを提案することができるよう、ビッグデータ分析に関する多種多様なOSS製品の検証を行っています。また、先で述べた独自の分析手法を、特定のベンダー製品に縛られない自由度の高い処理基盤の上で実現するために、分散処理基盤の実装方式や活用方法について研究を進めています。

既存サービスの向上、新規サービスの提供を目指して

NTTコムウェアでは設立当時よりお客さまデータや設備情報、通信データなどの大規模データを扱うシステムの開発を手がけてきました。今後はこれらの大規模データに対し、ビッグデータ分析技術を用いることで、従来よりも高精度、かつ、高速に機器故障の予知・検知やトラヒックの輻輳管理をすることができると考えており、これにより通信の品質向上の実現を目指します。また、上記のような社内に蓄積された大規模データと、SNSなどで一般に公開されているビッグデータを組み合わせることで、NTTグループ各社から、お客さま個々人の趣味・嗜好に合わせたサービス提供ができるように、ビッグデータ分析の活用を目指します。

ページトップへ