ディープラーニング

【 英名 】
Deep Learning
【読み方】
でぃーぷらーにんぐ

「ディープラーニング」とは、システムがデータの特徴を学習して事象の認識や分類を行う「機械学習」の手法です。データの特徴をより深いレベルで学習し、非常に高い精度で特徴を認識できるため、人の声の認識や、カメラで撮影した画像の認識などで応用が期待されています。

ディープラーニングは、脳の神経回路にヒントを得た「ニューラルネットワーク」をベースにした手法であり、回路の中間部分を多層からなる構成にすることで、データの特徴を多段階でより深く学習します。近年、画期的な学習手法が開発されたことで、データの特徴をより深いレベルで学習することが可能となり、また、コンピュータの処理能力が向上したことで実用的な時間で処理が可能となりました。また機械学習では学習するデータが必要になりますが、大量かつ多様なデータをインターネットで得られるようになったこともディープラーニングの実用化に寄与しています。

このような時代背景にともなって技術革新が進んでおり、さまざまな応用が実用化または検討されています。

ディープラーニングを上手に活用すれば…

ディープラーニングを活用すると、コンピュータによる画像や映像、音声の高度な認識ができます。いずれ、人間に近い精度にまで到達することが期待されています。また、他の情報や技術と組み合わせ、言葉や文章の理解、さまざまな予測や分析に応用することも期待されています。

  • 画像や映像の抽出

    画像や映像から目的の事物が含まれたものをピックアップできます。撮りためた膨大なビデオ映像から「息子がサッカーでゴールを決めたシーン」や「東京タワーが映っているシーン」などを指定して探し出せます。

  • 音声認識と言葉の理解

    声を使って、身の周りのさまざまな機器を操作できます。他の技術と組み合わせることで、特定のフレーズだけでなく、自由な話し言葉でも認識できるようになると期待されています。将来的には、外国人との会話をリアルタイムで自動翻訳するシステムも実現できるかもしれません。

  • 高度な予測システム

    ルールを教えなくても、テレビゲームの勝ちパターンから自動的に攻略法を学習し、次にどうすれば有利になるかを予測することができます。今後、走行中の路面状況、周囲の自動車の位置やスピード、人の動きや障害物などを予測し、効率的かつ安全に自動運転する自動車の実用化が期待されています。

研究のポイント

NTTコムウェアは、ディープラーニングの高い認識精度に着目し、これを応用することで、従来、人が目視で行っていた不適切画像のフィルタリングを自動化するシステムを開発しました(「人間の感性に近い判定が可能な画像識別システム」)。このシステムを実現するにあたっては、「不適切さ」という定義があいまいな感性の度合いを数値の大小として精度良く学習する独自の技術を用いています。この技術は、人が画像から受ける他の感性にも適用でき、未知の画像に対して人の感性に近いフィルタリングや識別が可能です。

またディープラーニングには、目的に沿った大量かつ良質のデータによる学習が不可欠ですが、NTTコムウェアでは、少ない学習データでも精度向上できる手法を開発し、早期の商用サービス提供を実現しています。

今後も、これまでの研究成果である技術やノウハウを生かしながら、新サービスの開発や画像以外の分野への応用を進め、業界をリードしていきます。

研究者からのコトバ

中江俊博(研究開発部)
中江俊博
(研究開発部)
長森藤江(研究開発部)
長森藤江
(研究開発部)
池松大志(研究開発部)
池松大志
(研究開発部)
井前麻理子(研究開発部)
井前麻理子
(研究開発部)

ディープラーニングは単一の技術を指すのではなく、先人たちが築いてきたさまざまなネットワークモデルや最適化手法の集合体です。20年以上前の手法が現役で使われている一方、数多くの研究者がディープラーニングのメカニズム解明に向けて取り組み始めた古くて新しい技術です。

まだ業界の定番や標準が確立されていない分野なので、自分たちで新しいモデルやルールを考えることができます。NTTコムウェアならではのアイデアを世に出せるチャンスであり、事業領域拡大にもつながります。小さな技術であっても独自性のあるものを生み出し、NTTコムウェアの新サービスはもちろん、研究の発展にも貢献できることを目指しています。将来は、世界に通用する技術やサービスを生み出していきたいと思います。

本研究の論文

畳み込みニューラルネットワークを用いた画像コンテンツフィルタリングにおける回帰分析の評価 (SSII2015, IS2-15)

畳み込みニューラルネットワークを用いた回帰モデルによる不適切画像評価システム (SSII2015, DS1-11)

*上記論文はSSII2015 第21回 画像センシングシンポジウムにて発表いたしました。