COMWARE PLUS プラス・サムシングを大切なお客さまへ

NTTコムウェア AI活用最前線~Deep Learningを活用した画像認識の現在
NTTコムウェア AI活用最前線~Deep Learningを活用した画像認識の現在
ポスト
        
        

この記事のPDFをダウンロードする

産業構造の変化やコンピューター技術の進化により、実用化が急速に進む人工知能(AI)。コールセンター、医療診断、店舗解析、自動運転、株価予測など、さまざまな分野でAIが導入されています。NTTコムウェアでは早くからAIの開発に取り組み、2017年3月には、オンプレミス環境で利用可能な「Deep Learning画像認識プラットフォーム」*1《インストール版》の販売を開始しています。また、機能拡充し、2017年6月30日よりインターネット上でのサービスとして利用可能な《クラウド版》*2の販売も開始します。

既知のデータを学習し「未知のデータ」を解析する

近年のAIブームの火付け役となった技術の一つに「Deep Learning」があります。コンピューター性能の向上とビッグデータの普及がAI技術の進展を促し、画像認識や音声認識などの精度を飛躍的に高めてビジネス向けの製品化を可能にしました。その原動力となった技術が、Deep Learningです。

Deep Learningの特長は、既知のデータを学習させることにより、未知のデータに対しても回答を出せることにあります。例えば、さまざまな種類の犬の画像を入力して「これらは犬だ」と教え込んでおくと、未知の画像でも「犬」という回答を出せるようになります。

画像認識処理には、「画像収集」、「学習」、「認識」という3つのフェーズがあります。「画像収集フェーズ」では、判別を行う対象分野の画像を大量に集めて学習画像セットを作成します。「学習フェーズ」では、作成された学習画像セットを用いて「Deep Learning画像認識エンジン」が学習を行います。「認識フェーズ」では、WebAPIに対して未知の画像を送信することで学習結果を元に認識結果を取得できます。

NTTコムウェアの「Deep Learning画像認識プラットフォーム(以下、画像認識プラットフォーム)」は、業務でのAI導入を容易に行えるよう、学習機能と判定機能を備えた「画像認識エンジン」と「学習データ作成ツール」で構成されています。基本データとして、150万枚の一般的な物体の画像を学習済みですので、用途別の追加学習を迅速かつ効率的に実施できます。

画像認識プラットフォームには、この一連の作業をシームレスにワンストップで実現できる仕組みが用意されています。

図1:画像認識ができるまでの流れ

図1

画像認識プラットフォームの3つの特長

画像認識プラットフォームの特長はおもに3つあります。まず、「簡単にお客さま専用のAIを作れる」ことです。簡単な操作で日々繰り返しAIに学習させることが可能で、認識エンジンをお客さまの現場の観点にチューニングできます。

次に「柔軟にシステムと接続できる」ことです。APIを具備しているので、お客さまの既存システムとも柔軟に連携して利用できます。

そして、3番目は「早く学習できる」ことです。通常の学習には一定の時間がかかりますが、業務によっては短時間で学習することが非常に重要になります。NTTコムウェアは、効率的に学習を行える多くの特許技術を持っており、少ない画像のデータ量で短時間に学習できるアルゴリズムを取り入れています。

※ 特許技術:4件登録済、他4件申請中(2017年6月時点)

次ページ 「レベル判定型」「分類型」「検出型」、画像認識の3パターン

ポスト

事例紹介

スマートフォン用リンク

エバンジェリストが語るICTの未来

スマートフォン用リンク

ページトップへ

トップへ