

空前のAI・機械学習・ディープラーニングブームが到来する中、AWS(アマゾンウェブサービス)やMicrosoftなどのIT企業が、学習・活用ツールを提供しています。新たなビジネスチャンスをつかむため、今、「学ぶ」ことへの需要が高まっています。
機械学習を楽しみながら学ぶ「AWS DeepRacer」
機械学習を楽しく学べるツールとして注目されているのが「AWS DeepRacer」です。主な学習の仕組みとしては強化学習に分類される「AWS DeepRacer」では、仮想サーキットに仮想車両を走行させて、コースアウトを防ぐなど走行タイムを早める為に、望ましい走行に報酬を与えて進めます。この自立走行の精度を高めることにゲーム性がもたされています。
最初は、AWS DeepRacer service上のGUIでステアリングや速度などのパラメーターを設定するだけで走行を始める事ができます。より細かい設定を行う事も可能ですし、ローカル環境に仮想サーキットを展開して強化学習を進める事も可能です。
そして、「AWS DeepRacer League」に参加してランキングを競い合います。レースに参加すれば世界中の他の参加者と同じ土俵に立てる、よりゲーム性が増すので、どんなレベルでも強化学習に磨きをかけることが面白くなります。
「学習」、「評価」、「レース」を繰り返しランキングをあげていくというゲーム性があるため、楽しみながら機械学習を学ぶことができます。
更に、学習で得た学習モデルと「AWS DeepRacer Vehicle」と呼ばれる18分の1のスケールの実機の電動ミニチュアレーシングカーで実際のコースでの走行テストを行う事もできます。日本では2019年現在は国内向けの認証等の課題で誰しもが手に入れることはまだ出来ないまでも、幕張メッセで行われたAWS Summit Tokyo 2019では実機による大会が行われました。
機械学習と強化学習の関係
ここで、機械学習と強化学習の違いについて説明します。
まず、機械学習とは大量のデータから特徴を見つけ出して問題を解決する手法を示します。
この機械学習には、「教師あり学習 (Supervised Learning)」、「教師なし学習 (Unsupervised Learning)」、「強化学習 (Reinforcement Learning)」があります。

図:機械学習の分類
「教師あり学習」は、人がデータと答えを与えることで学習させます。たとえば大量の花のデータを与えて、どれがバラでどれがチューリップかなどをラベリングしていきます。
一方、「教師なし学習」では大量のデータを与えて、特徴を抽出させて学習させる方法です。たとえば2012年にGoogleがAIにWeb上の写真や動画を読み取らせたところ、AIが自立的に「猫」を認識できるようになりニュースとなりました。
そして強化学習は、機械が学習する際に、報酬を与えることでより「良い」行動を取れるようになるというものです。DeepRacerの機械学習はこのタイプです。強化学習がニュースで注目されたのは、2016年にGoogleのAIが囲碁でプロ棋士を破ったことでした。
強化学習は将来の価値を最大化することを目指す学習モデルですので、必ずしも人がまだ正解を得られていない問題に対しても学習できるため、人を超えることができるのではないかと期待されています。
小型のAIコンピュータボード「Jetson Nano」で自立ロボットを作る