話題のディープラーニングとは?初心者向けに1から徹底解説!

AI・機械学習

2017/10/05

AI・機械学習

本記事では、主に画像処理の分野において優れた成果をあげている、今話題の「ディープラーニング」について解説します。

身近な例ですと、Facebookの写真のタグ付けに使われている顔認識システム、Deepfaceがあります。

実用例も含めて、初心者でも理解できるように解説していますので、ぜひ最後まで読んでディープラーニングとは何かを理解してください。

ディープラーニングとは?わかりやすく解説!

ディープラーニング(深層学習)とは、人間の脳神経系のニューロンを数理モデル化したニューラルネットワークの層が幾重にも重なる、三層以上の多段構造を持つ機構を用いた学習のことを指します。

このようなネットワークを多層ニューラルネットワーク、多層パーセプトロンなどと呼びます。

ディープラーニング

図のように、データが入力されるところを入力層、中間の層を中間層(隠れ層)、出力データの層を出力層といいます。

ディープラーニングの活用法とは

ディープラーニングの技術はもともと、画像処理や自然言語処理を中心に使われていたものですが、近年は更にいろいろなアプリケーションに応用され、具体的な成果を出すようになっています。

◆機械学習、ニューラルネットワーク、ディープラーニング(深層学習)の関係図ディープラーニング

従来の機械学習アルゴリズムと比べると、ディープラーニングを中規模データ(数万の事例)で訓練する場合、計算コストが抑えられ、新たな事例に対してもより良好な汎化ができたことから、産業領域からの注目も集めるようになりました。

研究や開発が盛んになるにつれ、アルゴリズムやハードウェアの性能もより向上し、音声認識や物体認識など人工知能の中心的な問題も解決できるようになりました。

最近の活用例としては、Audiの自動運転成功や、Facebookが、ほぼ人間レベルの顔認識技術”DeepFace”を発表したこと、Googleの人工知能(AI)が、囲碁の欧州チャンピオンに5連勝したこと等が挙げられます。

ディープラーニングの学習手法

ディープラーニングを含むディープニューラルネットワークでは、バックプロパゲーションという学習手法をとることで特徴量の学習が可能となり、複雑な問題への応用も可能になりました。

バックプロパゲーションBP、誤差逆伝播法とも呼ばれる方法で、誤差逆伝播法の「誤差」とは、出力と正解(教師データ)との差を指します。

逆伝播法とよばれているのは、出力された内容が入力内容と異なる場合、モデルから出力した値と実際の値の誤差を、入力層方面に向けて、つまり逆方向に伝えて学習させるためです。これは出力層から入力層に「逆」に解いていく(パラーメータを決定していく)ほうが「誤差」を最小にするのに、幾つかの点で優れているためです。

「誤差」を最小にするためには微分(高校数学)を使います。フォワードで解こうとすると微分のコストが膨大になってしまいますが、バックワード法では、直接微分計算しなくて済むのでコストが少なくて済むのです。(このあたりを数学的に理解するためには高校で習う合成関数の微分法の理解が必要です。)

この方法により、それぞれの層に合った重み調整をできるようにしたため、中間層が3層以上の構造でも学習が可能になりました。しかし、バックプロパゲーションの学習の仕方は伝言ゲームに似ています。

伝言ゲームでは、伝言を伝える人の数が多くなればなるほど、元の伝言内容が正確に伝わりづらくなります。ディープラーニングも層を増やすと勾配消失問題などにより学習が難しくなっていきます。

 

人工知能(AI)、機械学習、ディープラーニングの違いとは?

ここでは、人工知能(AI)、機械学習、ディープラーニングの違いについて見ていきます。

◆人工知能(AI)、機械学習、ディープラーニング(深層学習)の関係図
ディープラーニング

ディープラーニングは機械学習の一部であり、機械学習は人工知能(AI)の一部です。

人工知能(AI)の分類

人工知能(以下AI)とは、学習した結果をもとに、推論を行うことができるシステムです。AI の分類の仕方はいろいろありますが、今回は「強いAI」「弱いAI」で分類してみます。

AI研究者は、AIを意識や自我を持つか持たないかでAIを「強いAI」「弱いAI」と区別しています。この「強いAI」、「弱いAI」という概念は、哲学者ジョン・シャール(John Searle)が1980年に出した論文で提唱したものです。

実はこの論文では、強い/弱いのはどのようなAIか、ではなく、どのような考え方、立場の研究者か、を述べています。コンピュータの高度化,アルゴリズムの改良で「コンピュータにマインドが出来る」というのが強いAI派の研究者の考え方で、「心の一側面を模倣しようとしているだけ」というのが、弱いAI派の研究者の考え方、です。

現在で主流となっているAIは、道具である特化型のAI、つまり弱いAIであり、特定の用途については突出した成果を出しています。つまり、機械学習もその一部であるディープラーニングも、この弱いAIの範疇にあります。

機械学習とディープラーニングの違い

では、従来の機械学習とディープラーニングでは何が違うのでしょうか。

従来の機械学習の最大の問題点は、現実のどこに注目するかを人間が決めてきた、もしくは、特徴量をコンピュータが人間の助力なしに発見することができなかった、ことにあります。ディープラーニングの登場で、コンピュータがデータをもとに、何を表現すべきか、を自動的に獲得するようになったことは、AI史上、革新的な出来事でした。

つまり、機械学習とディープラーニングの違いは、コンピュータがデータをもとに、何を表現すべきか、を自動的に獲得するか、しないか、といえるでしょう。

 

ディープラーニングが発達した背景(GPUの発達)

提唱された当初からこれまで、ニューラルネットワークがほとんど知能と呼べるものを生み出せずにきたのは、もっとも基本的なニューラルネットワークでも計算処理上の要求が非常に高く、実用的とは言い難い状況におかれていたからです。

ディープラーニングが発達した背景の1つにはGPUの発達があります。NVIDIAによると、GPUは対CPU比で10倍程度の演算パフォーマンスをディープラーニング分野で発揮することができます。

ディープラーニングの学習フェーズは行列演算を行う部分が多いのですが、GPUは元々、そうした行列演算を得意としてました。GPU搭載のマシンで1日程度かかる計算が、CPUでは10日程度かかる、それほどの差をもたらしたGPUの登場は、ディープラーニングの利用を現実のものにしました。

 

ディープラーニング関連で注目を集めている技術

①畳み込みニューラルネットワーク(CNNConvolutional Neural Network

畳み込みニューラルネットワーク(以下、CNN)は画像関連を中心に大きな成功を収めているモデルです。

CNN は、神経科学の原理がディープラーニングに影響を与えた顕著な例で、畳み込み層による特徴抽出を行うのが特徴です。CNN が得意なのは、感情分析やスパム検出 、カテゴリ分類などの分類問題です。画像認識処理でよく利用される深層学習モデルですが、自然言語処理にも利用され、成果を出しています。

 

DCGANDeep Convolutional Generative Adversarial Network または Deep Convolutional GAN

DCGANは、GANGenerative Adversarial Network)の一種で、名前の通りCNNを使ったモデルです。2016年の初めに、写真並みの画像を生成できるということで非常に有名になりました。

ベースになっているGANは生成モデルの一つで、学習が不安定なものの、他の手法に比べてくっきりとした画像が生成される傾向があるのが特徴です。GANにはいろいろな種類がありますが、中でもDCGANは一発で高解像度画像を生成することに成功しています。

 

いかがでしたか? ディープラーニングの理解を深めることができましたか?

udemyでは、初心者でも理解しやすいようディープラーニングの入門講座を用意しています。

初心者でもぜひ受講して、話題のディープラーニングの知識を深めてください!

 

  

ディープラーニングを1から学べる動画講座がオススメ!

【4日で体験しよう!】 TensorFlow x Python 3 で学ぶディープラーニング入門

【4日で体験しよう!】 TensorFlow x Python 3 で学ぶディープラーニング入門

TensorFlow 1.3.0対応! 4日間でディープラーニングを体験してみよう!文系・数学なし・Linuxなしでも体験できます。Windows, MacだけでOK!

動画で学習する

  • シェア
  • ツイート
  • Poket
  • はてなブックマーク
  • フォロー
  • シェア
  • ツイート
  • Poket
  • はてなブックマーク
  • フォロー

関連記事