吉﨑亮介氏・堅田洋資氏が語る 機械学習とデータサイエンスの最適な学習法

吉﨑亮介氏・堅田洋資氏が語る 機械学習とデータサイエンスの最適な学習法

AIやデータサイエンスなど最先端のコンピュータ・テクノロジーをビジネスに生かすための教育活動に取り組むキカガク・吉﨑亮介氏、DATAMIX・堅田洋資氏。

エンジニアやビジネスパーソンがこうしたスキルを身につけることの意義、そしてオンライン学習を中心に最適な学習法などについて、縦横に対談していいただいた。

※この記事は、2017年11月20日にCodeIQ MAGAZINEで掲載した記事をもとにしています。

AI・データサイエンスへのニーズを終わらせないためには人材育成が必須

――お二人は機械学習やデータサイエンスという“最先端”の技術をUdemyで教えています。そもそも今これらの技術を、一般のエンジニアやビジネスパーソンが学ぶことの意義はなんだと思いますか。

堅田:ビッグデータ解析や人工知能がビジネス革新の重要なテーマになり、企業内でもAIやデータサイエンスに力を入れる動きが出てきました。ただこの分野の人材はまだ少ない。人材育成のニーズは、私が前職でコンサル事業をやっていたころから、肌身で感じていたものです。そうした企業のニーズに応じるように、学習ニーズも高まってきています。データ分析の基礎のところには統計学があって、ビジネスパーソンの新しい一般教養という受け止め方もされていますしね。

_mg_5868

▲「【ゼロからおさらい】統計学の基礎」講師

株式会社データミックス 代表取締役 堅田洋資氏
2005年に一橋大学商学部を卒業後、複数の企業を経て、2013年サンフランシスコ大学のデータ分析学修士コースに留学。帰国後監査法人トーマツにてデータ分析コンサルタントとして財務シミュレーションモデル作成などを担当。その後、白ヤギコーポレーションで、統計モデリングや機械学習を用いたレコメンデーションアルゴリズムの開発などに従事。2017年2月にデータサイエンティスト育成を中心事業とする株式会社データミックスを立ち上げた。

吉﨑:現状は自分がぜひやりたいというよりは、データサイエンスに関する部署に配属されたので、やらなければならないという切迫感のほうが強いかもしれませんね。背景はどうであれ、これらの知識がこれからのビジネスパーソンに必須の知識にはなるのは間違いないので、ブームが起こっている今こそ勉強を始めるよいチャンスだと思います。

ただ、AIや機械学習はそれ自体を学ぶことが目的なのではなく、あくまでも業務改善や新しいビジネス創造のための手段に過ぎないわけです。今はこの目的と手段の混同が起きている。このズレをなくすためにも、AIや機械学習の基礎がわかって、外部のコンサルタントともきちんと話ができる人が育つことは大切です。

 _mg_5791

▲「【キカガク流】人工知能・機械学習 脱ブラックボックス講座初級編」講師

株式会社キカガク 代表取締役社長 吉﨑亮介氏
京都大学大学院情報学研究科修了。卒業後に画像処理(AR)、ロボット工学、機械学習による製造業のプロセス改善に従事。その後、機械学習を活かしたビジネスでの起業を考え、2017年1月に、機械学習の教育事業を中心にコンサルティングやシステム開発も手掛ける株式会社キカガクを創業。機械学習・人工知能・ディープラーニングの初心者向け入門セミナーや、機械学習のオンライン家庭教師などの教育事業を推進しながら、機械学習を現場に導入するためのあらゆるプロセスに関わっている。

堅田:人材育成をおろそかにしていると、結局、社内のデータもうまく活用できないということになりかねませんからね。

機械学習を学ぶのに2年もいらない。もっと効果的な学習法がきっとある

 ――ちなみにお二人はどうやって機械学習やデータサイエンスを学ばれたのですか。

吉﨑:学院で機械学習を使った製造業のコスト削減などをテーマに研究していました。データはある製薬会社のものを使わせてもらいましたが、その分析手法は大学院の2年間かけて、ひたすらガリ勉で習得しました。

でも今なら、これって丸2年もかけるものかなって思うんです。メソッドさえしっかりしていれば、もっと効率的な学習方法があるのではないかと。2年という時間は、大学生ならともかく、社会人にはそんな時間はないし、現実的に無理ですしね。

 堅田:私の場合は、大学の学部ゼミが統計学だったんですが、当時はビッグデータなんて言葉もないし、データサイエンスも一般的ではありませんでした。社会人になってからは、データサイエンスは特に意識することなく、コンサルタントや経理、マーケティングなどの仕事をしていました。

ところが2010年代になり、ヘルスケア分野のスタートアップで心拍センサーのノイズ測定・除去というプロジェクトに関わるようになってからは、あらためてデータサイエンスは面白いと思うようになったんです。

そこで会社を辞めて、サンフランシスコに1年間留学しました。10年間のブランクはありましたが、R言語を使った分析には馴染みがあったし、最近の動向をキャッチアップすることもできました。

_mg_5755

吉﨑:サンフランシスコ大学の授業ではどんな教え方だったんですか。

堅田:数学の深いレベルまで掘り下げる教え方もあるし、表面だけさらっと教えて後は概念的に理解するだけでいいという教え方もあります。

 サンフランシスコ大学のそのコースは、ちょうどその中間。数学を知らない人にまでわかるとは言えませんが、高校程度の微分と線形代数が理解できれば、データサイエンスのおおよそのところがわかる。社会人経験のある学生が1年間で履修するにはちょうどよい内容だったんです。

しかも向こうの先生はジョークを言ったり、役柄を演じてみたり、歌って踊ったりと授業が一種のエンタテインメントなんです。日本の大学の堅苦しい授業が当たり前だと思っていた私には目からウロコでした。こういう授業が日本にもあったらいいなと。

吉﨑:それで今、Udemyでも歌って踊っているんですね()

堅田:そこまではやっていませんが()、面白く分かりやすく教えるということは心がけています。

吉﨑エンタテインメント性は、特にUdemyのようなオンライン学習では大切な要素だと思います。

 %e7%b5%b1%e8%a8%88%e6%8e%88%e6%a5%ad

▲堅田氏の講座より掲載──コイントスによる確率分布の事例を実際にコインを投げてわかりやすく指導している。

「学び始めの怖さ」を解消。オンライン学習は入口として最適

――さまざまな学習方法がある中で、Udemyのようなインターネットを活用したオンライン学習にはどんなメリットがあるとお考えですか。

堅田スマホからもアクセスでき、一コマ単位が短いオンデマンドの授業ですから、通勤途中の電車の中とか、休み時間とか、ちょっとしたすきま時間を最大限活用して学習できます。それにUdemyは飲み代で十分お釣りが来るぐらい、授業料もリーズナブルですしね。

吉﨑:私の会社でも教室に通うオフライン型のセミナーを実施していますが、オフライン講座に来るのは怖いという人が一定いるのはたしかです。「数学を専攻したことのない自分なんかがセミナーを受講して、果たして付いていけるだろうか、浮いちゃうんじゃないか」という未知ゆえの恐怖ですね。

ところが、オンライン講座ならプレビューをざっと閲覧しただけで、自分にフィットするかどうかがわかる。その上で選択できるという利点があります。

堅田:もちろん、オンライン学習のみでどこまで深い領域まで行けるかは、学習者の好奇心と忍耐力に依存するとは思います。教室に通う場合は、何日の何時に必ず出席しなければならないという外部からの強制力が働きますが、オンラインだとそれは学習者の自覚に委ねられている。

教室では受講生のモチベーションが下がったときに、講師がそれをコントロールできますが、オンラインではそれも難しい。こういうデメリットはありますが、とっつきやすさ、手軽にスタートできる良さはそれに優る魅力だと思います。

 _mg_5890

「微分」はこう活用できる。誰もが数学を勉強したくなる講座群

――お二人の講座は、どんな人を対象にしていて、到達点はどこに設定されていますか。

吉﨑:私の『【キカガク流】人工知能・機械学習 脱ブラックボックス講座初級編』は、文字通り機械学習というブラックボックスを前にして戸惑っている初学者向けのもの。初学者は全体が見えないものだから、よい参考書や学び方の順序というものがわからない。つまり機械学習についての学び方を学ぶのがこの講座の狙いです。

download

初歩中の初歩という位置付けですが、それでも機械学習の基礎には微分という数学の考え方があることは伝えます。微分って高校時代になんとなく勉強した記憶はあるけど、何に使えるかはわからなかった。「今機械学習をやる上では必須の数学なんですよ」というと、皆さん驚くはずです。

理論だけだと飽きるので、微分を使って家賃予測をしてみるというケーススタディもあります。また、機械学習の実装ではPythonというプログラミング言語も必須になるので、その基本も一緒に教えます。機械学習は数学とプログラミングが融合して初めて成り立つという気づきがここでは大切です。

_mg_5825

堅田:私の講座は『【ゼロからおさらい】統計学の基礎』というのですが、高校数学をある程度理解している人を対象に、ビジネスの場面で活用できる統計学の基礎を身につけることを目標としています。

 download

最初の入口ですから、決してハードルは高くない。数学的な意味での厳密性は置いておくとして、多少デフォルメしてでもいいから全体としてこんな感じですよと伝えることに力を入れています。厳密性にこだわってしまうと、初学者はなかなか先に進めないですから。

それでも、平均、分散、仮説検定という統計学の基本概念は教えます。統計学での最大の肝は仮説検定だと思うのですが、これを初学者にどう理解してもらうかが、自分で言うのもなんですが、講師の腕の見せどころ。

最初から数式を出すとみんな死んでしまう()ので、Excelの関数を使って計算できるようにしています。そこで概念を理解した人は、いずれは数学を勉強し直してくれるはずですから。

_mg_5776

吉﨑:機械学習でも数学は必須ですが、それを最初からやるとみんな引いてしまう。とはいえ、数学の裏付けがないと。

会社で「これからの業務改善では、データを機械学習で解析していくことが重要です」とかプレゼンしても、なぜ重要なのかを数学的に説明できないから、結果的に自信のないプレゼンになってしまう。わかったような気ではなく、実際にわかるようになるためには、数学は必須ですね。

堅田:統計学でも、それを業務に活用しましょうということは誰でもすぐにふわっと言えるようになりますが、実際に適用するためにはやはり数学は必要になります。その意味では、「数学は絶対に必要で、やらざるを得ないのだ」という気持ちにまで学習者のモチベーションを高めることが、私たちの講座の役割かもしれませんね。

数式を手書きで書くことの意味。話にメリハリをつける工夫

――画面の向こうにいる学習者を飽きさせず、集中して授業に参加してもらうためにどんな工夫をされていますか。

吉﨑:私は講座に登場する数式を全部、手書きで書くようにしています。手書きにこだわるというよりは、数式の中にストーリーがあるのでそれを順番に示すためには、手書きが有用なんです。できれば一緒に学習者もノートに手書きをしてほしい。そうすると決して眠くならないはずです。

ai%e3%82%ad%e3%82%ab%e3%82%ac%e3%82%af

▲吉﨑氏の講座より掲載──専門書では挫折しがちな数式の意味も手書きで順序立てて説明されることで初心者でも理解できる。

堅田:これってまさに「キカガク流」ですよね。オンライン学習ならではの試みとも言える。紙の参考書やPowerPoint形式では、数式がつながっていく様子は表現しにくいですものね。

吉﨑:昔、高校の数学の先生が板書して、それを私たちは必死でノートに写していたじゃないですか。そういう当たり前のことを再現しているだけです。ただ、高校・大学のときいちばん勉強したという人はたいてい手書きのノートをたくさん作った人。その時の学習の醍醐味をぜひ再現してもらえたらなと思うんです。

 _mg_5902

堅田:私の場合は、「私の話は全部大事です」というより、ここはマスト、ここは参考までというように、メリハリをつけるように話します。学習者がリアルに面前にいるわけではないので、声の大きさやトーンも気をつけています。学習者のほうに目を向けないで、ごちょごちょ小さな声で話していては伝わらない。

吉﨑:私も、同じことを言うにしてもより伝わりやすい語彙を選ぶように心がけています。テレビのアナウンサーの言葉選びなどを参考にすることもありますね。

Udemyの120%活用法—自分の関心を見つければ自分で歩けるようになる

――Udemyの講座で初級編を終了した人たちは、次にはどんな勉強をしたらいいと思いますか。

堅田Udemyで基礎固めができたら、興味・関心を同じくする人たちとのミートアップや勉強会に参加してみるのがいいと思います。

独学で進める場合も、専門書を読んで、自分で数式を書いてみて、わからないことがあったらまた調べるという繰り返しが欠かせません。弊社でも、 「データサイエンティスト育成コース」や「SQL/データ可視化コース」などのスクールを開講していますので、それに参加していただくともっと嬉しいかな()

吉﨑Udemyをもっと深く活用するというのも手ですよ。Udemyには英語版でかつ多くがアドバンスドレベルとはいうものの、ものすごくよい講座がたくさん用意されています。私もここの講師になる前は、Udemyを使っていろいろ勉強しましたから。

堅田:吉﨑さんと大学は違いますが、私も同じくUdemyで学んだ「ユーデミア」の一人。さまざまなテーマが用意されていて、その難易度も幅広い。あのバラエティの広がりは他にはない。何かわからないことがあったら、図書館や書店で参考書を探す、それと同じようなワクワク感がUdemyにはあります。

 _mg_5746

吉﨑技術の進化に応じて、どんどん新しい講座ができていますから、自分の知識を絶えずアップデートするためには最適の環境じゃないかと思います。

それだけお世話になったプラットフォームに今度は講師として参画できるのは光栄だし、何がしかの恩返しできるのは嬉しいですね。

堅田:データサイエンスに限らず、一つのテーマを学習するということは、一通り基礎を固めて全体を俯瞰した上で、その中で自分は何に関心があるのかを自発的に発見するプロセスだと思うんです。

そこで確かなとっかかりができれば、それをフックにして人は自分の足で歩き始めることができる。どこまでも自分の好奇心の宇宙を広げていくことができるようになります。

吉﨑:企業でデータサイエンス事業を始めましょうとなると、まずはアウトプットが報告書になりがちなんですが、ここで終わりではないですよね。必ずその先にはシステムを構築して運用するというフェイズがあります。

エンジニアの皆さんには、ぜひそこまで進んでほしい。理論ベースで考えたことも、実装するといろいろと粗が出てきてうまくいかないもの。それを改善していけるのは、エンジニアにしかできないことなのですから。

堅田Udemyで基礎を学んだエンジニアが、そのものづくりの本能を発揮して挑めば、日本のAIやデータサイエンスはもっと面白いことになりそう。私もぜひそれを期待しています。

 

Udemyとは

udemy-top
Udemyは、「Improving Lives Through Learning(学びで人生をもっと豊かに)」を事業コンセプトとして掲げる米国法人Udemy,Inc.が運営する世界3,000万人以上が利用するオンライン学習プラットフォームです。
Udemyは、C to C(Consumer to Consumer)プラットフォームで世界中の「教えたい人(講師)」と「学びたい人(受講生)」をオンラインでつなげます。
最新のIT技術からビジネス、趣味まで幅広い領域の学びをオンラインで学ぶことができ、世界で約10万コース、42,000名の講師が登録しています。隙間時間にPC・スマートフォンなど好きなデバイスからのアクセスが可能で、学習期限はないため、必要な時に必要なだけ学習を進められます。

また、Udemyには安心してご受講いただける3つの特徴があります。

1.欲しい講座だけを購入し、視聴期限なく受講できる

2.30日間の返金保証がある

3.質問掲示板から講師へ直接質問することができる

これらの特徴によって得られる安心感から、日本でも多くの方がUdemyでのスキルアップを始めています。

吉﨑亮介さんと堅田洋資さんが語ってくれた「オンライン学習の活用法」を参考に、まずはUdemyの人気講座をこの機会に受けてみてはいかがでしょうか。

◆オンライン学習の活用法とメリット

udemy

 

◆キカガク・吉﨑亮介さん、DATAMIX・堅田洋資さんが講義する講座

download 【キカガク流】人工知能・機械学習 脱ブラックボックス講座初級編

1000人以上が受講しているキカガク・吉﨑亮介さんの『脱ブラックボックスセミナー』!機械学習の参考書を「閉じてしまった人」への再入門に最適な講座です。微分・線形代数といった数学の基礎からPythonでの実装まで短時間で習得しましょう。詳細はこちらから!

 

1098334_8ca6_2 【ゼロからおさらい】統計学の基礎

ビジネスの場面で活用できる、統計学の基礎を学びましょう!

ビジネスの場でも活用できる統計学の入門講座です。数学が苦手でも大丈夫。統計学の基礎をゼロから講義します。エクセルを使った練習問題で、明日から使える分析手法を身に付けましょう。

 

◆まだまだある!Udemyの人気データサイエンス講座

1049854_caa7_2 4日で体験しよう!】TensorFlow 1.x と Python 3 で学ぶディープラーニング体験講座

TensorFlowを実行する環境を構築(TensorFlow 1.4.0対応)できます。LinuxでなくてもWindowsまたはmacOSが動作するPCがあればOK4日間でディープラーニングを体験してみましょう。

625078_b756_3 【世界で5万人が受講】実践 Python データサイエンス

データ解析の基本、可視化、統計、機械学習などデータサイエンスに関するあらゆる実践的なスキルがPythonで身に付く講座。Pythonと科学計算のためのライブラリの使い方が完璧に理解できる内容になっています。

 

◆キカガク・吉﨑亮介さん、DATAMIX・堅田洋資さんおすすめの英語講座

吉﨑亮介さんおすすめ!

980798_6081 Spark and Python for Big Data with PySpark

このコースではPythonを使ったSpark StreamingMachine LearningSpark 2.0 DataFramesSpark with PythonSpark SQLGradient Boosted Treesなど、最新のビッグデータテクノロジーの活用法などが学べます。


堅田洋資さんおすすめ!

713104_d4cb Data Science: Deep Learning in Python

PythonNumpyでニューラルネットワークを構築する講座です。GoogleTensorFlowライブラリを使用してニューラルネットワークを実装します。詳細はこちらから!