データ分析を初めて学習するときにPythonを使う場合は、Pythonの基礎知識と、いくつかのライブラリについて学習しておくと効率的です。
Pythonによるデータ分析に関しては「Python3エンジニア認定データ分析試験」という資格があり、この資格取得を通してデータ分析の学習を進めるのもおすすめです。
この記事では、Python3エンジニア認定データ分析試験の概要と、Pythonを使ったデータ分析の学習方法などについて解説します。
公開日:2022年1月27日
専門領域:AI、データサイエンス、デジタルマーケティング、プログラミング
ウマたん (上野佑馬)
「データサイエンスやAIの力でつまらない非効率を減らしおもしろい非効率を増やす」がビジョンのWW inc.の代表取締役社長。日系大手→外資系→AIスタートアップでデータ分析やデジタルマーケティングを経験。多くの人にもっとデータサイエンスを身近に感じてもらうべく月に10万人が訪れる「スタビジ」というメデイアでデータサイエンスの面白さを発信中。著書に「データサイエンス大全」「漫画でわかるデジタルマーケティング×データ分析」など。
…続きを読むINDEX
「Python3 エンジニア認定データ分析試験」とは?
「Python3エンジニア認定データ分析試験」は、一般社団法人Pythonエンジニア育成推進協会が運営している資格試験で、「Pythonエンジニア認定試験」の試験区分の1つです。
Pythonエンジニア認定試験には以下の2つの試験区分があります。
- Python3エンジニア認定基礎試験
- Python3エンジニア認定データ分析試験
Python3エンジニア認定基礎試験は、Pythonの基本的な文法やデータ構造、クラス、標準ライブラリなどについて問われます。
Python3エンジニア認定データ分析試験は、Pythonの基礎、数学の基礎に加えて、ライブラリによる分析実践などについての設問があり、Pythonを使ったデータ分析について問われます。
データ分析試験は2020年から始まった試験で、受験資格は特にありませんが、基礎試験よりも難易度は高いため、基礎試験を合格してから受験するのがおすすめです。
それぞれの試験については以下の通りです(2022年1月時点)。
Python3エンジニア認定 基礎試験 | Python3エンジニア認定 データ分析試験 | |
問題数 | 40問 | 40問 |
出題形式 | 選択式 | 選択式 |
試験方式 | CBT方式 | CBT方式 |
試験時間 | 60分 | 60分 |
合格基準 | 正答率70% | 正答率70% |
受験料 (税込) | 一般価格:11,000円 学生価格:5,500円 | 一般価格:11,000円 学生価格:5,500円 |
試験概要 | 文法基礎を問う試験 | Pythonを使ったデータ分析の基礎や方法を問う試験 |
認定テキスト | Pythonチュートリアル第4版(オライリー・ジャパン) | Pythonによるあたらしいデータ分析の教科書(翔泳社) |
Python3エンジニア認定試験について詳しく知りたい方は「Pythonの資格「Python3エンジニア認定試験」はどんな資格?海外の資格も紹介!」を合わせてご覧ください。
\文字より動画で学びたいあなたへ/
Udemyで講座を探す >「Python3 エンジニア認定データ分析試験」のポイント
Python3エンジニア認定データ分析試験は、「Pythonによるあたらしいデータ分析の教科書」(翔泳社)が認定テキストとなっています。出題範囲はこのテキストの章節に対応しており、範囲と出題割合も公表されています。
【参考URL:https://www.pythonic-exam.com/exam/analyist 】
テキストで解説されているライブラリはNumPy、pandas、Matplotlib、scikit-learnです。これらは、Pythonでデータ分析をする場合に、非常によく使うライブラリです。
そのため、Pythonを使って仕事をしたいと考えている方にとって、これらのライブラリの学習は非常に有効です。
これらのライブラリの詳しい内容については後述します。
試験の出題範囲と出題割合
2022年1月時点の出題範囲と割合は以下の通りです。
章 | 節 | 章節題 | 問題数 |
1 | データエンジニアの役割 | 2 | |
2 | Pythonと環境 | ||
1 | 実行環境構築 | 1 | |
2 | Pythonの基礎 | 3 | |
3 | Jupyter Notebook | 1 | |
3 | 数学の基礎 | ||
1 | 数式を読むための基礎知識 | 1 | |
2 | 線形代数 | 2 | |
3 | 基礎解析 | 1 | |
4 | 確率と統計 | 2 | |
4 | ライブラリによる分析実践 | ||
1 | NumPy | 6 | |
2 | Pandas | 7 | |
3 | Matplotlib | 6 | |
4 | Scikit-learn | 8 | |
5 | 応用:データ収集と加工 | 0 | |
計40問 |
Python3エンジニア認定データ分析試験で出題される問の半数以上は「ライブラリによる分析実践」から出題されます(40問中27問)。
合格ラインは正答率70%(40問中28問以上)ですから、試験の合格を目指すなら、ライブラリの使い方をしっかりと学習しておく必要があります。
Pythonを使用したデータ分析の学習ステップ
ここからはPythonでデータ分析を学習するための手順を
- 環境を構築する
- Pythonの基礎を学習する
- ライブラリについて学習する
- データ分析を行う
の4段階に分けて解説します。
環境を構築する
まず、Pythonを使うための環境を構築しましょう。
環境構築にはさまざまなディストリビューションがありますが、Anacondaは初学者でも理解しやすく、データ分析や機械学習に必要なライブラリがまとまっているため、おすすめです。
Anacondaのインストールや仮想環境の構築について知りたい方は、「AnacondaでPythonの環境構築!概要~インストール方法まで解説」を併せてご覧ください。
環境構築をせずに学習をしたい場合は、Google Colaboratoryの使用がおすすめです。Google Colaboratoryは無料で利用できる上、ブラウザ上で作業を進められるため、今すぐに作業を始めたい場合に非常に便利です。
Pythonの基礎を学習する
Python3エンジニア認定データ分析試験で出題の中心となるライブラリの学習をする前に、Pythonの基本的な文法などを学習しましょう。
試験でPythonの基礎について問われるのはもちろん、ライブラリの使用にもPythonの基礎知識は必要です。
Pythonは非常にメジャーなプログラミング言語で、インタプリタ言語(ソースコードの実行時に、1行ずつ機械語に解釈しながら実行する方式)の中では、RやRubyと並んで非常に人気の言語です。
Pythonに関する本は数え切れないほど出版されており、独学しやすい言語だといえます。インターネットだけで学習することも十分可能です。
その場合は、Udemyなどの動画学習サイトを利用することがおすすめです。
データ分析ライブラリの使用方法を学習する
Python3エンジニア認定データ分析試験で出題されるライブラリはNumPy、pandas、Matplotlib、scikit-learnで、設問の半分以上がこれらのライブラリに関する問題です。
Pythonの基礎を学習した後は、これらのライブラリの使用方法をしっかり身につけましょう。
各ライブラリの用途は以下の通りです。
NumPy | 数値計算を効率的に行うためのライブラリ。多次元配列や、行列を操作するための関数が用意されている。 |
Pandas | データ解析を支援するためのライブラリ。CSVやExcel、SQLデータベースなどと相互に読み書きできる関数や、データを高速で操作するためのデータフレームが用意されている。 |
Matplotlib | NumPyのためのグラフ描写ライブラリ。 |
scikit-learn | 機械学習のための関数がサポートされたライブラリ。サポートベクターマシン、ランダムフォレスト、k-近傍法などさまざまなアルゴリズムが用意されている。 |
NumPy、Pandas、Matplotlibについては、それぞれ以下で詳しく解説していますので、併せてご覧ください。
- 「Pythonの拡張モジュール「NumPy」とは?インストール方法や基本的な使い方を紹介!」
- 「【Pandas入門】Pythonのデータ分析ライブラリ「Pandas」を解説!」
- 「Pythonでグラフ描画する方法を解説。Matplotlibを使えば簡単!」
実際にデータ分析を行う
ライブラリの学習がある程度進んだら、実際にデータ分析をしてみましょう。プログラミングは実際に何度も書いて、動かし、使用感を掴まなければ身に付きません。ライブラリの学習とほぼ同時に、データ分析の実践を進めるのもおすすめです。
学習に使用した動画や参考書のコードを理解し、実際に動かした後は、実際のデータを使って、1から自分でデータ分析を行いましょう。初めてデータ分析をする場合は、参考書や学習サイトに掲載されている、ある程度整ったデータ(分析しやすいデータ)を利用するのがおすすめです。
「Python3 エンジニア認定データ分析試験」の対策におすすめのサイト・教材
ここからは、試験対策に役立つサイトや教材について紹介します。
Pythonの基礎文法学習におすすめ「progate」
progateは初心者向けのプログラミング学習サイトです。
「基礎」(16レッスン)の学習は無料で利用でき、「応用」「実践」(79レッスン)は月額1,078円で利用できます(2021年1月時点)。
ライブラリの使用方法を学習する際におすすめ「Udemy」
Udemyは18万以上のコンテンツがある人気オンライン学習サービスです。
プログラミングに関するコンテンツも豊富で、ライブラリの学習についておすすめの講座も数多くラインナップしています。
データ分析の実践におすすめ「Python実践データ分析100本ノック」
データ分析の実践を積みたい方におすすめなのが「Python実践データ分析100本ノック」です。ビジネスの現場で役立つ例題がまとめられており、実践的なデータ分析のノウハウを身に付けることができます。
試験直前の問題対策におすすめ「DIVE INTO EXAM」
試験前には模擬試験を受けて、対策をしましょう。DIVE INTO EXAMはIT資格の対策トレーニングサービスです。
無料会員登録で利用でき、無料会員でも模擬試験の受験・評価を受けられます。月額980円 (2021年1月時点) の有料会員になると、各試験の解説や学習教材の使用が可能になります。
「Python3エンジニア認定データ分析試験」はPythonによるデータ分析について問われますので、Pythonによるデータ分析を身に付けたい方は、この試験の対策を通じて学習すると効率的です。 ぜひ今回ご紹介したサイトや教材を利用して、試験に向けた勉強を進めてみてください。
【初学者向け】データ分析コンペで楽しみながら学べるPython×データ分析講座
データサイエンスの基礎から実践までを一気通貫で理解しよう!アニメーションを使った概要編とハンズオン形式で進む実践編でしっかり理解できる!データサイエンスやPython初心者でも大丈夫。
\無料でプレビューをチェック!/
講座を見てみる評価:★★★★★
機械学習の実装に向けて、基礎からデータを使った実装に向けて順次説明していただきました。注意点なども含めて説明いただいたので理解しやすかったです。データを使ったPythonのモデル構築は難しかったですが、進め方考え方がわかりました。
評価:★★★★★
全体の説明が非常にわかりやすく、個々の内容について学んでいく興味がわいてきます。
最新情報・キャンペーン情報発信中