重回帰分析とは?エクセルでもできる重回帰分析をわかりやすく解説!

IT技術の発展により、企業は多くのデータを収集できるようになりました。ビッグデータと呼ばれる膨大なデータの集合体は、あらゆる企業でその有用性が模索されています。

このように集まった、一見すると関連性のないデータから、有益な情報を得るために使用されるものが「回帰分析」です。

今回は、回帰分析の手法の中から「重回帰分析」をご紹介します。計算自体は、エクセルなどの分析ツールで簡単にできますが、仕組みを知っておくことで応用しやすくなるはずです。

公開日:2022年4月8日

重回帰分析をやる前に、回帰分析について復習!

重回帰分析は、回帰分析のひとつであり「単回帰分析」の発展形です。重回帰分析へと話題を進める前に、まずは単回帰分析についておさらいしてみましょう。

単回帰分析では、目的変数yの変動をp個の説明変数x1、x2、x3……xpの変動で予測・分析します。単回帰分析で用いられる説明変数は、xひとつです。y=ax+bの回帰式にあてはめ、目的変数yを予測します。

回帰分析

単回帰分析においては、資料から2変数のデータを抽出した散布図から、回帰式を決定するのが一般的です。回帰式の目的変数と実測値との誤差が最少になるような係数a、bを算出していきます。その際、最小二乗法の公式を用いると、算出が容易です。

この場合、回帰式をグラフにすると、xが増加した場合のyの値が予測できます。ただし、実際のデータ分析の現場では多くの場合、ひとつの説明変数だけでは十分ではありません。そのため、単回帰分析が利用できるシチュエーションはそれほど多くないのが事実です。

詳しくは 「 回帰分析(単回帰分析)をわかりやすく徹底解説! 」 の記事をご確認ください。

 

\文字より動画で学びたいあなたへ/

Udemyで講座を探す >

重回帰分析とはどんなもの?単回帰分析との違いは??

単回帰分析は上述したとおり、説明変数がひとつの回帰分析です。一方、重回帰分析は説明変数が2つ以上の回帰分析と定義できます。例えば、鉱石の値段を予測する場合に、重量だけから予測する場合が単回帰分析、重量・元素の種類・元素の割合などから予測する場合が重回帰分析といえるでしょう。

「変数同士の相関関係から変動を予測する」という基本的な部分は単回帰分析と同じですが、単回帰分析に比べて柔軟に適応できるため、実際の分析では広く活用されています。

しかし、その便利さのかわりに、重回帰分析では考えなければならないことも増えます。計算も単回帰分析よりかなり複雑です。説明変数の数が増すほど複雑になるという課題があります。

ただし、実際の活用現場では方法が確立されており、深い理解が求められることはありません。エクセルやその他の分析ツールを用いれば計算も容易なので、仕組みを理解しておくと良いでしょう。

重回帰分析と多変量解析の関係

重回帰分析と併せて聞く機会が多い用語に「多変量解析」が挙げられます。多変量解析は、複数の変数に関するデータをもとに、変数間の相互関連を分析する統計的技法の総称です。

多変量解析を活用することで、アンケート結果から商品の強みや弱みを分析したり、身体データから病気になる確率を予測したりすることが可能です。多変量解析は、単一の分析手法ではなく、さまざまな分析手法を組み合わせて分析・予測を行ないます。

重回帰分析は、多変量解析の分析手法の一つであり、データ予測の際に利用される手法の一つです。

多変量解析については「多変量解析とは?入門者にも理解しやすい手順で具体的な手法をわかりやすく解説」にて詳しく解説していますので、こちらもご覧ください。

 

エクセルでもできる!重回帰分析の手法を紹介!

ここまで、重回帰分析の基本的な概要について説明しました。次に、重回帰分析の具体的なやり方についてお話しましょう。簡単な流れと、実際の分析業務で使える、一般的なエクセルを使った方法について解説します。

重回帰分析の流れ〜例を用いて紹介〜

実際に重回帰分析を行う際は、以下のような3つのステップをたどります。

①分析したいデータに関し、相関関係があると考えられる目的変数と説明変数を抽出します。重回帰分析ではひとつの目的変数と複数の説明変数の関係を分析できます。以下は目的変数と説明変数の例です。

1
目的変数:商品売上数
説明変数:宣伝費、生産数、リリースからの経過日数

2
目的変数:体重
説明変数:身長、腹囲、胸囲

②y=a+b1x1+b2x2+b3x3……といった回帰式を仮定します。各係数は最小二乗法により算出されます。

③重回帰分析の回帰式は3次元、あるいはさらに多くの次元の「超平面」になるため、単回帰分析のように図形での視覚的理解が困難です。そのため、あくまで参集した値をもとに分析を行うのが一般的です。

実際のデータと回帰式の結果から、回帰式の妥当性を示す「決定係数」が求められます。

また、「残差(観測値から推定値を引いたものとして算出)」や「てこ比(サンプルごとに説明変数のデータを変えずに目的変数yの値を1だけ変えたときの予測値の変化量)」で妥当性を調べることもできます。

重回帰分析をエクセルでやってみよう!

表計算ソフトのエクセルを用いると、重回帰分析を簡単に実施できます。上述した例2のケースをもとに、具体的な手順をご説明しましょう。

①表に各データを入力

標本となるデータを表に入力します。

標本となるデータを表にする

②「データ分析」を選択

「データ」タブから「データ分析」を選択します(「データ分析」が見つからない場合は、アドオンで追加する必要があります)。

データ分析を選択

③「回帰分析」を選択

回帰分析を選択

表示させるウィンドウから「回帰分析」を選択します。

④変数を指定

変数xに体重を、変数yに身長・腹囲・胸囲を指定します。それぞれ範囲選択で指定可能です。指定後、「OK」をクリックします。

変数を指定

⑤算出結果を確認

エクセルの別シートに重回帰分析の結果が出力されます。

算出結果

とりわけ注目すべきなのは以下の数値です。

重相関R:「重相関係数」とも呼ばれます。1に近ければ近いほど、近似され信頼できるモデルであることを意味します。

重決定R2:重相関を2乗した値です。「決定係数」とも呼ばれます。1に近いほど説明変数で説明できる割合が多いことも意味します。

補正R2:データの標本数が少ない場合は、自由度の影響により実際の大きさよりも大きいR2が算出されることがあります。補正R2は自由度を考慮し、補正した実用的な決定係数です。

係数:相関式における係数です。係数が大きいほど、各変数の影響力が大きいことを示します。

エクセルを活用すれば、複雑な計算をすることなく、重回帰分析を行うことができます。上記の注目すべき値を参考に、実務に活用してみてください。

 

重回帰分析のメリット・デメリットとは?

続いて、重回帰分析の具体的なメリットとデメリットについてご紹介します。

メリット

  • 単回帰分析と同じように数字で確認できる統計的な予測、根拠ある推論が可能になる
  • 単回帰分析と同じように、まだデータが得られていない時点についても予測が可能
  • 重回帰分析では複数の変数を取り扱うため、単回帰分析よりも実用的な分析が可能
  • 各変数の係数からは、変数の効果量が判断できる

デメリット

  • 実際に把握している変数以外にも「剰余変数」がデータに影響を与えている可能性があり、必要に応じて「統制」が必要
  • 概念や計算処理が複雑なため、理解が困難(処理についてはエクセルなどのツールを用いることで容易になる)
  • 変数同士に相関関係がある場合、「多重共線性(マルチコ)」に陥る危険がある

 

重回帰分析を活かそう!重回帰分析の活用法

重回帰分析は非常に汎用性が高い処理であり、ビジネス・マーケティングのさまざまな分野で活用されています。最後に、重回帰分析が活用されているシーンを具体的にご紹介しましょう。

寿命予測

アメリカでは重回帰分析を利用して、特定地域の寿命予測が行われた例があります。この場合の目的変数は寿命であり、説明変数には人口・収入・殺人率・面積などが選ばれました。

マーケティング

重回帰分析は店鋪の売上を予測するためにも用いられます。予測に用いる要素としては、接客、品揃え、面積などが選ばれます。接客や品揃えなど単純な数値化ができない要素に関しては、調査によるスコアリングを行うのも一般的です。

営業予測

重回帰分析を用いると数値的な根拠に基づいて営業予測を立てることができます。営業訪問回数、値引率など、営業スタイルに応じて戦略を数値化し、取引額を目的変数に設定すれば、戦略が変化した場合の結果を予測可能です。また、係数からは各戦略の効果が数値で確認できます。

人材活用

企業にとって、自社でハイパフォーマンスを発揮する人材を得ることは非常に重要です。重回帰分析を活用すれば、「自社でハイパフォーマンスを発揮する人物の特性」を予測することもできます。この例では、人材の性格や指向と企業における成果やパフォーマンスの結果を組み合わせることで、ハイパフォーマーの特性を予測しています。

 

重回帰分析の計算自体はエクセルを使用することで簡単にできますが、実際にビジネスシーンで応用するためには背景の理解が必要です。

回帰分析の中でも重回帰分析は、複数の変数で回帰式が構成されているため、より実用的な推測ができますので、覚えておいて損はありません。ぜひ重回帰分析を学習して、データ活用にお役立てください。

Udemyおすすめ講座

【はじめてのデータサイエンス実践】統計分析・機械学習のビジネス活用マスターコース【クイック学習コース】

【はじめてのデータサイエンス実践】統計分析・機械学習のビジネス活用マスターコース【クイック学習コース】

4.1(482 件の評価)

3,640 人の受験生

作成者: 熊野 整(ChatGPT, Excel, マーケティング、データ分析、プレゼン、論理思考、Microsoft Office)

データサイエンスを使えば、データ分析や将来予測の精度を高めることが可能です。回帰分析、線形判別分析、決定木モデル、クラスタリングといった分析手法、さらにビジネス活用事例を幅広く紹介します。むずかしい理論はいっさいありません。初心者OKです!

\無料でプレビューをチェック!/

講座を見てみる

評価:★★★★★
初学者に対して大変シンプルでわかりやすい内容で、「この先も学んでみたい!」と思うような講座でした。熊野先生の講座はとても理解しやすく組み立てられているので感動します。素晴らしいレッスンをご提供くださりありがとうございました。

評価:★★★★★
短時間でデータサイエンスの概略やベーシックのキーワードを学べました。