重回帰分析の結果を見る際の重要な指標とは?4つのポイントを解説!

はじめに

重回帰分析の結果を読み解くためには、結果指標の中で一体どの指標に注目すべきなのでしょうか?

この記事では、p値や調整済みR2などの回帰分析における重要な指標を紹介し、解釈のポイントを説明していきたいと思います。

重回帰分析の結果を正しく読み解くために必要な知識を身につけましょう!

「p値」の解釈

p値は、仮説検定結果の信頼性を示す指標であり、重回帰分析の結果を判断するために重要です。

例えば、ある企業の売上予測モデルを作成した場合、説明変数の一つである広告費が売上に影響を与えるか否かを調べることが重要です。

このとき、p値が低い(例えば0.05未満)ならば、広告費は売上に有意な影響を与えていると結論付けることができます。

逆に、p値が高い(例えば0.1以上)場合は、広告費と売上の関連性は弱いと結論付けることができます。

p値は統計的な意味を判断する上で重要な役割を果たします。

 

▼「p値」については以下の記事でも詳しく解説していますので是非ご参照ください!

p値とは?3つのポイントで分かりやすく解説!

 

「調整済みR2」の意味

調整済みR2は、重回帰分析結果の予測モデルの適合度を示す指標です。

例えば、ある住宅価格の予測モデルを作成する場合、R2値が0.80であれば、予測モデルが住宅価格の80%を説明できることを意味します。

しかし、説明変数を追加すると必ずしもR2値が上昇するわけではありません。

このとき、調整済みR2が役立ちます。

調整済みR2は、説明変数の個数も考慮してモデルの適合度を評価するため、

過剰な説明変数の追加によってモデルの適合度が上昇することを防ぎます。

より適切なモデル選択に役立つ重要な指標です。

「回帰係数」の解釈

回帰係数は、重回帰分析において、独立変数(説明変数)と従属変数(目的変数)の関係を数値で表現する指標です。

具体的には、各説明変数が従属変数にどの程度影響を与えるかを示します。

例えば、住宅価格を予測するモデルを考えてみましょう。

 

このモデルでは、部屋の広さ(説明変数1)、バスルームの数(説明変数2)、家の年齢(説明変数3)などが説明変数として考えられます。

それぞれの説明変数に対して、回帰係数が割り当てられます。

例えば、部屋の広さの回帰係数が正であれば、部屋が広いと住宅価格が高くなるという関係が示されます。

逆に、回帰係数が負であれば、部屋が広いと住宅価格が低くなるという関係が示されます。

同様に、バスルームの数や家の年齢の回帰係数も、それぞれの説明変数が住宅価格に与える影響を示します。

 

回帰係数の絶対値が大きいほど、対応する説明変数が従属変数に大きな影響を与えることを示し、

絶対値が小さい場合は影響が小さいことを示します。つまり、回帰係数は、説明変数と従属変数の関係を数値的に理解するのに役立つ指標です。

「信頼区間」の解釈

信頼区間は、重回帰分析結果の係数の推定精度を示す指標です。

例えば、ある市場調査データを元にして商品売上を予測するモデルを作成した場合、説明変数の一つである広告費の係数が1.5であるとしましょう。

その際、信頼区間が[0.8, 2.2]となっていると、実際の広告費の売上への影響は、1.5という点推定値を中心に0.8から2.2の範囲内にあることが分かります。

つまり、95%の確信度で広告費の売上への影響はこの範囲内にあると言えるのです。

信頼区間の広さが狭いほど、推定の精度が高くなります。

重要な指標であり、モデルの信頼性を評価する上で役立ちます。

まとめ

重回帰分析の結果を見る際に重要な指標として、p値、調整済みR2、回帰係数、信頼区間を挙げました。

p値は仮説検定結果の信頼性を示し、説明変数の有意性を判断する重要な指標です。

調整済みR2は予測モデルの適合度を示し、適切な説明変数の選択に役立ち、

回帰係数は、各説明変数(独立変数)が従属変数(目的変数)に対してどの程度影響を与えるかを示す指標です。

信頼区間は係数の推定精度を示し、推定値の範囲を示しています。

これらの指標を理解し、結果を適切に解釈することで、重回帰分析の結果をより正確に読み解くことができます。

結果を適切に評価し、意思決定や予測に役立てましょう!