機械学習やAIの回帰モデル(数値を予測するモデル)では、「どれだけ予測が外れているか」を評価することが重要です。
その代表的な指標のひとつが**平均二乗誤差(MSE:Mean Squared Error)**です。
本記事では、MSEの基本から計算方法、特徴、そして実務でよく使われるRMSEとの違いまでを、初心者にもわかりやすく解説します。
平均二乗誤差(MSE)とは?
平均二乗誤差(MSE)とは、予測値と実際の値(真値)の差(誤差)を二乗し、その平均を取ったものです。
ポイント
- 誤差が小さいほどMSEは小さくなる
- 完全に一致すればMSEは0になる
- 大きな誤差ほど強く評価される
MSEの計算方法
MSEは以下の手順で求めます。
- 予測値と真値の差(誤差)を計算
- 誤差を二乗する
- すべてのデータで平均を取る
数式イメージ
MSE =(誤差²の合計)÷ データ数
具体例で理解する
以下のようなデータがあるとします。
| データ | 真値 | 予測値 | 誤差 | 誤差² |
|---|---|---|---|---|
| A | 100 | 90 | -10 | 100 |
| B | 200 | 210 | 10 | 100 |
| C | 300 | 260 | -40 | 1600 |
この場合、
MSE =(100 + 100 + 1600)÷ 3 = 約600
ここで注目すべき点は、誤差が大きいデータ(C)が強く影響していることです。
MSEの特徴とメリット
1. 大きな誤差を強くペナルティ化できる
誤差を二乗することで、大きなズレをより重く評価できるのが最大の特徴です。
そのため、以下のようなケースに適しています:
- 大きな予測ミスを避けたい
- リスク管理が重要なシステム
2. 最適化(学習)に使いやすい
MSEは数式として扱いやすく、微分が可能なため、機械学習モデルの損失関数(学習の指標)として広く使われています。
MSEのデメリット
1. 外れ値の影響を受けやすい
大きな誤差を強調する性質があるため、一部の外れ値に引きずられやすいという欠点があります。
2. 単位が変わる(解釈しにくい)
誤差を二乗するため、
- 元データが「円」→ MSEは「円²」
- 元データが「℃」→ MSEは「℃²」
となり、直感的に理解しづらい場合があります。
RMSE(平均二乗平方根誤差)との違い
MSEの欠点である「単位の違い」を解消するために使われるのが**RMSE(Root Mean Squared Error)**です。
RMSEとは?
MSEの平方根(ルート)を取ったものです。
RMSE = √MSE
特徴
- 元のデータと同じ単位になる
- 直感的に理解しやすい
- 実務ではMSEよりRMSEが使われることも多い
MAEとの違い
もう一つの代表的な指標「平均絶対誤差(MAE)」との違いも押さえておきましょう。
| 指標 | 特徴 |
|---|---|
| MSE | 大きな誤差を強く評価 |
| MAE | 誤差を均等に評価 |
使い分けの目安
- MSE:大きなミスを絶対に避けたい場合
- MAE:全体の平均的なズレを知りたい場合
実務での活用シーン
MSEは以下のような分野で活用されます。
- 売上・需要予測
- 株価や為替の予測
- センサーデータの予測
- 機械学習モデルの学習(損失関数)
実務での使い方のポイント
実際の現場では、MSE単体ではなく複数の指標を組み合わせて評価します。
例
- MSE + MAE → 外れ値の影響を比較
- MSE + RMSE → 解釈しやすさを補完
まとめ
平均二乗誤差(MSE)は、予測モデルの精度を評価する基本的かつ重要な指標です。
ポイントを整理すると:
- 誤差を二乗して平均した指標
- 大きな誤差を強く評価できる
- 外れ値に敏感という特徴がある
- 単位が異なるため解釈には注意が必要
- RMSEやMAEと併用するのが実務では一般的
AI・機械学習の評価では、「どの誤差をどれだけ重視するか」が重要です。
MSEの特性を理解し、目的に応じて適切に使い分けることが、より精度の高いモデル構築につながります。
こちらもご覧ください:平均絶対誤差(MAE)とは?意味・計算方法・他指標との違いをやさしく解説

