投稿日 2015/11/26

ランニング開始4ヶ月のトラッキングデータを使った統計分析




今から4ヶ月ほど前の2015年7月に、ランニングを始めました。


ランニング開始前後の歩数変化


ランニングを始める前と後の一日の歩数を比較するため、歩数を日ごとでグラフにしたものが以下です。グラフの色は、緑がランニング開始前、青が開始後です。ランニングを始めたのは2015年7月11日です。



開始前後で、歩数の平均値および標準偏差は以下です。

  • 平均値:    7,785 → 16,042
  • 標準偏差:2,374 → 2,747


消費カロリーの変化


次に、同じ期間の一日の消費カロリーです。基礎代謝を除いた運動分の消費カロリーの推移グラフです。黄色がランニング開始前、赤色が後です。単位は kcal です。



消費カロリー (kcal) の平均値と標準偏差は次の通りです。

  • 平均値:  222 → 527
  • 標準偏差:71 → 103


測定用に使っているデバイス


歩数や消費カロリーの測定は Withings Pulse を使っています。

2014年5月11日から使用しています。1年半の歩数やカロリー、他には歩行距離や移動高低差のデータがあります。


Withings Pulse


体重と体脂肪の測定は、同じ Withings 商品の Withings Smart Body Analyzer を使っています。

Wi-Fi から測定データがクラウドに送信され、スマホ内アプリや Web 上のマイページからデータを確認することができます。


Withings Smart Body Analyzer



体重と体脂肪の推移


この体重計はもっと前から使っており、2012年4月30日からデータがあります。全データから体重の約3年半のトレンドグラフは、次のようになります。



同じ期間の体脂肪のトレンドグラフは以下です。





体重と体脂肪の相関


体重と体脂肪の間には相関が強く出ています。相関係数は 0.96764 でした。

体重と体脂肪について、横軸に体重、縦軸に体脂肪のプロットをとってみました。回帰直線・回帰式・決定係数 (R^2) を表示しています。



得られた回帰式は y = 0.5308x - 22.318 でした。説明変数と目的変数を以下とする単回帰分析です。

  • 説明変数 x:体重
  • 目的変数 y:体脂肪

この式は、2012年4月30日から2015年11月22日までの、3年半ほどの体重と体脂肪の関係を最も近似したモデル式です。


単回帰分析からのモデルを当てはめると


このモデル式を使って、ランニング開始前後で、体脂肪がどういう傾向になっているかを確認してみます。

先ほどの体重のトレンドグラフと、このモデル式の x に実際の体重測定値を代入して得られるトレンドグラフを重ねてみます。青は実際の体脂肪の測定値、赤がモデルから得られた体脂肪の値です。



決定係数 R^2 = 0.93632 で、ほぼ重なっているように見えます。

ただ、よくよく見てみるとランニング開始後で、測定値とモデルからの値に乖離がでています。ランニング開始前後の4ヶ月 (合計8ヶ月) だけの期間でグラフにすると、乖離がよくわかります。



乖離幅を視覚化するために 「体脂肪の測定値 - モデルにより算出される値」 の差分のグラフをつくってみました。プラスは 実測値 > モデル値、マイナスは 実測値 < モデル値 です。



ランニング開始後はほぼ一貫してマイナスで推移しています。モデル式から得られる体脂肪の値は、3年半の体重と体脂肪の関係から得られる最もその値を表したものです。

ランニング開始後のマイナスの乖離は何を意味しているかと言うと、ランニングを始めた結果、開始前の傾向よりも体脂肪が少なくできていることです。差分グラフから、この状況は特にランニング開始後2ヶ月で強く出ていたようです。


最後に


今回のエントリーでは、ランニングを開始して4ヶ月ほど経過したので、この間の自分の身体の変化を体重と体脂肪の関係から見てきました。シンプルですがトレンドデータがあることで、ある程度は見えてきました。

一方で、モデル式は体重が説明変数、体脂肪が目的変数でした。本当はやりたかったのは体重を目的変数にすることでした。

歩数やカロリーで同じようにやってみましたが、あまりよい当てはまりにはなりませんでした。

考えられる理由として、説明変数として摂取カロリーのデータがないことだと思います。体重の増減は、摂取カロリー > 消費カロリーであれば増えていくはずなので、この2つがあればそれなりの説明力はあると思います。

現時点では消費カロリーしかトラッキングデータがない片手落ちの状態です。体重を目的変数にするのであれば、少なくとも摂取カロリーと消費カロリーを使った重回帰分析が必要でしょう。

最新記事

Podcast

書いている人 (多田 翼)

Aqxis 代表 (会社 HP はこちら) 。Google でシニアマーケティングリサーチマネージャーを経て独立し現職。ベンチャーから一部上場企業の事業戦略やマーケティングのコンサルティングに従事。

ブログ以外にマーケティングレターを毎週1万字で配信しています。音声配信は Podcast, Spotify, Amazon music, stand.fm からどうぞ。

名古屋出身、学生時代は京都。気分転換は朝のランニング。