記述統計~統計的にデータを見る視点

この記事は連載「データ分析の基本」の全 4 ページ中 2 ページ目です。

記述統計 統計の手法には記述統計と推測統計があると説明したが、ここでは記述統計の話。記述統計の考え方を通じて、より進んだデータの見方を学んでいく。 記述統計とは 記述統計とはすべてのデータを見て正しく全容を把握・認識するための方法論・作法。 全てのデータを見るのでデータマイニング的なアプローチ。 仮説ありきではないので、記述統計の方法だけではデータの組み合わせが膨大だと有効な知見を得るに至らないこともある。 後でどんな手法を使う際にも、それは推測統計や機械学習の手法を使う場合であっても、データを見るという観点ですべての基本の考え方になる。 データの種類 データは特徴によって分類される。 種類によってデータ加工方法から分析手法も変わってくる。 どんな観点で分類するのか、分類のポイントを紹介していく。 尺度 尺度とは、ざっくり言うと数字のなす意味、その数字が対象の特徴をどのように説明するかによる分類。こう言うと難しいので、実際の内容を具体的に見ていこう。 定性的データ(カテゴリカルデータ) 名義尺度:数字は単なる名前・ラベルであって、その大小に意味はない。 (例)性別/1=男性、2=女性 順序尺度:大小比較できる。ただし差に意味はない。 (例)満足度/1=不満、2=どちらでもない、3=満足 定量的データ 間隔尺度:差に意味がある。比に意味はない。つまり割り算する意味がない (例)温度(…

Continue reading →

データ分析の目的、考え方、フレームワークと統計

この記事は連載「データ分析の基本」の全 4 ページ中 1 ページ目です。

データ分析の考え方 昨今もてはやされている「データ分析」というキーワード。 これを読んでいる方々はデータ分析に対してどのようなイメージをお持ちだろうか? データ分析がビジネスの課題を何でも解決してくれるのだろうか? データ分析には役割と守備範囲、正しい手法というものが決まっている。 間違った使い方をすると間違ったインサイトを導き出すことになる。 何でもデータ分析が解決してくれるわけではなく、データ分析の守備範囲とそうでない部分は峻別しなければならない。 データ分析を正しく理解して実務に役立てていくために実務上、最低限抑えておけばいいところをまとめていく。 そもそもデータ分析とは何なのかを整理し データ分析と向き合う正しい姿勢と最低限の知識を説明する データ分析の目的 データ分析には目的がある。主に以下の4種類に分けられる。 予測:売上予測、クリック率予測 意思決定:どの変数がどれだけのインパクトで効いているのか →アクションの方向性・タイミングを見出す、配信アルゴリズムを決める レコメンド:どんな商品をレコメンドするのがいいか 分類:セグメントを作る、何と何を同じものとして扱えばいいか 目的に応じて手法が変わってくる。いま直面しているイシューはどれに当てはまるだろうか。 いずれにせよ「だから●●」というアウトプットがある、示唆を得ることが重要になる。 分析とは? 分けていくこと 分…

Continue reading →