Category Archives: データ分析

web以外の一般的なデータ分析の話。webと異なり構造化されたデータが対象。

Rにおける代表的な一般化線形モデル(GLM)の実装ライブラリまとめ

一般化線形モデル(GLM)は統計解析のフレームワークとしてとにかく便利。 Rでもビルトインの関数から拡張までさまざまなライブラリから提供されている機能だが、 さまざまなライブラリがありすぎてどれを使えばいいのかわかりにく… Read More »

回帰分析とその派生手法、数理モデリング、発展的な統計解析手法

この記事は連載「データ分析手法」の全 2 ページ中 2 ページ目です。

いわゆる回帰分析に代表される数理モデリングとその種類を説明していく。 数理モデリング 数理モデリングの考え方 因果関係を定量化 「Xという要因→Yという結果」という関係を $$Y=a+bX$$ で表す。 X=説明変数(独… Read More »

比較のための統計解析手法~さまざまな仮説検定から分散分析、多重比較

この記事は連載「データ分析手法」の全 2 ページ中 1 ページ目です。

分析手法 目的とデータの性質に基づいて手法を選択 目的 違いがあるか知りたい=A/Bテスト (因果)関係を知りたい=何が効くかを知りたい 予測 分類 従属変数があって、それを分類するもの(クラス分類) 独立変数のみで、似… Read More »

機械学習の種類と特徴、ビジネスにおけるデータ分析の意味

この記事は連載「データ分析の基本」の全 4 ページ中 4 ページ目です。

機械学習 「明示的にプログラムしなくても学習する能力をコンピュータに与えること」 つまり1から10までをプログラムしなくても、与えられたデータに基づいてコンピュータが学習し、賢くなっていくようにすることである。 具体的に… Read More »

実際の事象におけるデータの分布と確率分布、一部のデータから全体を推測する考え方

この記事は連載「データ分析の基本」の全 4 ページ中 3 ページ目です。

確率分布 これまで「分布」という言葉が何度も出てきたが、この「分布」とは確率分布のことを指している。ここでは具体的なさまざまな確率分布を紹介する。 まず確率分布の定義であるが、確率分布とは、確率変数の各々の値に対する、そ… Read More »

記述統計~統計的にデータを見る視点

この記事は連載「データ分析の基本」の全 4 ページ中 2 ページ目です。

記述統計 統計の手法には記述統計と推測統計があると説明したが、ここでは記述統計の話。記述統計の考え方を通じて、より進んだデータの見方を学んでいく。 記述統計とは 記述統計とはすべてのデータを見て正しく全容を把握・認識する… Read More »

データ分析の目的、考え方、フレームワークと統計

この記事は連載「データ分析の基本」の全 4 ページ中 1 ページ目です。

データ分析の考え方 昨今もてはやされている「データ分析」というキーワード。 これを読んでいる方々はデータ分析に対してどのようなイメージをお持ちだろうか? データ分析がビジネスの課題を何でも解決してくれるのだろうか? デー… Read More »