Category Archives: データの加工や分析で使うRの使い方

データの整形(列の変数型確認、列の抽出、列名の変更、列の型変換)

この記事は連載「Rのデータ前処理」の全 2 ページ中 2 ページ目です。

ローデータから分析対象とする変数のみ抽出し(個人情報など、保持すべきでない変数を削除するなど)、情報を失わない範囲で分析するためのデータセットを作る。分析プロジェクトにおけるローデータと同じ量の情報を持つ、整形された(扱… Read More »

Rでローデータの読み込み(データフレーム、data.table、webデータの取得)

この記事は連載「Rのデータ前処理」の全 2 ページ中 1 ページ目です。

Rを使ったデータ前処理の方法を解説する。 データフレーム形式だけでなく、大きなデータを扱うのに高速なdata.tableを使ったデータの前処理の方法も解説する。 まず一般的にデータの前処理の手順は以下のようなものである。… Read More »

Rにおける代表的な一般化線形モデル(GLM)の実装ライブラリまとめ

一般化線形モデル(GLM)は統計解析のフレームワークとしてとにかく便利。 Rでもビルトインの関数から拡張までさまざまなライブラリから提供されている機能だが、 さまざまなライブラリがありすぎてどれを使えばいいのかわかりにく… Read More »