Rでデータセットの抽出(行の抽出、並べ替え、サンプリング、分割)

この記事は連載「Rのデータ前処理」の全 4 ページ中 4 ページ目です。

前のページではデータフレーム、data.tableの列(変数)の処理について解説したが、今度は行の抽出、並べ替え、サンプリング、分割といった行の処理についてまとめる。 行の削除(抽出) データフレーム adlog &lt… Read More »

Rでデータクリーニング、変数の生成

この記事は連載「Rのデータ前処理」の全 4 ページ中 3 ページ目です。

このあたりから処理がアドホック寄りになるので、data.tableを使う場合でもパイプ(dplyr)を使って一度に実行するのではなく添字記法を使って1ステップずつ進めていくといい(1行ずつ実行する場合は添字記法を使った方… Read More »

Rでデータの整形(列のデータ型確認、列の抽出、列名の変更、列の型変換)

この記事は連載「Rのデータ前処理」の全 4 ページ中 2 ページ目です。

ローデータから分析対象とする変数のみ抽出し(個人情報など、保持すべきでない変数を削除するなど)、情報を失わない範囲で分析するためのデータセットを作る。分析プロジェクトにおけるローデータと同じ量の情報を持つ、整形された(扱… Read More »

Rでローデータの読み込み(データフレーム、data.table、webデータの取得)

この記事は連載「Rのデータ前処理」の全 4 ページ中 1 ページ目です。

Rを使ったデータ前処理の方法を解説する。 データフレーム形式だけでなく、大きなデータを扱うのに高速なdata.tableを使ったデータの前処理の方法も解説する。 まず一般的にデータの前処理の手順は以下のようなものである。… Read More »