Marketechlabo
open-menu closeme
ホーム
カテゴリ
タグ
  • 実際の事象におけるデータの分布と確率分布、一部のデータから全体を推測する考え方

    calendar Jan 22, 2017 / Mar 2, 2026 · 2 分で読了 · 統計学確率分布推測統計  ·
    共有する: twitter facebook linkedin copy
    実際の事象におけるデータの分布と確率分布、一部のデータから全体を推測する考え方

    確率分布 これまで「分布」という言葉が何度も出てきたが、この「分布」とは確率分布のことを指している。ここでは具体的なさまざまな確率分布を紹介する。 まず確率分布の定義であるが、確率分布とは、確率変数の各々の値に対する、その生起しやすさをプロットしたものである。そして確率変数とは、確率的に取る値が変わる変数を指す。 発生する事象が確率的に変化するものを想像しよう。その生起しやすさを表すのが確率分布である。 厳密な議論は省略してどのような事象があてはまるか、分布に対するイメージがわかることを目的とする。 離散型確率分布 ベルヌーイ分布 1回の試行で表が出るか裏が出るか 一か八か 成功確率 ppp の事象が1回の試行で成功するかどうか 期 …


    続きを読む
  • Javascriptで正規分布の実装まとめ(乱数、累積分布関数など)

    calendar Apr 10, 2019 / Mar 2, 2026 · 4 分で読了 · 統計学javascript正規分布  ·
    共有する: twitter facebook linkedin copy
    Javascriptで正規分布の実装まとめ(乱数、累積分布関数など)

    Javascriptで正規分布の乱数発生(rnorm)、確率密度関数(dnorm)、累積分布関数(pnorm)、累積分布の逆関数(qnorm)を実装する。すべて標準正規分布を想定。 Javascriptに限らず使えるアルゴリズムだが、日本語でまとまっている情報があまりないのと、ブラウザ上でA/Bテストなど有意性をみる検定などできたら面白いということでJSでやってみる。 なお、実務で手軽に使いたい場合は stdlib-js や jStat といったライブラリも検討するとよい。本記事はアルゴリズムの中身を理解する目的で、ライブラリを使わずスクラッチで実装する。 正規乱数の生成(rnorm) 1行でBox-Muller法で。 …


    続きを読む
  • Rにおける代表的な一般化線形モデル(GLM)の実装ライブラリまとめ

    calendar Jan 3, 2022 · 2 分で読了 · RGLM統計学  ·
    共有する: twitter facebook linkedin copy

    一般化線形モデル(GLM)は統計解析のフレームワークとしてとにかく便利。Rでもビルトインの関数から拡張までさまざまなライブラリから提供されている機能だが、さまざまなライブラリがありすぎてどれを使えばいいのかわかりにくいのと、さらに一般化線形モデル(GLM)自体にもいろいろな亜種があるため、どの手法をどのライブラリの関数で実装すればいいかわからなくなる。 そこでRに実装されている代表的なGLM系の関数と特徴についてまとめてみた。 一般化線形モデルのおさらい 一般化線形モデルとは $$ y = g^{-1}(\alpha + \beta_1 x_1 + \beta_2 x_2 + … + \beta_i x_i) + \epsilon …


    続きを読む
  • 回帰分析とその派生手法、数理モデリング、発展的な統計解析手法

    calendar Jan 31, 2017 · 2 分で読了 · 回帰分析統計学データサイエンス  ·
    共有する: twitter facebook linkedin copy
    回帰分析とその派生手法、数理モデリング、発展的な統計解析手法

    いわゆる回帰分析に代表される数理モデリングとその種類を説明していく。 数理モデリング 数理モデリングの考え方 因果関係を定量化 「Xという要因→Yという結果」という関係を Y=a+bXY=a+bXY=a+bX で表す。 X=説明変数(独立変数) Y=被説明変数(従属変数、目的変数) いわゆる「回帰分析」である。 目的 因果関係とインパクトの大きさの特定 予測 モデリングの手続き モデル式の選択(単回帰、ロジット、…) 従属変数の特徴(分布の形状、ばらつき方)によって適切なモデルを選択する パラメータの推定 さまざまな推定法がある(最尤法、最小二乗法) そのモデルでいいか検証 あてはまりのよさ(fit) 決定係数 AIC 残差の評価(独立性、正規性、 …


    続きを読む
  • 比較のための統計解析手法~さまざまな仮説検定から分散分析、多重比較

    calendar Jan 30, 2017 · 2 分で読了 · 統計学仮説検定ABテスト  ·
    共有する: twitter facebook linkedin copy
    比較のための統計解析手法~さまざまな仮説検定から分散分析、多重比較

    分析手法 目的とデータの性質に基づいて手法を選択 目的 違いがあるか知りたい=A/Bテスト (因果)関係を知りたい=何が効くかを知りたい 予測 分類 従属変数があって、それを分類するもの(クラス分類) 独立変数のみで、似ているものをまとめるもの(クラスタリング) レコメンド データの性質(手法の前提条件) 離散か連続か 正規性 等分散性 従属変数の分布の形状 http://readingmonkey.blog45.fc2.com/blog-entry-262.html 仮説検定 仮説検定とは? 基本的に比較するための方法 「A/Bテスト」→理論的に正確な手順がある。 ※比較する対象は2つ。3つ以上だと別の手法を用いることになる 仮説 …


    続きを読む
  • 記述統計~統計的にデータを見る視点

    calendar Jan 21, 2017 · 2 分で読了 · 統計学記述統計データ可視化  ·
    共有する: twitter facebook linkedin copy
    記述統計~統計的にデータを見る視点

    記述統計 統計の手法には記述統計と推測統計があると説明したが、ここでは記述統計の話。記述統計の考え方を通じて、より進んだデータの見方を学んでいく。 記述統計とは 記述統計とはすべてのデータを見て正しく全容を把握・認識するための方法論・作法。 全てのデータを見るのでデータマイニング的なアプローチ。 仮説ありきではないので、記述統計の方法だけではデータの組み合わせが膨大だと有効な知見を得るに至らないこともある。 後でどんな手法を使う際にも、それは推測統計や機械学習の手法を使う場合であっても、データを見るという観点ですべての基本の考え方になる。 データの種類 データは特徴によって分類される。 種類によってデータ加工方法から分析手法も変わっ …


    続きを読む
  • データ分析の目的、考え方、フレームワークと統計

    calendar Jan 20, 2017 · 2 分で読了 · 統計学データサイエンス分析手法  ·
    共有する: twitter facebook linkedin copy
    データ分析の目的、考え方、フレームワークと統計

    データ分析の考え方 データに基づいて意思決定をすることは、もはやビジネスの前提となった。 AIがデータ分析のワークフローを大きく変えつつある今だからこそ、その土台となる「考え方」を正しく理解しておくことが重要である。 データ分析がビジネスの課題を何でも解決してくれるのだろうか? データ分析には役割と守備範囲、正しい手法というものが決まっている。 間違った使い方をすると間違ったインサイトを導き出すことになる。 何でもデータ分析が解決してくれるわけではなく、データ分析の守備範囲とそうでない部分は峻別しなければならない。 データ分析を正しく理解して実務に役立てていくために実務上、最低限抑えておけばいいところをまとめていく。 そもそもデータ …


    続きを読む

最近の投稿

  • 筆者について

カテゴリ

サーバ・インフラ 12 R 10 ウェブ解析 9 統計・分析 8 ウェブ計測 8 機械学習 5 広告運用 1 AI 1 システム設計 1

タグ

R 13 GA4 7 機械学習 7 統計学 7 BigQuery 6 データサイエンス 5 GTM 5 アクセス解析 5 data.table 4 GCP 4 データ前処理 3 google-analytics 3 計測 3 ABテスト 2 BQML 2 Cookie 2 データ処理 2 javascript 2 privacy 2 静的サイト 2 テキスト処理 2 URL 2 権限管理 1 管理 1 分析手法 1 認証 1 自動最適化 1 bash 1 ビジネス 1 カテゴリ変数 1
全てのタグ
ABテスト2 権限管理1 管理1 分析手法1 認証1 自動最適化1 bash1 BigQuery6 BQML2 ビジネス1 カテゴリ変数1 クラスター分析1 Colab1 コンテンツ分析1 Cookie2 コスト最適化1 データクリーニング1 データレイヤー1 data-pipeline1 データ前処理3 データ処理2 データサイエンス5 data.table4 データ型1 データ可視化1 データベース1 決定木1 記述統計1 Digdag1 環境構築1 エラーハンドリング1 Excel1 エクスポート1 Firebase1 Firebase Hosting1 GA47 GCP4 ggplot21 GLM1 google-analytics3 Google API1 GPU1 GTM5 仮説検定1 IAM1 推測統計1 IPA1 ITP1 javascript2 Linux1 機械学習7 計測3 計測設計1 計測検証1 メディア1 非機能要件1 正規分布1 ワンライナー1 OpenVPN1 openxlsx1 Perl1 PostgreSQL1 privacy2 確率分布1 programmatic-ad1 プロンプト1 Python1 R13 回帰分析1 リモートデスクトップ1 要件定義1 スキーマ1 sed1 SEO1 シェルスクリプト1 SPA1 Spot VM1 静的サイト2 統計学7 タグマネジメント1 テキスト処理2 時系列分析1 Tips1 トラッキング1 URL2 VPN1 アクセス解析5 ワークフロー1 XGBoost1
[A~Z][0~9]
Marketechlabo

Copyright 2026 MARKETECHLABO. All Rights Reserved

to-top