<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>確率分布 on Marketechlabo</title><link>https://www.marketechlabo.com/tags/probability-distribution/</link><description>Recent content in 確率分布 on Marketechlabo</description><generator>Hugo -- gohugo.io</generator><language>ja-jp</language><lastBuildDate>Sun, 22 Jan 2017 00:00:00 +0900</lastBuildDate><atom:link href="https://www.marketechlabo.com/tags/probability-distribution/index.xml" rel="self" type="application/rss+xml"/><item><title>実際の事象におけるデータの分布と確率分布、一部のデータから全体を推測する考え方</title><link>https://www.marketechlabo.com/statistics-analysis/probability-inferential-statistics/</link><pubDate>Sun, 22 Jan 2017 00:00:00 +0900</pubDate><guid>https://www.marketechlabo.com/statistics-analysis/probability-inferential-statistics/</guid><description>
&lt;h2 id="確率分布"&gt;確率分布&lt;/h2&gt;
&lt;p&gt;これまで「分布」という言葉が何度も出てきたが、この「分布」とは確率分布のことを指している。ここでは具体的なさまざまな確率分布を紹介する。
まず確率分布の定義であるが、確率分布とは、確率変数の各々の値に対する、その生起しやすさをプロットしたものである。そして確率変数とは、確率的に取る値が変わる変数を指す。
発生する事象が確率的に変化するものを想像しよう。その生起しやすさを表すのが確率分布である。
厳密な議論は省略してどのような事象があてはまるか、分布に対するイメージがわかることを目的とする。&lt;/p&gt;
&lt;h3 id="離散型確率分布"&gt;離散型確率分布&lt;/h3&gt;
&lt;h4 id="ベルヌーイ分布"&gt;ベルヌーイ分布&lt;/h4&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;1回の試行で表が出るか裏が出るか&lt;/strong&gt;
&lt;ul&gt;
&lt;li&gt;一か八か&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;成功確率 $p$ の事象が1回の試行で成功するかどうか&lt;/li&gt;
&lt;li&gt;期待値＝$p$、分散＝$p(1-p)$&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;期待値は確率分布の中心的位置を表す。
分散は平均からのバラつきの程度を数量的に表す。&lt;/p&gt;
&lt;h4 id="二項分布"&gt;二項分布&lt;/h4&gt;
&lt;p&gt;（例）平均して打率3割の選手が年間500打席でヒットを打つ回数の分布
&lt;figure&gt;
&lt;picture&gt;
&lt;img
loading="lazy"
decoding="async"
alt="二項分布"
class="image_figure image_internal image_unprocessed"
src="/images/analytics/dbinom.png"
/&gt;
&lt;/picture&gt;
&lt;/figure&gt;
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;$n$ 回やって何回成功するか&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;成功確率 $p$ の事象が $n$ 回の試行で成功する回数&lt;/li&gt;
&lt;li&gt;この分布を$Bin(n, p)$と表記&lt;/li&gt;
&lt;li&gt;期待値＝$np$、分散＝$np(1-p)$&lt;/li&gt;
&lt;/ul&gt;
&lt;h4 id="ポアソン分布"&gt;ポアソン分布&lt;/h4&gt;
&lt;p&gt;（例）あるサッカーリーグの1試合における得点の分布
&lt;figure&gt;
&lt;picture&gt;
&lt;img
loading="lazy"
decoding="async"
alt="ポアソン分布"
class="image_figure image_internal image_unprocessed"
src="/images/analytics/dpois.png"
/&gt;
&lt;/picture&gt;
&lt;/figure&gt;
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;レアな事象が発生する回数&lt;/strong&gt;（カウントデータ）&lt;br&gt;
（例）クリック数、1日に受け取るメールの件数&lt;/li&gt;
&lt;li&gt;二項分布との関係
&lt;ul&gt;
&lt;li&gt;二項分布で $n$ →大、$p$ →小、$np$＝一定（$\lambda$）のときに該当&lt;/li&gt;
&lt;li&gt;$n$ が変化する事象には不適（インプレッション数が大きく変動する場合だとNG）&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;この分布を$Po(\lambda)$と表記&lt;/li&gt;
&lt;li&gt;期待値＝分散＝$\lambda$&lt;/li&gt;
&lt;/ul&gt;
&lt;h4 id="負の二項分布"&gt;負の二項分布&lt;/h4&gt;
&lt;p&gt;（例）あるwebサイトのページごとの1日のPV数の分布
&lt;figure&gt;
&lt;picture&gt;
&lt;img
loading="lazy"
decoding="async"
alt="負の二項分布"
class="image_figure image_internal image_unprocessed"
src="/images/analytics/dnbinom.png"
/&gt;
&lt;/picture&gt;
&lt;/figure&gt;
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;ポアソン分布と似ているが分散が大きい
&lt;ul&gt;
&lt;li&gt;0が多い&lt;/li&gt;
&lt;li&gt;大きな外れ値がある&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;ゼロが多い、分散が大きいカウントデータに適用&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;成功確率 $p$ の事象が $k$ 回成功するまでに何回失敗するか&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="連続型確率分布"&gt;連続型確率分布&lt;/h3&gt;
&lt;h4 id="正規分布"&gt;正規分布&lt;/h4&gt;
&lt;p&gt;&lt;figure&gt;
&lt;picture&gt;
&lt;img
loading="lazy"
decoding="async"
alt="正規分布(50,10)"
class="image_figure image_internal image_unprocessed"
src="/images/analytics/dnorm.png"
/&gt;
&lt;/picture&gt;
&lt;/figure&gt;
&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;分布の王様。理論上いろいろ便利&lt;/li&gt;
&lt;li&gt;期待値 $\mu$、分散 $\sigma^2$ の正規分布を$N(\mu, \sigma^2)$と表記&lt;/li&gt;
&lt;/ul&gt;
&lt;h4 id="指数分布"&gt;指数分布&lt;/h4&gt;
&lt;p&gt;&lt;figure&gt;
&lt;picture&gt;
&lt;img
loading="lazy"
decoding="async"
alt="指数分布(0.07)"
class="image_figure image_internal image_unprocessed"
src="/images/analytics/dexp.png"
/&gt;
&lt;/picture&gt;
&lt;/figure&gt;
ランダムな事象の発生間隔（待ち時間）&lt;br&gt;
（例）メールを受信する間隔&lt;/p&gt;</description></item></channel></rss>