Javascriptで正規分布の実装まとめ（乱数、累積分布関数など）

Facebook Twitter Line Hatena 共有

Javascriptで正規分布の乱数発生（rnorm）、確率密度関数（dnorm）、累積分布関数（pnorm）、累積分布の逆関数（qnorm）を実装する（逆関数は参照で）。すべて標準正規分布を想定。

Javascriptに限らず使えるアルゴリズムだが、日本語でまとまっている情報があまりないのと、ブラウザ上でA/Bテストなど有意性をみる検定などできたら面白いということでJSでやってみる。

正規乱数の生成（rnorm）

1行でBox-Muller法で。

Box-Muller法とは？

$X_{1}, X_{2} \overset{i . i . d .}{\sim} U n i f (0, 1)$

とするとき

$Y_{1} = \sqrt{- 2 \log X_{1}} \cos 2 π X_{2}$
$Y_{2} = \sqrt{- 2 \log X_{1}} \sin 2 π X_{2}$

で生成される

$Y_{1}, Y_{2} \overset{i . i . d .}{\sim} N (0, 1)$

というもの。

今回は1個の正規乱数でいいので、 $Y_{1}$ か $Y_{2}$ の一方を採用すればいい。

Javascriptで実装

function rnorm(){
    return Math.sqrt(-2 * Math.log(1 - Math.random())) * Math.cos(2 * Math.PI * Math.random());
}

後ろの係数はMath.cos()でもMath.sin()でもどちらでもいい。JavascriptのMath.random()は戻り値の区間が[0,1)なので、 $l o g 0$ で発散しないように1-Math.random()としている。

確率密度関数（dnorm）

$Z (x) = \frac{e^{- \frac{x^{2}}{2}}}{\sqrt{2 π}}$

そのまんま

function dnorm(x){
    return Math.exp(-x * x / 2) / Math.sqrt(2 * Math.PI);
}

累積分布関数（pnorm）

Abramowitz and Stegun, Handbook of Mathematical Functions (1964)から。
http://people.math.sfu.ca/~cbm/aands/

26.2が正規分布の累積分布関数の項目。
実際はC. Hastings, Jr., Approximations for Digital Computers (1955)に基づいているとのこと。

26.2.17の

$P (x) = 1 - Z (x) (b_{1} t + b_{2} t^{2} + b_{3} t^{3} + b_{4} t^{4} + b_{5} t^{5}) + ϵ (x)$
$t = \frac{1}{1 + p x}, Z (x) = \frac{e^{- \frac{x^{2}}{2}}}{\sqrt{2 π}}$
$| ϵ (x) | < 7.5 \times 10^{- 8}$
$p = .23164 19$
$b_{1} = .31938 1530$
$b_{2} = - .35656 3782$
$b_{3} = 1.78147 7937$
$b_{4} = - 1.82125 5978$
$b_{5} = 1.33027 4429$

をそのまま実装

// Abramowitz and Stegun (1964) formula 26.2.17
// precision: abs(err) < 7.5e-8

function cdf(x) {

    // constants
    var p  =  0.2316419;
    var b1 =  0.31938153;
    var b2 = -0.356563782;
    var b3 =  1.781477937;
    var b4 = -1.821255978;
    var b5 =  1.330274429;

    var t = 1 / (1 + p * Math.abs(x));
    var Z = Math.exp(-x * x / 2) / Math.sqrt(2 * Math.PI);
    var y = 1 - Z * ((((b5 * t + b4) * t + b3) * t + b2) * t + b1) * t;

    return (x > 0) ? y : 1 - y;
}

これと同じ
http://math.stackexchange.com/questions/888165/abramowitz-and-stegun-approximation-for-cumulative-normal-distribution

参考
https://malishoaib.wordpress.com/2014/04/02/python-code-and-normal-distribution-writing-cdf-from-scratch/

別の近似式を使って実装したものの例
http://www.johndcook.com/blog/normal_cdf_inverse/

参考までに前著の7.1が誤差関数の項目で、こちらを使う場合もある。
cdf()が累積分布関数で、erf()が誤差関数。

// Abramowitz and Stegun (1964) formula 7.1.26
// precision: abs(err) < 1.5e-7

function cdf(x) {
    return (1 + erf( x / Math.sqrt(2) )) / 2;
}

function erf(x) {

    // constants
    var p  =  0.3275911;
    var a1 =  0.254829592;
    var a2 = -0.284496736;
    var a3 =  1.421413741;
    var a4 = -1.453152027;
    var a5 =  1.061405429;

    var t = 1 /(1 + p * Math.abs(x));
    var y = 1 - (((((a5 * t + a4) * t) + a3) * t + a2) * t + a1) * t * Math.exp(-x * x);

    return (x > 0) ? y : -y;
}

誤差関数と正規分布の関係は
http://www.fbs.osaka-u.ac.jp/labs/ishijima/error-01.html
http://bio-info.biz/statistics/distribution_normal_distribution.html
あたりが参考になる。

前著の数式では