조조하사의 Gaming Nexus☆

[170205 Probability Theory] 2-3. Discrete Probability Distribution - Poisson Distribution


푸아송 분포에 대해서는 그 세부내용으로 들어가기 전에, 이항분포에서 성공확률을 극도로 낮추고 시행횟수를 극도로 높인 분포의 형태가 푸아송 분포가 됨을 설명하려고 한다.

성공확률 p와 시행횟수 n은 무분별하게 막 낮추고 높이는 게 아니라, 기댓값 np를 m으로 고정한 채 n을 무한히 크게 만드는 방향으로 한다.

For Poisson Distribution, before detail we'll see approximation from Binomial Distribution by n→∞ and p→0 becomes Poisson Distribution.

p : the success probability and n : the number of trial are not independently move. With fixed m=np=E(X), we'll make n larger and larger.

<이항분포를 푸아송 분포로 근사시키는 과정샷>
A shot from Binomial Dist. to Poisson Dist.

유의할만한 부분 3가지:
n이 포함되지 않은 식의 경우 밖으로 빼낼 수 있다는 점
n이 무한히 커질때 e에 수렴하는 식 제작하기
다항식 / 다항식 꼴 극한값 계산하기 정도일 듯.

There are 3 meaningful part.
One, terms haven't n can be dropped out.
Two, when n diverges to ∞, we have to make e with this n.
Three, we have to calculate the limit which is (polynomial)/(polynomial) form.

<그래서! 푸아송 분포 정리 샷!>
This is a library for Poisson Distribution

우선 이항분포의 근사형태라는 걸 알았으니, 정확한 내용들을 짚어보자. 푸아송 분포 역시 이산확률분포이고 확률질량함수는 사진 속의 갈색 필기와 같다.
푸아송 분포를 결정하는 건 '모수'라고 할 수 있는데, 푸아송 문제에서 단위시간 당 사상 A의 평균 발생 횟수가 주어지면 그 횟수를 모수로 쓰면 되니까 이 부분에서 딱히 어려운 점은 없음

여기에선 적률생성함수를 가지고 구한 기댓값과 분산이 기댓값과 분산의 정의로부터 계산된 값과 같다는 것을 확인하는 것으로 하고 넘어가자.

Now the detail. Poisson Distribution is also a discrete probability distribution and its probability mass function is in the shot, noted by brown color.
A value determine a Poisson Dist. is Parameter m(=np of Binomial Distribution). In problem about Poisson, if you checked the event A occurred m-times per unit time, then use m as a parameter of Poisson Distribution. Not bad, isn't it?

In this term, let's just see that E(X) and Var(X) are equal to  and .


<기댓값과 분산, 그리고 적률생성함수 구하기>
Calculating Expectation and Variance, Moment generating function

사실 기댓값은 상당히 구하기가 쉽다. x를 약분해주고나면 m을 하나 꺼내 지수만 맞춰주면 기댓값이 짠 하고 나와주기 때문. 물론 여기서도 '푸아송 분포의 확률합은 1'이라는 사실을 철저히 활용해야 한다.

분산에서 쓰이는 저 기법(x=(x-1)+1 같은 거.)은 확률론에선 상당히 흔한 기법인지도 모르겠음. 계속 나오네 계속 나와
분산도 그 외엔 사실 쉽다. m의 지수만 마찬가지로 맞춰주면 끝.

적률생성함수를 구하는 건 기댓값이나 분산 구하기랑은 약간 느낌이 다르다. 기댓값이나 분산 구하기에서는 x의 값을 맞춰줬다면, 적률생성함수를 구하는건 모수를 맞추는 작업을 해줘야하기 때문. 하지만 지수계산이 약간 헷갈리는 정도이지 어렵진 않다.

전체적으로, 푸아송 분포는 적률생성함수를 가지고 기댓값, 분산을 구하기보다는 그냥 구하는게 편한 것으로 일단락.

Calculation of Expectation is quite easy. After deleting x(left side / denominator), we have to set the exponent x as (x-1). Just take m out.
Of course, we must know and use the summation of probability is 1.

In the process of Variance calculation, we use again x=(x-1)+1 term. Isn't it quite frequent?
After that, Just take  out. Then it's over.

Calculation of Moment generating function seems different with of expectation or variance. In above calculation, we set m's exponent and denominator form same. But here, we have to set parameter-terms same. There's not difficult thing but exponent calculation.

In Poisson's case, Expectation and Variance can be calculated easily without Moment generating function.


(여기에 +해서 푸아송분포의 세 가지 성질인 독립성/비집락성/비례성이 있는데, 이름 보고 대충 어떤건지 알 수 있으니 패스. 시험에서 막 엄청 중요하게 다룰 것 같지도 않은 느낌적인 느낌.)