통계적 사고 (2판) 연습문제 (thinkstats2.com, think-stat.xwmooc.org)
Allen Downey / 이광춘(xwMOOC)

임신 파일을 읽어들이시오.


In [36]:
%matplotlib inline

import nsfg
preg = nsfg.ReadFemPreg()

정상출산을 고르고 나서, totalwgt_lb에 대한 CDF를 생성하시오.


In [ ]:

CDF를 화면에 출력하시오.


In [ ]:

할 수 있다면, 출생당시 여러분이 얼마나 체중이 나가는지 알아내고, CDF(x)를 계산하시오.


In [ ]:

만약 여러분이 첫째라면, 첫번째 아기에 대한 CDF에서 출생체중을 찾아보시오; 첫째가 아니라면, 첫째가 아닌 아기에 대한 CDF를 사용하시오.


In [40]:



('If I am the other baby, ', 0.56451982580793036)
('If I am the first baby, ', 0.5251336898395722)

출생체중에 대한 백분위순위를 계산하시오.


In [41]:



Out[41]:
54.414693516264656

p=0.5와 연관된 값을 찾아서 출생체중 중위를 계산하시오.


In [42]:



Out[42]:
7.375

25 백분위수와 75 백분위수를 계산해서 사분위수 범위를 계산하시오.


In [43]:



('75 Percentile ', 6.5)
('25 Percentile ', 8.125)

cdf에서 무작위 선택을 하시오.


In [44]:



Out[44]:
7.0

cdf에서 무작위 표본을 뽑으시오.


In [45]:



Out[45]:
array([ 8.0625,  8.6875,  1.5625,  7.5   ,  8.    ])

cdf에서 무작위 표본을 뽑고나서, 각 값에 대한 백분위수를 계산하고, 백분위순위 분포를 도식화하시오.


In [46]:



<matplotlib.figure.Figure at 0xac1d982c>

random.random()을 사용해서 1000 난수를 생성하고, 난수의 PMF를 도식화하시오.


In [47]:



<matplotlib.figure.Figure at 0xae857a0c>

PMF가 잘 동작하지 않는다고 가정하고, 대신에 CDF 도식화를 시도하시오.


In [48]:



<matplotlib.figure.Figure at 0xaeb9f06c>

In [ ]: