ver: Tutorial
In [6]:
punif(0.3,0,1) #P(x<=x)
Out[6]:
In [9]:
dunif(0.3,0,1)
Out[9]:
In [12]:
curve(dunif, from = -1, to = 2)
Simular n=10000
valores
In [22]:
u <- runif(10000,0,1)
In [29]:
mean(u)
Out[29]:
In [78]:
1/12
Out[78]:
In [30]:
var(u)
Out[30]:
In [31]:
sd(u)
Out[31]:
Para una distribución discreta, la probabilidad de tener un valor $X=k$ es \begin{align} P(X=k)=f(k;\text{parameters}) \end{align} En particular la distribución minomial es \begin{align} P(X=k)=B(k;n,p)=\begin{pmatrix} n\\ k\\ \end{pmatrix}p^k (1-p)^{n-k}\,, \end{align} donde $B(k;n,p)$ es la p.d.f
In [33]:
n <- 8
p <- 0.15
barplot(dbinom(0:n,n,p), names.arg=0:n)
Ejemplo: Un exámen de escogencia múltiple tiene $n=10$ preguntas con 4 escogencias cada una. Si un estudiante adivina cada una de las preguntas, ¿cual es la posibilidad que acierte $k$ preguntas?
En este caso $p=1/4$ y \begin{align} P(X=k)=B(k;10,1/4)=\begin{pmatrix} 10\\ k\\ \end{pmatrix}\left(\frac{1}{4}\right)^k \left(1-\frac{1}{4}\right)^{10-k} \end{align}
In [80]:
n <- 10
p <- 0.25
barplot(dbinom(0:n,n,p), names.arg=0:n)
In [81]:
dbinom(2,n,p)
Out[81]:
En el caso discreto: \begin{equation} F(x;n,p)=P(X\le x),\qquad\text{c.d.f} \end{equation} La probabilidad de que un estudiante tenga al menos dos preguntas correctas, \begin{align} P(X\ge 2)=1-P(X\le 1) \end{align}
In [41]:
1-pbinom(1,n,p)
Out[41]:
Ejemplo: En un bosque de 100 árboles, cada árbol tiene un 10% de posibilidades de estar infectado por una enfermedad de las raices independientemente de los otros árboles. ¿Cual es la probabilidad de que más de 5 árboles esten infectados?
In [43]:
n <- 100
p <- 0.10
1-pbinom(5,n,p)
Out[43]:
Se puede usar rbinom
para simular la probabilidad $P(X>5)$ basados en 10,000 repeticiones:
In [66]:
i <- 10000
simlist <- rbinom(i,n,p)
sum(simlist>5)/i
Out[66]:
Normalización \begin{align} \sum_{k=0}^n B(k;n,p)=\left[p-(1-p)\right]^n=1 \end{align}
In [67]:
n*p
Out[67]:
In [68]:
mean(simlist)
Out[68]:
In [74]:
n*p*(1.-p)
Out[74]:
In [70]:
var(simlist)
Out[70]:
In [71]:
sd(simlist)
Out[71]:
Precisión \begin{align}\frac{\sigma}{E[x]}\end{align}
In [77]:
sqrt(n*p*(1.-p))/(n*p)
Out[77]:
In [73]:
sd(simlist)/mean(simlist)
Out[73]:
Ejemplo: Cual es la probabilidad de obtener 450 caras de 1000 lanzamientos de una moneda?
In [1]:
n <- 1000
p <- 0.5
pbinom(450,n,p)
Out[1]:
In [4]:
n <- 1000
p <- 0.5
barplot(dbinom(400:600,n,p), names.arg=400:600)
In [19]:
n <- 1300
l <- 1179
barplot(dpois(1050:n,l), names.arg=1050:n)
La probabilidad de que haya 1180 nacimientos mañana en Colombia es
In [20]:
sqrt(l)
Out[20]:
In [11]:
dpois(1180,l)
Out[11]:
La probabilidad de que haya 1000 nacimientos mañana en Colombia es
In [12]:
dpois(1000,l)
Out[12]:
Muertos por brigrada
In [15]:
n <- 5
l <- 0.61
barplot(dpois(0:n,l), names.arg=0:n)
In [16]:
barplot(dpois(0:n,l)*200, names.arg=0:n)
In [17]:
dpois(0:n,l)*200
Out[17]:
Parámetros por defecto: $\mu=0$ y $\sigma=1$
In [10]:
curve(dnorm, from = -4, to = 4)
In [11]:
x <- seq(-4,4,length=1000)
plot(x,dnorm(x,mean=0, sd=1), type="l", lwd=1)
Las probabilidades de una variable aleatoria con una distribución normal este dentro de uno, dos y tres desviaciones de la media puede calcularse para $x=1,2,3$ con $\mu=0$ y $\sigma=1$
In [12]:
pnorm(1)-pnorm(-1)
Out[12]:
In [13]:
pnorm(2)-pnorm(-2)
Out[13]:
Evidencia:
In [14]:
pnorm(3)-pnorm(-3)
Out[14]:
Descubrimiento
In [66]:
1-(pnorm(5)-pnorm(-5))
Out[66]:
In [21]:
x <- seq(1500,5300,length=1000)
mu <- 3400
sigma <- 570
plot(x,dnorm(x,mu, sigma), type="l", lwd=1)
¿Cual es la probabilidad de que nazca más pesado que 4 Kg?
In [22]:
1-pnorm(4000,mu, sigma)
Out[22]:
In [23]:
1-pnorm( (4000-mu)/sigma)
Out[23]:
Se han registrado nacimiemtos por parto natural de bebes de 6.11 Kg. ¿Cual es la proababilidad?
In [27]:
1.-pnorm(6000,mu, sigma)
Out[27]:
In [28]:
1.-pnorm(7000,mu, sigma)
Out[28]:
A 2002 han nacido en la tierra $106\;456\;367\;669$ personas (Fuente: Estimaciones del Population Reference Bureau. http://www.prb.org/). ¿Cual es el niño más pesado que ha nacido hasta entonces?
In [29]:
1/106456367669
Out[29]:
In [54]:
1.-pnorm(7228,mu, sigma)
Out[54]:
Límite binomial
In [55]:
n <- 4
p <- 0.1
barplot(dbinom(0:n,n,p), names.arg=0:n)
In [58]:
n <- 25
nmax <-10
p <- 0.1
barplot(dbinom(0:nmax,n,p), names.arg=0:nmax)
In [60]:
n <- 500
nmin=25
nmax <-80
p <- 0.1
barplot(dbinom(nmin:nmax,n,p), names.arg=nmin:nmax)
Probabilidad de obtener entre 90 y 110 cuatros en 600 tiradas de un dado:
In [61]:
mu <- 100
sigma <- sqrt(500/6)
pnorm(110,mu,sigma)-pnorm(90,mu,sigma)
Out[61]:
In [65]:
pnorm((110-mu)/sigma)-pnorm((90-mu)/sigma)
Out[65]:
In [46]:
#\left(\right)
#\begin{align}\end{align}