Distribuciones Varias
Cuestiones a considerar. Conceptos. Problemas. Ejemplos.
Distribuciones de Probabilidad Discreta
Distribuciones de Probabilidad
Los conceptos que conviene ser conocidos por el lector para este trabajo son:
+ Variable aleatoria: tiene un valor numérico asociado a cada resultado de algún procedimiento aleatorio,
+ Distribución de probabilidad: tiene una probabilidad asociada a cada valor de una variable aleatoria.
+ Métodos para calcular la media, la varianza y la desviación estándar de una distribución de probabilidad.
+ Valor esperado de una variable aleatoria: es igual a la media.
+ Resultado infrecuente, un concepto sumamente importante para determinar cuándo los resultados son poco comunes.
+ Ver estos conceptos en: https://www.chreinvent.com/recursos/distribuci%C3%B3n-de-probabilidad
Lotería Kentucky Pick 4. Esperanza Matemática.
· Si usted apuesta $1 en el juego de lotería Kentucky Pick 4, pierde $1 o gana $4999.
· (El premio ganador es de $5,000, pero no le devuelven su apuesta de $1, por lo que la ganancia neta es de $4999).
· El juego consiste en seleccionar un número de cuatro dígitos entre 0000 y 9999. Si usted apuesta $1 al 1234, ¿cuál es el valor esperado de ganar o perder?
Análisis del problema:
I. Probabilidades:
a. Suceso favorable:
Probabilidad de ganar apostando a 1234.
Un solo suceso favorable.
b. Sucesos posibles:
Variaciones con repetición. (ej 1111, 1123)
Si importa el orden porque son numeros distintos. (ej 1234 <> 1243).
Con reemplazo porque cada bolilla que saco con un numero la tengo que volver a poner.
Al ser con reemplazo se trata de sucesos independientes.
Vcr(10, 4) = 10^4 = 10000
1. Probabilidad de ganar apostando a 1234:
Suceso Faborable/Sucesos posibles (a/b)
P(x) = P(1234) = 1/10000 = 0,0001
2. Probabilidad de perder apostando a 1234: 9999
P(x) = P(<>1234) = 9999/10000 = 0,9999 = 1 - P(1234)
II. Esperanzas
a. Esperanza de ganar : x . P(x) = $4999 . 0,0001 = +$0,4999
b. Esperanza de perder: x . P(x) = $ -1 . 0.9999 = -$0.9999
c. Esperanza Matemática del problema (a+b): neto = -$0.5
III. Conclusión
Es de esperar que luego de jugar muchisimo este juego, resulte que se pierda medio dólar!!
En cualquier juego individual de esta lotería, se pierde $1 u obtiene una ganancia neta de $4999,
· pero el valor esperado indica que, a largo plazo, se espera perder un promedio de 50 centavos por cada apuesta de $1.
Tal vez esta lotería tenga cierto valor de entretenimiento limitado,
· pero, sin duda, se trata de una inversión económica extremadamente inadecuada.
Distribución de probabilidad.Considere el ensayo de lanzar un dado, con los resultados 1, 2, 3, 4, 5 y 6. Construya la tabla que represente la distribución de probabilidad.
Se trata de una distribución de probabilidad uniforme dado que las 6 caras del dado tienen la misma probabilidad de salir, si el dado está perfectamente balanceado.
Distribución de probabilidad.Uno de los requisitos de una distribución de probabilidad es que la suma de las probabilidades debe ser 1 (se permite una pequeña cantidad de variación por errores de redondeo). ¿Cuál es la justificación de este requisito?
Uno de los requisitos de la distribución de probabilidades es que la suma de las probabilidades para todos los valores de la variable aleatoria es uno. Esto tiene sentido ya que para que las probabilidades estén distribuidas coherentemente la suma debe ser uno que es el suceso seguro.
Distribución de probabilidad. Un jugador profesional afirma que cargó un dado para que los resultados de 1, 2, 3, 4, 5, 6 tengan probabilidades correspondientes de 0.1, 0.2, 0.3, 0.4, 0.5 y 0.6. ¿Realmente será cierto lo que dice? ¿Una distribución de probabilidad se describe haciendo una lista de los resultados junto con sus probabilidades correspondientes?
No. Lo cierto es que si un jugador carga un dado para que salga con mayor probabilidad una cara que otras, lo puede hacer en detrimento de las probabilidades de las otras caras y siempre la suma de las probabilidades dará uno ya que es imposible que la suma de la distribución de probabilidad sea mayor que uno. Por ejemplo si carga el dado para que salga siempre 6, entonces la probabilidad de que salgan valores como 1,2,3,4,5 es cero.
Una distribución de probabilidad discreta se describe por una lista de resultados posibles junto con sus probabilidades correspondientes. Para que sea válida, debe cumplir con dos condiciones:
1. Cada probabilidad debe ser un número entre 0 y 1 (inclusivo).
2. La suma de todas las probabilidades debe ser igual a 1.
La suma de las probabilidades es 2.1, que es mayor que 1. Por lo tanto, las probabilidades proporcionadas no forman una distribución de probabilidad válida. La suma de las probabilidades debe ser exactamente 1, pero en este caso, es 2.1.
Por lo tanto, la afirmación del jugador profesional no puede ser cierta si las probabilidades asignadas a los resultados son realmente las que él menciona.
Nacimientos. Valor esperado. Un investigador calcula el valor esperado del número de niñas en cinco nacimientos y obtiene un resultado de 2.5. Luego, redondea los resultados a 3, al afirmar que no es posible que nazcan 2.5 niñas en cinco nacimientos. ¿Es correcto este razonamiento?
No parece ser correcto. Esto se debe a que si el valor esperado o esperanza matemática da como resultado 2.5, significaría mas bien que es esperable que nazcan entre 2 y 3 niñas con igual probabilidad en este caso de nacimientos considerado.
El valor esperado de 2.5 es una medida teórica de la media del número de niñas en un gran número de experimentos de cinco nacimientos cada uno. No significa que en un único experimento o en un único conjunto de cinco nacimientos esperemos ver exactamente 2.5 niñas. En cada conjunto de cinco nacimientos, el número real de niñas será un número entero (0, 1, 2, 3, 4, o 5).
Redondear el valor esperado a 3 para decir que no es posible que nazcan 2.5 niñas es incorrecto porque el valor esperado es una media teórica, no un valor real que necesariamente ocurre en un solo experimento. EL redondeo podría ser útil en algunos contextos prácticos, pero no cambia el significado teórico del valor esperado en la distribución de probabilidad.
Identificación de variables aleatorias discretas y continuas. En los ejercicios 5 y 6, identifique si la variable aleatoria dada es discreta o continua.
a. La estatura de una jirafa que vive en Kenia, elegida al azar. Respuesta: VA continua.
b. El número de águilas calvas que habitan en el estado de Nueva York. Respuesta: VA discreta.
c. El tiempo exacto que se requiere para sumar 27 + 72. Respuesta: VA continua.
d. El número de autores de libros de texto que ahora están sentados ante una computadora. Respuesta: VA discreta.
e. El número de estudiantes de estadística que ahora están leyendo un libro. Respuesta: VA discreta.
f. El costo de realizar un experimento de genética. VA continua.
g. El número de supermodelos que ayer comieron pizza. VA discreta.
h. El tiempo de vida exacto de un gato. VA continua.
i. El número de profesores de estadística que leen un periódico cada día. VA discreta.
j. El peso de una pluma. VA continua.
Identificación de distribuciones de probabilidad. En los casos siguientes, determine si se trata de una distribución de probabilidad. En los casos en que no se describe una distribución de probabilidad, identifique los requisitos que no se satisfacen. Para los casos en los que se describe una distribución de probabilidad, calcule su media y desviación estándar.
a. Trastorno genético. Cada uno de tres hombres que tienen un trastorno genético relacionado con el cromosoma X tiene un hijo. La variable aleatoria x es el número de hijos de los tres hombres que heredan el trastorno genético relacionado con el cromosoma X.
x P(x) x.P(x) xx.P(x)
0 0.4219 0.0000 0.0000
1 0.4219 0.4219 0.4219
2 0.1406 0.2812 0.5624
3 0.0156 0.0468 0.1404
a. La suma de las probabilidades ['si'] es igual a 1: 1.00
b. 𝜇= ∑[𝑥 . 𝑃(𝑥)] = 0.75
c. 𝜎^2=∑[𝑥^2. 𝑃(𝑥)]−𝜇^2 = 1.12 - 0.56 = 0.56234999
d. 𝜎=√(∑[𝑥^2. 𝑃(𝑥)]−𝜇^2 = 0.75 )
x P(x)
0 0.502
1 0.365
2 0.098
3 0.011
4 0.001
x P(x)
0 0.502
1 0.365
2 0.098
3 0.011
4 0.001
Números de niñas. Un investigador reporta que, cuando se seleccionan al azar grupos de cuatro niños de una población de parejas que cumplen ciertos criterios, la distribución de probabilidad del número de niñas es como la que se presenta en la siguiente tabla.
La suma de las probabilidades ['no'] es igual a 1. : 0.98
x P(x)
0 0.04
1 0.16
2 0.80
3 0.16
4 0.04
No es una distribución de probabilidad.
x P(x)
0 0.04
1 0.16
2 0.80
3 0.16
4 0.04
c. Experimento de genética. Un experimento de genética incluye vástagos de guisantes en grupos de cuatro. Un investigador re- porta que, para un grupo, el número de plantas de guisantes con flores blancas tiene una distribución de probabilidad como la que se presenta en la siguiente tabla:
La suma de las probabilidades ['no'] es igual a 1. : 1.20.
No es una distribución de probabilidad.
x P(x)
0 0.0000
1 0.0001
2 0.0006
3 0.0387
4 0.9606
Estudio de mortalidad. Para un grupo de cuatro hombres, la distribución de probabilidad del número x que sobreviven al año siguiente es como la que se presenta la siguiente tabla:
Número de juegos en una Serie Mundial de béisbol. Con ba- se en resultados pasados encontrados en el Information Please Almanac, existe una probabilidad del 0.1818 de que la Serie Mundial de béisbol dure cuatro juegos, una probabilidad del 0.2121 de que dure cinco juegos, una probabilidad de 0.2323 de que dure seis juegos y una probabilidad del 0.3737 de que dure siete juegos. ¿Será infrecuente que un equi- po “arrase” al ganar cuatro juegos?
x P(x) x.P(x) xx.P(x)
4 0.181818 0.727273 2.909091
5 0.212121 1.060606 5.303030
6 0.232323 1.393939 8.363636
7 0.373737 2.616162 18.313131
a. La suma de las probabilidades ['si'] es igual a 1. : 1.0
b. 𝜇 = ∑[𝑥 . 𝑃(𝑥)] = 5.80
c. 𝜎^2 = ∑[𝑥^2. 𝑃(𝑥)]−𝜇^2 = 34.89 - 33.62 = 1.27
d. 𝜎 = √(∑[𝑥^2. 𝑃(𝑥)]−𝜇^2) = 1.13
Es más probable que el números de juegos sea 7 a que sea 4. Sin embargo, la probabilidad de juegos igual a 4 no es baja, sino que es mayor que el 5%. Por lo tanto la probabilidad que puedan haber sólo 4 juegos igual a 18% es alta y **no** es un suceso improbable o infrecuente.
Reconocimiento de marca. En un estudio de reconocimiento de la marca Sony se en- trevistaron grupos de cuatro consumidores. Si x es el número de personas en el grupo que reconocen la marca Sony, entonces x puede ser 0, 1, 2, 3 o 4, y las probabilidades corres- pondientes son 0.0016, 0.0250, 0.1432, 0.3892 y 0.4096. ¿Será infrecuente seleccionar al azar a cuatro consumidores y descubrir que ninguno de ellos reconoce la marca Sony?
La suma de las probabilidades ['no'] es igual a 1. : 0.9685999999999999. Está lejos de ser una distribución de probabilidad correcta.
Determinar si un proceso de selección de miembros de un jurado es discriminatorio. Suponga que se seleccionan 12 jueces al azar de una población en la que el 80% de los habitantes son méxico-estadounidenses. a. Calcule la probabilidad de que haya exactamente x méxico-estadounidenses en un total de 12 miembros del jurado. b. Calcule la probabilidad de que haya x o menos méxico-estadounidenses en un total de 12 miembros del jurado.
p x.p xx.p p-acu p-acr
x
0 0.000 0.000 0.000 0.000 1.000
1 0.000 0.000 0.000 0.000 1.000
2 0.000 0.000 0.000 0.000 1.000
3 0.000 0.000 0.001 0.000 1.000
4 0.001 0.002 0.008 0.001 1.000
5 0.003 0.017 0.083 0.004 0.999
6 0.016 0.093 0.558 0.019 0.996
7 0.053 0.372 2.604 0.073 0.981
8 0.133 1.063 8.504 0.205 0.927
9 0.236 2.126 19.134 0.442 0.795
10 0.283 2.835 28.347 0.725 0.558
11 0.206 2.268 24.945 0.931 0.275
12 0.069 0.825 9.896 1.000 0.069
En la tabla pueden verse todos los resultados de la probabilidad “p” de un suceso (de 1 a 12) como también las probabilidades acumuladas “p-acu”.
c. ¿Qué probabilidad es relevante para determinar si 5 jueces de un total de 12 son excepcionalmente pocos: el resultado del inciso a) o el del inciso b)?
La probabilidad acumulada. Ya que si bien la probabilidad todos esos sucesos son bajas, aún así, pueden suceder y hay que tener en cuenta todas esas probabilidades a la hora de determinar la relevancia y definir sucesos frecuentes o probables y distinguirlos de los infrecuentes.
d. ¿Cinco méxico-estadounidenses de un total de 12 miembros del jurado sugieren que el proceso de selección discrimina a los méxico-estadounidenses? ¿Por qué?
Sí. Debido a que la probabilidad de seleccionar aleatoriamente a cinco o menos méxico-estadounidenses es tan baja (0.004), es poco probable que eso ocurra por el azar.
Cálculo del valor esperado en la ruleta. Cuando usted apuesta $5 al número 7 en la ruleta en el casino Venetian de Las Vegas, tiene:
· una probabilidad de 37/38 de perder $5,
· una probabilidad de 1/38 de obtener una ganancia neta de $175. (El premio es de $180, incluyendo su apuesta de $5, de manera que la ganancia neta es de $175).
Si apuesta $5 a que el resultado es un número impar,
· la probabilidad de perder $5 es de 20/38 y
· la probabilidad de obtener una ganancia neta de $5 es de 18/38. (Si usted apuesta $5 a un número impar y gana, recibe $10 incluyendo su apuesta, de manera que la ganancia neta es de $5).
a. Si apuesta $5 al número 7, ¿cuál es su valor esperado?
Valor esperado = -5*37/38 + 175*1/38 = -0.263
b. Si apuesta $5 a que el resultado es un número impar, ¿cuál es su valor esperado?
Valor esperado = -5 *20/38 + 5*18/38 = -0.263
c. ¿Cuál de estas opciones es mejor: apostar al siete, apostar a número impar o no apostar? ¿Por qué?
No apostar porque si apuesto lo esperable es que pierda, en cambio, si no apuesto, no pierdo.
Cálculo del valor esperado en los dados en un casino. Cuando usted apuesta $5 en un casino en la “línea de pase” en el juego de dados,
· existe una probabilidad de 251/495 de que pierda $5 y
· una probabilidad de 244/495 de que obtenga una ganancia neta de $5. (Si usted gana, el casino le da $5 y conserva su apuesta de $5, de manera que la ganancia neta es de $5).
¿Cuál es su valor esperado? A la larga, ¿cuánto pierde por cada dólar que apueste?
Valor esperado = -5*251/495+5*244/495 = -35/495 = -0,07
Se pierde 0,014 por cada dólar apostado.
Seguro de Vida. La compañía de seguros CNA le cobra a un hombre de 21 años $250 por un año de una póliza de seguro de vida de $100,000. Un hombre de 21 años tiene una probabilidad del 0.9985 de sobrevivir durante un año (según datos del U.S. National Center for Health Statistics).
a. Desde la perspectiva del hombre de 21 años (o de su estado), ¿cuáles son los valores de los dos resultados diferentes?
Valor esperado = -250*0.9985+99750*0.0015
b. ¿Cuál es el valor esperado para un hombre de 21 años que compra el seguro?
Valor esperado = -100
c. ¿Cuál sería el costo de la póliza del seguro si la compañía sale a mano (a la larga eso sucede con muchas pólizas), en vez de obtener una ganancia?
0 = -x * 0.9985 + 99750 * 0.0015
x * 0.9985 = 99750 * 0.0015
x = 99750 * 0.0015 / 0.9985
x = 189,98
d. Dado que el valor esperado es negativo (de manera que la compañía obtiene una ganancia), ¿por qué debería un hombre de 21 años o cualquier otra persona adquirir seguros de vida?
El valor negativo esperado es un precio relativamente bajo a pagar por la seguridad económica de sus herederos.
Rifa. Cálculo del valor esperado de la rifa organizada por una revista. La revista Reader’s Digest realizó una rifa en la que los premios se listaron junto con las probabilidades de ganar:
· $1,000,000 (1 posibilidad en 90,000,000),
· $100,000 (1 posibilidad en 110,000,000),
· $25,000 (1 posibilidad en 110,000,000),
· $5000 (1 posibilidad en 36,667,000) y
· $2500 (1 posibilidad en 27,500,000).
a. Suponiendo que no hay un costo por participar en la rifa, calcule el valor esperado de la cantidad a ganar con un boleto.
Posibilidades de ganar
Calculo
Costo x P(Perder Rifa) + Beneficio x P(Ganar Rifa) = Resultado
a 90.000.000 Esperanza = 0 x 0,9999999889 + 1.000.000 x 0,0000000111 = 0,011111
b 110.000.000 Esperanza = 0 x 0,9999999909 + 100.000 x 0,0000000091 = 0,000909
c 110.000.000 Esperanza = 0 x 0,9999999909 + 25.000 x 0,0000000091 = 0,000227
d 36.667.000 Esperanza = 0 x 0,9999999727 + 50.000 x 0,0000000273 = 0,001364
e 27.500.000 Esperanza = 0 x 0,9999999636 + 2.500 x 0,0000000364 = 0,000091
b. Calcule el valor esperado si el costo de un boleto en esta rifa equivale al de una estampilla postal. ¿Vale la pena participar en esta rifa?
Posibilidades de ganar
Calculo Costo x P(Perder Rifa) + Beneficio x P(Ganar Rifa) = Resultado
a 90.000.000 Esperanza = -1 x 0,9999999889 + 999.999 x 0,0000000111 = - 0,988889
b 110.000.000 Esperanza = -1 x 0,9999999909 + 99.999 x 0,0000000091 = - 0,999091
c 110.000.000 Esperanza = -1 x 0,9999999909 + 24.999 x 0,0000000091 = - 0,999773
d 36.667.000 Esperanza = -1 x 0,9999999727 + 49.999 x 0,0000000273 = - 0,998636
e 27.500.000 Esperanza = -1 x 0,9999999636 + 2.499 x 0,0000000364 = - 0,999909
Posibilidades de ganar
Calculo Costo x P(Perder Rifa) + Beneficio x P(Ganar Rifa) = Resultado
a 90.000.000 Esperanza = -1000 x 0,9999999889 + 999.000 x 0,0000000111 = - 999,988889
b 110.000.000 Esperanza = -1000 x 0,9999999909 + 99.000 x 0,0000000091 = - 999,999091
c 110.000.000 Esperanza = -1000 x 0,9999999909 + 24.000 x 0,0000000091 = - 999,999773
d 36.667.000 Esperanza = -1000 x 0,9999999727 + 49.000 x 0,0000000273 = - 999,998636
e 27.500.000 Esperanza = -1000 x 0,9999999636 + 1.500 x 0,0000000364 = - 999,999909
Cálculo de la media y la desviación estándar. Sea x la variable aleatoria que represente el número de niñas en una familia de tres hijos. Construya una tabla que describa la distribución de probabilidad, después calcule la media y la desviación estándar. (Sugerencia: Liste los distintos resultados posibles).
Listado de casos posibles
Hijos (0=niña, 1=niño)
Sexo A B C Niñas Niños
0 0 0 3 0
0 0 1 2 1
0 1 0 2 1
0 1 1 1 2
1 0 0 2 1
1 0 1 1 2
1 1 0 1 2
1 1 1 0 3
Calculo de probabilidades de nacimientos de niñas
x = # niñas Favorables Posibles Probabilidad x.p xx.p
0 1 8 0,125 0 0
1 3 8 0,375 0,375 0,375
2 3 8 0,375 0,75 1,5
3 1 8 0,125 0,375 1,125
Suma de Probabilidades 1 1 1,5 3
Media=Esperanza 1,5 2,25 0,75
Desviación Estándar 0,87
Intervalo de confianza
Valor mínimo -0,23205
Valor máximo 3,23205
¿Es poco común que una familia de tres hijos incluya tres niñas?
De acuerdo a la distribución de probabilidades, la probabilidad de que nazcan 3 niñas es baja. Al menos tan baja como la de que nazcan 3 niños. Sin embargo, no es un suceso infrecuente.
De acuerdo con la regla del intervalo 95% de confianza, dónde una probabilidad es baja cuando esta por debajo del 5%, podemos decir que la probabilidad es baja pero no tan baja como para catalogar esta probabilidad como suceso infrecuente.
Encuestas telefónicas. Con frecuencia se utilizan computadoras para generar dígitos aleatorios de números telefónicos y realizar encuestas. Cada dígito tiene la misma probabilidad de resultar seleccionado. Construya una tabla que represente la distribución de probabilidad de los dígitos seleccionados, calcule la media y la desviación estándar, y describa la forma del histograma de probabilidad.
· Cualquiera sea la cantidad de dígitos, la probabilidad de que salga un numero es siempre la misma.
· Si la cantidad de dígitos es 9 la media será 4,5.
· El histograma de probabilidad será una recta correspondiente a una distribución uniforme.
Bonos especulativos. Kim Hunter tiene $1000 para invertir, y su analista financiero le recomienda dos tipos de bonos especulativos.
· Los bonos A tienen un rendimiento anual del 6%, con una tasa de incumplimiento del 1%.
· Los bonos B tienen un rendimiento anual del 8%, con una tasa de incumplimiento del 5%. (Si el bono incumple, se pierden los $1000).
· ¿Cuál de los dos bonos es mejor? ¿Por qué? ¿Kim debería elegir cualquiera de los dos bonos? ¿Por qué?
Bonos Rendimiento Calculo Costo x P(Perder Rifa) + Beneficio x P(Ganar Rifa) = Resultado
A 0,06 Esperanza = -1000 x 0,01 + 60 x 0,99 = 49,400000
B 0,08 Esperanza = -1000 x 0,05 + 80 x 0,95 = 26,000000
Comparando ambas opciones se ve que A es una mejor opción de inversión porque la esperanza de obtener resultados considerando la probabilidad d éxito de ambas opciones es mejor en la opción A. Esta es la opción que Kim debería elegir.
Partes defectuosas:cálculo de la media y la desviación estándar. Sky Ranch es un proveedor de partes para aeronaves. Sus existencias incluyen 8 altímetros que están correctamente calibrados y 2 qué no lo están. Se seleccionan 3 altímetros al azar y sin reemplazo. Sea x la variable aleatoria que represente el número de aparatos que no están calibrados correctamente. Calcule la media y la desviación estándar de la variable aleatoria x.
Para resolver este problema, primero necesitamos determinar la distribución de la variable aleatoria X, que representa el número de altímetros que no están calibrados correctamente. Dado que se seleccionan 3 altímetros al azar sin reemplazo de un total de 10 (8 calibrados correctamente y 2 no calibrados correctamente), podemos usar la distribución hipergeométrica para encontrar la probabilidad de cada valor posible de X.
La función de probabilidad hipergeométrica es:
P(X=k)=C(m,k)C(N-m, n-k)/C(N,n)
donde:
· N es el tamaño de la población (10 altímetros).
· m es el número de éxitos en la población (2 altímetros no calibrados correctamente).
· n es el número de muestras (3 altímetros).
· k es el número de éxitos en la muestra (variable).,
a. Vamos a calcular las probabilidades para
1. P(X=0) = C(2,0)C(8,3)/C(10,3) = 1 x 56 / 120 = 56/120 = 0,4667
2. P(X=1) = C(2,1)C(8,2)/C(10,3) = 2 x 28 / 120 = 56/120 = 0,4667
3. P(X=2) = C(2,2)C(8,1)/C(10,3) = 1 x 8 / 120 = 8/120 = 0,0667
b. Media μ = ∑ X . P(X) = 0⋅0,4667+1⋅0,4667+2⋅0,0667 = 0,6
c. Varianza = 𝜎^2=∑[𝑥^2. 𝑃(𝑥)]−𝜇^2 ]
a. σ2=0,168012+0,074672+0,130732=0,373416
d. Desvío Estándar = σ=0,373416≈0,6111
Probabilidades binomiales. Al tratar de calcular la probabilidad de obtener exactamente dos 6 al lanzar un dado cinco veces, ¿por qué no es posible obtener la respuesta de la siguiente manera?: Usar la regla de la multiplicación para calcular la probabilidad de obtener dos 6, seguidos por los tres resultados que no son 6, que es (1/6)(1/6)(5/6)(5/6)(5/6)?
1/6 x 1/6 x 5/6 x 5/6 x 5/6 es solo una opción favorable de muchas.
5/6 x 1/6 x 1/6 x 5/6 x 5/6 podría ser otra opción… etc.
Esa opción planteada no es correcta para resolver el problema.
Para resolver el problema lo que hay que hacer es:
Identificar las probabilidades individuales
Probabilidad de obtener un 6 en una tirada: p=1/6.
Probabilidad de no obtener un 6 en una tirada: q=1−p=1 - p = 5/6.
Identificar el número de tiradas y el número de éxitos deseados
Número de tiradas (n): 5.
Número de éxitos deseados (k): 2.
Identificación de distribuciones binomiales. En los ejercicios siguientes, determine si el procedimiento indicado produce una distribución binomial. En los casos en que las distribuciones no sean binomiales, identifique al menos un requisito que no se cumpla.
Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los siguientes requisitos:
1. El procedimiento tiene un número fijo de ensayos.
2. Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las probabilidades de los demás ensayos).
3. Todos los resultados de cada ensayo deben estar clasificados en dos categorías (generalmente llamadas éxito y fracaso).
4. La probabilidad de un éxito permanece igual en todos los ensayos.
Casos y Respuestas:
a. Seleccionar al azar a 12 jueces y registrar su nacionalidad.
a. No. Las nacionalidades pueden estar en varias categorías. Las respuestas de una distribución binomial deben estar en dos categorías excluyentes y complementarias.
b. Encuestar a 12 miembros del jurado y registrar si responden de manera negativa cuando se les pregunta si han sido condenados por un delito
a. Si. Numero fijo de ensayos. Sucesos independientes y complementarios. Los resultados están en dos categorías. La probabilidad de un éxito permanece igual en todos los ensayos.
c. Tratar a 50 fumadores con Nicorette y preguntarles cómo sienten su boca y garganta
a. No. Preguntar como se siente, es una pregunta abierta y su respuesta puede ser no binaria. Es decir, que las respuestas no estarán en dos categorías.
d. Tratar a 50 fumadores con Nicorette y registrar si responden de manera afirmativa cuando se les pregunta si sienten algún malestar en la boca o en la garganta.
a. Si. En este caso la respuesta es binaria: “Si” o “Resto”.
e. Registrar el género de 250 bebés recién nacidos.
a. Si. Si se registran varón/mujer.
f. Registrar el número de hijos en 250 familias
a. No. La respuesta es no binaria. Una familia puede tener 1, 2, 3, 4,… hijos.
g. Encuestar a 250 parejas casadas y registrar si responden de manera afirmativa cuando se les pregunta si tienen hijos
a. Si. La respuesta sí es binaria.
h. Determinar si 500 desfibriladores son aceptables o están defectuosos.
a. Sí. Numero fijo de ensayos. Sucesos independientes y complementarios. Los resultados están en dos categorías. La probabilidad de un éxito permanece igual en todos los ensayos.
Cada pregunta de opción múltiple tiene cinco posibles respuestas(a, b, c, d y e), una de las cuales es la correcta.
Suponga que adivina las respuestas de tres de estas preguntas. Imagine el escenario y escríbalo.
a b c d e
C I I I I
I C I I I
I I C I I
I I I C I
I I I I C
Estamos en presencia de un caso de variaciones sin repetición. Variación porque el orden sí importa y sin repetición porque una vez que se evalúa un elemento con I o C, éste no puede ser re-evaluado.
Cada respuesta tiene una probabilidad de 1/5 de ser acertada (correcta)
Cada respuesta tiene una probabilidad de 4/5 de ser incorrecta.
a. Utilice la regla de la multiplicación para calcular la probabilidad de que las dos primeras conjeturas sean incorrectas y que la tercera sea correcta. Es decir, calcule P(IIC), donde C denota una respuesta correcta e I una incorrecta.
a. a b c d e
b. C I I I I
c. I C I I I
d. I I C I I
e. I I I C I
f. I I I I C
Es la opción d. P(IIC)= 4/5 x 4/5 x 1/5 = 64/125
b. Inicie con IIC y haga una lista completa de los distintos acomodos posibles de dos respuestas incorrectas y una correcta; después calcule la probabilidad de cada dato en la lista.
a. IIC = 4/5 x 4/5 x 1/5 = 64/125
b. ICI = 4/5 x 4/5 x 1/5 = 64/125
c. CII = 4/5 x 4/5 x 1/5 = 64/125
c. Con base en los resultados anteriores, ¿cuál es la probabilidad de tener exactamente una respuesta correcta cuando se hacen tres conjeturas?
a. Supongamos 3 conjeturas: 1, 2, y 3.
i. 1 2 3
ii. I I I
iii. I I C
iv. I C I
v. I C C
vi. C I I
vii. C I C
viii. C C I
ix. C C C
b. Una respuesta correcta en 3 conjeturas implica:
i. Sucesos favorables: 3
ii. Sucesos posibles: 8
iii. Probabilidad = 3/ 8 = 0,375
Distribución Binomial: Las probabilidades se obtuvieron al introducir los valores de n= 6 y p = 0.167. En una prueba del fármaco Lipitor, el 16.7% de los sujetos tratados con 10 mg de atorvastatin tuvieron dolor de cabeza (según datos de Parke-Davis). En cada caso, suponga que se selecciona a 6 sujetos al azar, los cuales fueron tratados con 10 mg de atorvastatin, y calcule la probabilidad indicada.
Calcule las probabilidades de que de 1 a 6 sujetos tengan dolor de cabeza.
Analice la distribución de probabilidades.
Determine la media, desviación y el intervalo de confianza.
Saque conclusiones.
# Definición de parámetros del problema
n = 6 # Número de integrantes del jurado
p = 0.167 # Probabilidad de ser seleccionado
x = x varia de 0 a 6
p x.p xx.p p-acu p-acr
x
0 0.334 0.000 0.000 0.334 1.000
1 0.402 0.402 0.402 0.736 0.666
2 0.201 0.403 0.806 0.937 0.264
3 0.054 0.162 0.485 0.991 0.063
4 0.008 0.032 0.130 0.999 0.009
5 0.001 0.003 0.016 1.000 0.001
6 0.000 0.000 0.001 1.000 0.000
Estadísticos:
Sumatoria de probabilidades: 1.0
Media y Esperanza : 1.002
Varianza : 0.835
Desviación Estandard : 0.914
Revisión de estadísticos por scipy:
mean: 1.00, var: 0.83, skew: 0.73, kurt: 0.20.
Observaciones:
+El numero de personas con dolor esperable es 1. (Esperanza: 1,002)
+La distribución está sesgada a la derecha (sesgo positivo):
+La probabilidad de personas con dolo disminuye cuanto mayor es la cantidad de personas evaludadas.
+La desviación estandar indica que el desvío maximo es una persona es decir a lo sumo habrán entre cero y dos personas con dolor de cabeza.
Intervalo de confianza:
Valor mínimo más común: -0.83 y Valor máximo más común: 2.83
Los valores más probables de x están entre -0.83 y 2.83
El valor más esperable es: 1.00
El intevalo de confianza refleja que:
+Es esperable que las personas con dolor de cabeza estén entre 0 y 3 personas máximo.
+El 95% de los resultados más probables se encuentra sesgado a la izquierda:
+Es más probable que exista una mayoría personas sin dolor de cabeza.
+Es poco probable que este tipo medicina provoque dolor de cabeza. Pero es probable!
+El 5% de los resultados menos probables se encuentra a la derecha:
+Para mas de 4 personas o mas, la probabilidad decrece significativamente (p-acr).
+Es difícil que por azar existan 4 personas o más con dolor de cabeza.
**Resultados infrecuentes:**
+La regla del intervalo nos dice que los resultados infrecuentes son aquellos con una probabilidad acumulada menor al 5%.
+Se utiliza la probabilidad acumulada porque aunque los resultados son muy poco probables, siguen teniendo una probabilidad.
+Estamos hablando de una baja probabilidad de 4 o 5 o 6 de un grupo de 6 personas puedan tener dolor de cabeza.
+La probabilidad acumulada (['p-acu'] ) aumenta pero es solo 2% para 6 o menos miembros.
+Esta probabilidad se hace significativa (> 5% cuando x < 3)
+La probabilidad acumulada invertida (['p-acu']) disminuye abruptamente a partir de 4 personas.
+Se ve como al llegar a 3 miembros ya se cubre el 95% de los casos más probables.
### Analisis de riesgo
#### ¿4 personas o más con dolor implica riesgos de efectos no deseados?
+¿Que la probabilidad de provocar dolor sea significativa hasta 3 personas implica riesgo?
+¿Que la probabilidad de provocar dolor en 4 o más personas sea infrecuente significa que no hay riesgo?
p p-acr Miembros
x
0 0.334 1.000 esperable
1 0.402 0.666 esperable
2 0.201 0.264 esperable
3 0.054 0.063 esperable
4 0.008 0.009 infrecuente
5 0.001 0.001 infrecuente
6 0.000 0.000 infrecuente
**Observación**
Como se ve en la tabla y en la grafica la cantindad de personas con dolor esperable es no mayor a 3:
+Si nos remitimos a la tabla obtenemos el siguiente resultado:
+P(3 o menos personas con dolor de cabeza de un total de 6) =
+P(3 o 2 o 1 o 0) = 0.063
+P(3) + P(2) + P(1) + P(0) = 1 - P(4) + P(5) + P(6)
+1 + 0.666 + 0.264 + 0.001 + 0 + 0 + 0 + 0 =
+P(3 o menos personas con dolor de cabeza de un total de 6) = **0.063**
**Interpretación**
+ **3** miembros es una cantidad esperable de miembros y no es un número excepcionalmente bajo.
+Una selección y composición con 3 miembros como esta, **no implica necesariamente un medicamento con efectos no deseados**.
+Una selección y composición con 3 miembros como esta, **si implica un riesgo para la salud que amerite evitar este medicamento**.
Calcule la probabilidad de que al menos 5 sujetos tengan dolor de cabeza
· Probabilidad de al menos 5 sujetos con dolor de cabeza: 1.0
· Esta probabilidad debe coincidir con la que se calculó al construir la tabla.
Encuestas a televidentes. El programa de televisión 60 minutos, de la CBS, ha sido exitoso por muchos años. Recientemente tuvo un índice de audiencia de 20, lo que significa que de todos los televisores encendidos, el 20% estaban sintonizados en 60 minutos (según datos de Nielsen Media Research). Suponga que un anunciante desea verificar ese valor del 20% realizando su propia encuesta, y que inicia una encuesta piloto con 10 hogares que tienen el televisor encendido en el momento en que se transmite el programa 60 minutos.
# Definición de parámetros del problema
n = 10 # Número de integrantes del jurado
p = 0.2 # Probabilidad de ser seleccionado
x =[ x for x in range(n+1)] # x varia de 0 a 6
p x.p xx.p p-acu p-acr
x
0 0.107 0.000 0.000 0.107 1.000
1 0.268 0.268 0.268 0.376 0.893
2 0.302 0.604 1.208 0.678 0.624
3 0.201 0.604 1.812 0.879 0.322
4 0.088 0.352 1.409 0.967 0.121
5 0.026 0.132 0.661 0.994 0.033
6 0.006 0.033 0.198 0.999 0.006
7 0.001 0.006 0.039 1.000 0.001
8 0.000 0.001 0.005 1.000 0.000
9 0.000 0.000 0.000 1.000 0.000
10 0.000 0.000 0.000 1.000 0.000
Estadísticos:
Sumatoria de probabilidades: 0.9999999999999999
Media y Esperanza : 1.999999999999999
Varianza : 1.600
Desviación Estandard : 1.265
Revisión de estadísticos por scipy:
mean: 2.00, var: 1.60, skew: 0.47, kurt: 0.02.
Observaciones:
+ El numero de personas, mirando el programa, esperable es 1. (Esperanza: 1.999999999999999)
+ La distribución está sesgada a la derecha (sesgo positivo):
+La probabilidad de personas, mirando el programa, disminuye cuanto mayor es la cantidad de personas evaludadas.
+El desvío es una persona (1.25) es decir a lo sumo habrán entre una y tres personas mirando el programa.
Intervalo de confianza:
media: 2.00, desv.std.: 1.26, 2 x desv.: 2.53.
Valor mínimo más común: -0.53 y Valor máximo más común: 4.53
Los valores más probables de x están entre -0.53 y 4.53
El valor más esperable es: 2.00
**Interpretación:**El intevalo de confianza refleja que:
+ Es esperable que las personas mirando el progrma estén entre 1 y 4 personas.
+El 95% de los resultados más probables se encuentra sesgado a la derecha (sesgo positivo):
+Es más probable que existan pocas personas mirando dentro de la muestra que muchas.
+Es poco probable que muchas personas estén mirando el programa de las 10 de la muestra.
+El 5% de los resultados menos probables se encuentra a la derecha:
+Para mas de 5 personas o mas, la probabilidad decrece significativamente (p-acr).
+Es difícil que por azar existan 5 o más personas mirando el programa
Resultados infrecuentes
+ Uso de las probabilidades para determinar resultados infrecuentes
+Número de éxitos inusualmente alto: x éxitos en n ensayos es un número inusualmente alto de éxitos si P(x o más) 0.05.*
+Número de éxitos inusualmente bajo: x éxitos en n ensayos es un número inusualmente bajo de éxitos si P(x o menos) 0.05.*
+ *El valor de 0.05 se utiliza de forma regular (coincide con el intervalo de confianza 95%), pero no es absolutamente rígido.
+Se podrían usar otros valores, como 0.01, para distinguir entre sucesos que pueden ocurrir con facilidad por azar y sucesos que tienen muy pocas probabilidades de ocurrir por azar.
Resultados infrecuentes:**
+ La regla del intervalo nos dice que los resultados infrecuentes son aquellos con una probabilidad acumulada menor al 5%.
+ Se utiliza la probabilidad acumulada porque aunque los resultados son muy poco probables, siguen teniendo una probabilidad.
+Estamos hablando de una baja probabilidad de 5 o 6 o 7 o 8 o 9 o 10 de un grupo de 10 personas veam el programa.
+La probabilidad acumulada (['p-acu'] ) aumenta mucho al principio pero casi nada al pasar 4 personas.
+Esta probabilidad se hace significativa (> 5% cuando x < 5)
+La probabilidad acumulada invertida (['p-acr']) aumenta abruptamente a partir de 4 personas (desde 10 a 0).
+Se ve como al llegar a 4 hogares ya se cubre el 95% de los casos más probables.
a. Calcule la probabilidad de que ninguno de los hogares esté sintonizando 60 minutos.
Probabilidad de al menos 0 sujetos: 0.10737418240000006
Esta probabilidad debe coincidir con la que se calculó al construir la tabla.
b. Calcule la probabilidad de que a lo sumo uno de los hogares esté sintonizando 60 minutos.
Probabilidad de a lo sumo 1 sujeto: 0.37580963840000003
Esta probabilidad debe coincidir con la que se calculó al construir la tabla.
c. Calcule la probabilidad de que al menos uno de los hogares esté sintonizando el programa.
Probabilidad de al menos 1 sujeto: 0.8926258175999997
Esta probabilidad debe coincidir con la que se calculó al construir la tabla.
c. Si a lo sumo un hogar está sintonizando 60 minutos, ¿será incorrecto el valor de un índice de audiencia del 20%? ¿Por qué?
No. No sería incorrecto porque el valor esperado es 2 y allí está el valor máximo de probabilidad.
Auditorías de la IRS. La Hemingway Financial Company prepara devoluciones de impuestos para individuos. (Su lema: “También escribimos extraordinarias novelas de ficción”.). Según el Internal Revenue Service, los individuos que ganan entre $25,000 y $50,000 se auditan en una proporción del 1%. La Hemingway Company prepara cinco devoluciones de impuestos para individuos que están en esa categoría de impuestos, y se audita a tres de ellos.
a. Calcule la probabilidad de que, cuando se seleccione al azar a cinco personas que ganan entre $25,000 y $50,000, se audite exactamente a tres de ellas.
b. Calcule la probabilidad de que se audite al menos a tres.
c. Con base en los resultados anteriores, ¿qué se puede concluir acerca de los clientes de Hemingway? ¿Sólo son desafortunados o están siendo blanco de las auditorías?