
















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Tecnicas de reserca, Profesor: Antoni Cosculluela, Carrera: Psicologia, Universidad: UB
Tipo: Apuntes
1 / 24
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!

















Proyecto e-Math 1
Autores: Angel Juan ( [email protected] ), Máximo Sedano ( [email protected] ) , Alicia Vila
( [email protected]), José Francisco Martínez ( [email protected] ), Anna López
MODELOS DE PROBABILIDAD
Proyecto e-Math 2
Este math-block pretende introducir al concepto de distribución de probabilidad como el rango de sucesos susceptibles de ocurrir al realizar un determinado experimento (cuán probable es que ocurra un determinado suceso perteneciente a un experimento concreto).
Así, veremos cómo aplicar esta idea a los tipos de distribución más utilizadas como son la Distribución Binomial, la Distribución de Poisson y la Distribución Normal.
También veremos cómo utillizar estas distribuciones de probabilidad en casos prácticos resueltos con Minitab.
Sería conveniente tener presente el math-block “Estadística Descriptiva con Minitab” para tener asimilados los conceptos básicos referentes a los parámetros estadísticos fundamentales, así como el documento asociado al uso del Minitab.
Proyecto e-Math 4
una variable aleatoria continua X la función de densidad f(x) asociada a una variable aleatoria continua X caracteriza la función de distribución de probabilidad de X donde:
−∞
a
Como sabemos, la media nos da información acerca de la tendencia central de los datos y la varianza describe la dispersión de éstos.
La media es el valor promedio ponderado en el que los valores posibles de la variable aleatoria se ponderan según las probabilidades correspondientes de ocurrencia, también se denomina valor esperado E(X). Para una variable aleatoria discreta:
donde P(x) es la probabilidad de valores posibles de la variable aleatoria x. Es decir, se multiplica cada valor de x por la probabilidad de que ocurra, y luego se suman estos productos. Para una variable aleatoria continua:
+∞
−∞
La varianza describirá la dispersión de la distribución. Para una variable aleatoria discreta:
σ^2 = (^) ∑ [( x − μ)^2 P ( x )] Para una variable aleatoria continua:
+∞
−∞
varianza.
Consideremos una variable aleatoria X que da el número de éxitos que aparecen al repetir n veces de forma independiente un experimento en idénticas condiciones. En esta situación diremos que X sigue una distribución Binomial.
Ejemplos: X= número de huevos defectuosos en un paquete de 12. Y= número de 2 al tirar 10 veces un dado.
Las características principales de este modelo de distribución son:
Proyecto e-Math 5
En tales condiciones, diremos que la v.a. X = “nº de éxitos en las n pruebas” sigue una
Observamos que la v.a. X sólo puede tomar los valores 0, 1, 2, 3, … , n siendo por tanto una v.a. discreta.
Así pues, las funciones de probabilidad y de distribución de una distribución binomial son las siguientes:
donde
y
=
n
i
0
De la misma manera, la media y la desviación estándar de una distribución binomial son:
La distribución de Bernoulli es un caso particular de la binomial cuando n=.
Veamos unos ejemplos que muestran cómo aplicar la distribución Binomial:
Ejemplos:
Si el distribuidor francés contacta con 5 consorcios:
a) ¿Cuál es la probabilidad de que el distribuidor francés consiga a lo sumo 2 acuerdos de distribución?
Sea X=”Número de acuerdos de distribución del distribuidor francés a 5 consorcios”
p = probabilidad de éxito = P(cerrar un acuerdo) = 0, n = número de clientes = 5
X sigue una distribución Binomial, X ∼ B(5 , 0,2)
Nuestro objetivo es calcular P(X < = 2).
P(X<=2) = P(X=2)+P(X=1)+P(X=0)=0,
Proyecto e-Math 7
Para calcular cual será el número de socios medio esperado que se incorpore al proyecto calculamos la media de una distribución Binomial que nos da el número medio de éxitos, en este caso sería, np= 180,6=10,8 que redondeando sería 11. Por tanto, el número medio esperado de socios que se incorporen al proyecto será de 11.
Ejemplos con Minitab:
Veamos cómo podemos calcular la función de probabilidad de esta v.a.:
En primer lugar, en la columna C1 colocaremos los posibles valores que esta v.a. puede tomar, i.e., 0, 1, 2, 3 y 4.
Seleccionamos Calc > Probability Distributions > Binomial y completamos los campos como se indica en la imagen inferior:
Probability Density Function
Binomial with n = 4 and p = 0,
x P( X = x) 0,00 0, 1,00 0, 2,00 0, 3,00 0, 4,00 0,
Análogamente, el siguiente ejemplo nos muestra cómo calcular la función de distribución:
Proyecto e-Math 8
Queremos calcular la probabilidad de que X tome un valor menor o igual a 11, i.e., P(X<=11):
Seleccionamos Calc > Probability Distributions > Binomial y completamos los campos como se indica en la imagen inferior:
El resultado es el siguiente:
Cumulative Distribution Function
Binomial with n = 20 and p = 0,
x P( X <= x) 11,00 0,
Por tanto, P(X<=11)=0.
Veamos un ejemplo de cómo aplicar la función de distribución inversa:
Seleccionar Calc > Probability Distributions > Binomial y completamos los campos como se indica en la imagen inferior:
Proyecto e-Math 10
Cumulative Distribution Function
Binomial with n = 10 and p = 0.
x P( X <= x) 2.00 0.
Por tanto, la probabilidad de que menos de 2 vuelos se retrasen es de aproximadamente el 0.53.
Consideremos X una variable que da el número de individuos que presentan una cierta característica por unidad de tiempo, volumen, superficie,… Entonces diremos que X sigue una distribución de Poisson.
Ejemplos: X= Número de coches que cruzan un cruce en una hora. Y= Número de enfermos de Sida por año y por Comunidad Autónoma.
La función de probabilidad de la distribución de Poisson es:
λ x −^ λ
superficie, .. e es la constante exponencial y x es el número de ocurrencias (éxitos).
variables con distribuciónde Poisson. Otra característica de la Poisson es que su media es igual a su varianza y ambas son igual al
Observamos además que una variable con distribución Poisson toma infinitos valores, 0,1,… Ahora bien, las probabilidades van disminuyendo cada vez más rápidamente cuando el valor es alto, haciéndose prácticamente nulas a partir de un valor. Por esto muchas veces la distribución de Poisson también se la llama distribución de los sucesos “raros” o poco probables.
Una distribución Binomial con una probabilidad de éxito p muy pequeña y n grande se aproxima a una distribución de Poisson con λ= n*p. Algunas referencias utilizan esta aproximación cuando n>30 y p>0.1 y/o np<5.
Veamos un ejemplo que muestra cómo aplicar la distribución de Poisson haciendo uso de Minitab:
Ejemplo con Minitab:
Siguiendo con el ejemplo anterior, supongamos que tomamos una muestra aleatoria de 1000 vuelos y observamos que se perdieron 240 maletas. Esto indica que el número medio de maletas perdidas por vuelo es 0.24. Si el número de maletas perdidas por vuelo sigue una distribución de Poisson de media 0.24, ¿cuál es la probabilidad de no perder ninguna maleta?
Sea X = ”número de maletas perdidas” y sabemos que X ∼ Po(0.24)
Proyecto e-Math 11
Seleccionamos Calc > Probability Distributions > Poisson y obtenemos :
Probability Density Function
Poisson with mu = 0.
x P( X = x) 0.00 0.
Por tanto, se espera que aproximadamente el 79% de los vuelos no tengan ningún problema con la pérdida de equipaje.
La distribución normal es la distribución de probabilidad continua más importante. Multitud de variables aleatorias continuas siguen una distribución normal o aproximadamente normal. Una de sus características más importantes es que cualquier distribución de probabilidad, tanto discreta como continua, se puede aproximar por una normal bajo ciertas condiciones.
La distribución de probabilidad normal y la curva normal que la representa, tienen las siguientes características:
La curva normal es simétrica
colas
media=mediana=moda
Proyecto e-Math 13
expresión anterior, es posible encontrar el área de probabilidad bajo cualquier curva normal haciendo referencia a la distribución normal estándar en las tablas correspondientes.
Así pues, para averiguar el área encerrada bajo la curva utilizaremos la tabla que encontraremos al final de este apartado. Dicha tabla nos proporciona la probabilidad de que la v.a. normal estándar Z tome un valor situado a la izquierda de un número c , i.e.: P(Z<c). En
Distribución muestral de la media de las muestras:
Consistiría en una distribución de probabilidad de todas las medias posibles de las muestras de un tamaño de muestra dado.
Así pues, dada una población (a la cual representaremos por la v.a. X ), podemos extraer de la misma k muestras, cada una de ellas de tamaño n. Para cada una de las k muestras podemos calcular un estadístico, p.e., la media de las n observaciones que la componen.
Una de las propiedades más importantes es la siguiente:
Teorema (Distribución de las Medias Muestrales):
o Si consideramos todas las muestras aleatorias posibles, cada una de ellas de
x
Si el tamaño muestral n es “suficientemente grande” (en la práctica suele valer n>30 ), la distribución de las medias muestrales se aproxima a la de una normal, i.e.:
σ
La importancia del TCL radica en que sea cuál sea la distribución de la población original (v.a. X ), conforme el tamaño de las muestras ( n ) aumenta, la distribución de las medias se va aproximando a la de una normal (de la cual conocemos muchas propiedades). Así, si la población tiene una distribución de probabilidad normal, entonces, para cualquier tamaño de muestra la distribución del muestreode la media también tendrá una distribución normal. Si la distribución de la población es simétrica (pero no normal), se verá que surge la forma normal como lo establece el TCL aún con muestras de al menos 30 para observar las características de normalidad.
Proyecto e-Math 14
será tanto mejor cuanto mayor sea n.
Hay que tener en cuenta que, antes de aplicar la distribución normal, es necesario asegurarse de que la distribución que queremos aproximar es, efectivamente, binomial.
Para ello, hay que comprobar:
En el caso de una v.a. discreta, tiene sentido preguntarse por la probabilidad de que ésta tome un determinado valor. Sin embargo, si consideramos que la v.a. X es continua,
corrección por continuidad que veremos a continuación, es decir, en el caso anterior calcularemos P(a-0,5<X<a+0,5).
Ejemplos:
Por el teorema del Límite central, como n=40 y es mayor que 30 podemos afirmar que la distribución muestral de la media de los PER se aproximará a una distribución normal.
n
Por lo tanto existe una probabilidad del 1,74% de que la media de los PER de la muestra sea menor que 9.
Proyecto e-Math 16
Cumulative Distribution Function
Normal with mean = 406,150 and standard deviation = 5,
x P( X <= x) 400,0000 0,
Por lo tanto existe una probabilidad del 13;39 % de que el salario medio se menor de
La probabilidad de que la media de la muestra esté entre 400 y 410 €.
probabilidades ya la hemos calculado en el apartado anterior.
Para calcular la primera se razona análogamente, obteniendo que:
Cumulative Distribution Function
Normal with mean = 406,150 and standard deviation = 5,
x P( X <= x) 410,0000 0,
probabilidad, lo cual haremos de forma análoga a los apartados anteriores.
Obtendremos lo siguiente:
Cumulative Distribution Function
Proyecto e-Math 17
Normal with mean = 406,150 and standard deviation = 5,
x P( X <= x) 415,0000 0,
Seleccionamos nuevamente: Calc > Probability Distributions > Normal , pero ahora elegiremos la opción Inverse Cumulative Probability , con lo que obtendremos :
Inverse Cumulative Distribution Function
Normal with mean = 406,150 and standard deviation = 5,
P( X <= x) x 0,9500 415,
NOTA.- En la siguiente dirección: http://huizen.dds.nl/~berrie/ encontraréis algunos vídeos que ilustran las distintas distribuciones que se han descrito en este apartado.
a) La probabilidad de afrontar más de 3 siniestros en el año.
Sea X=”Número de siniestros” Como el número de pruebas es muy grande y la probabilidad de éxito es muy pequeña, vemos que X sigue una distribución de Poisson, donde μ=2000.2/1000, es decir, X∼Po(4)
Para calcular la probabilidad de P(X>3), seleccionamos Calc > Probability Distributions > Poisson :
Cumulative Distribution Function
Poisson with mu = 4.
x P( X <= x) 3.00 0.
Por tanto, P(X>3) = 1 - P(X<3) = 1- 0.433 = 0.
b) La reserva que ha guardado la compañía para los siniestros del año, nos asegura que tiene una probabilidad del 99,2% de poder afrontar todos los siniestros que ocurran.
Proyecto e-Math 19
Cumulative Distribution Function
Normal with mean = 38.4000 and standard deviation = 3.
x P( X <= x) 44.0000 0.
c) Si queremos conseguir que un porcentaje de un 90%, ¿qué número de usuarios necesitaríamos?
Seleccionamos Calc > Probability Distributions > Normal :
Inverse Cumulative Distribution Function
Normal with mean = 38.4000 and standard deviation = 3.
P( X <= x) x 0.9000 43.
Así, pues, haría falta unos 43 catalanes para llegar al porcentaje del 90%
a) ¿Cuál es la probabilidad de que, en la muestra, aparezcan exactamente 47 personas favorables al Ayuntamiento?
Sea X=”Número de personas favorables al Ayuntamiento ”
Además, X seguirá una distribución binomial con n=100 y cuya probabilidad de éxito será 0.47, es decir, X ∼ B(100,0.47)
Para calcular P(X=47), seleccionaremos Calc > Probability Distribution > Binomial :
Proyecto e-Math 20
Y obtenemos....
Probability Density Function
Binomial with n = 100 and p = 0.
x P( X = x) 47.00 0.
La probabilidad de que haya exactamente 47 personas que estén a favor del alcalde es 0.08, es decir, el 8%
b) ¿Cuál es la probabilidad de que entre 45 y 50 personas (incluidos estos valores), se muestren a favor de las gestiones del Ayuntamiento?
Queremos calcular P(45<=X<=50), es decir, P(X<=50)-P(X<=45)
Para ello, seleccionamos Calc > Probability Distributions > Binomial , activando la opción Cumulative Probability :