Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Tema 4: Modelos de probabilidad., Apuntes de Psicología

Asignatura: Tecnicas de reserca, Profesor: Antoni Cosculluela, Carrera: Psicologia, Universidad: UB

Tipo: Apuntes

2012/2013

Subido el 06/11/2013

suckitandsee-2
suckitandsee-2 🇪🇸

3.9

(104)

57 documentos

1 / 24

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Modelos de probabilidad
Proyecto e-Math 1
Financiado por la Secretaría de Estado de Educación y Universidades (MECD)
MODELOS DE PROBABILIDAD
Autores: Angel Juan ([email protected]), Máximo Sedano ([email protected]) , Alicia Vila
([email protected]), José Francisco Martínez ([email protected]), Anna López
MAPA CONCEPTUAL ________________________
MODELOS DE
PROBABILIDAD
VARIABLES ALEATORIAS
V.A.DISCRETAS
V.A. CONTINUAS
DISTRIBUCIÓN DE
PROBABILIDAD
MEDIA, VARIANZA Y
DESV. ESTÁNDAR DE
UNA DISTR. PROB
LA DISTRIBUCIÓN BINOMIAL
CASOS PRÁCTICOS CON
MINITAB
LA DISTRIBUCIÓN DE POISON
LA DISTRIBUCIÓN NORMAL
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18

Vista previa parcial del texto

¡Descarga Tema 4: Modelos de probabilidad. y más Apuntes en PDF de Psicología solo en Docsity!

Proyecto e-Math 1

MODELOS DE PROBABILIDAD

Autores: Angel Juan ( [email protected] ), Máximo Sedano ( [email protected] ) , Alicia Vila

( [email protected]), José Francisco Martínez ( [email protected] ), Anna López

( [email protected] )

MAPA CONCEPTUAL ________________________

MODELOS DE PROBABILIDAD

VARIABLES ALEATORIAS
V.A.DISCRETAS
V.A. CONTINUAS
DISTRIBUCIÓN DE
PROBABILIDAD
MEDIA, VARIANZA Y
DESV. ESTÁNDAR DE
UNA DISTR. PROB
LA DISTRIBUCIÓN BINOMIAL
CASOS PRÁCTICOS CON
MINITAB
LA DISTRIBUCIÓN DE POISON
LA DISTRIBUCIÓN NORMAL

Proyecto e-Math 2

INTRODUCCIÓN ___________________

Este math-block pretende introducir al concepto de distribución de probabilidad como el rango de sucesos susceptibles de ocurrir al realizar un determinado experimento (cuán probable es que ocurra un determinado suceso perteneciente a un experimento concreto).

Así, veremos cómo aplicar esta idea a los tipos de distribución más utilizadas como son la Distribución Binomial, la Distribución de Poisson y la Distribución Normal.

También veremos cómo utillizar estas distribuciones de probabilidad en casos prácticos resueltos con Minitab.

OBJETIVOS ________________________

  • Definir los términos distribución de probabilidad y variable aleatoria
  • Distinguir entre distribuciones de probabilidad discretas y continuas
  • Calcular la media, varianza y desviación estándar de una distribución de probabilidad
  • Describir las características de la distribución Binomial y entender su aplicación en casos prácticos
  • Describir las características de la distribución de Poisson y entender su aplicación en casos prácticos
  • Describir las características de la distribución normal y entender su aplicación en casos prácticos
  • Utilizar la distribución normal para aproximar la distribución de probabilidad Binomial

CONOCIMIENTOS PREVIOS ___________________________________

Sería conveniente tener presente el math-block “Estadística Descriptiva con Minitab” para tener asimilados los conceptos básicos referentes a los parámetros estadísticos fundamentales, así como el documento asociado al uso del Minitab.

Proyecto e-Math 4

De este modo: F(a) = P(X ≤ a) es igual a la suma de todos los P(X=xi) tales que xi son

menores que a.

‰ Definición de función de densidad para una variable aleatoria continua: Dada

una variable aleatoria continua X la función de densidad f(x) asociada a una variable aleatoria continua X caracteriza la función de distribución de probabilidad de X donde:

−∞

a

F ( a ) P ( X a ) f ( x ) dx

‰ La media, la varianza y la desviación estándar.

Como sabemos, la media nos da información acerca de la tendencia central de los datos y la varianza describe la dispersión de éstos.

A la media de la distribución la denotaremos por μ , y a la desviación estándar por σ.

La media es el valor promedio ponderado en el que los valores posibles de la variable aleatoria se ponderan según las probabilidades correspondientes de ocurrencia, también se denomina valor esperado E(X). Para una variable aleatoria discreta:

μ= E ( X )=∑ [ xP ( x )]

donde P(x) es la probabilidad de valores posibles de la variable aleatoria x. Es decir, se multiplica cada valor de x por la probabilidad de que ocurra, y luego se suman estos productos. Para una variable aleatoria continua:

[ ] ∫

+∞

−∞

μ= E X = x f ( x ) dx

La varianza describirá la dispersión de la distribución. Para una variable aleatoria discreta:

σ^2 = (^) ∑ [( x − μ)^2 P ( x )] Para una variable aleatoria continua:

+∞

−∞

σ^2 = x^2 f ( x ) dx

Óbviamente, la desviación estándar σ la calcularemos al extraer la raíz cuadrada de la

varianza.

‰ La distribución Binomial.

Consideremos una variable aleatoria X que da el número de éxitos que aparecen al repetir n veces de forma independiente un experimento en idénticas condiciones. En esta situación diremos que X sigue una distribución Binomial.

Ejemplos: X= número de huevos defectuosos en un paquete de 12. Y= número de 2 al tirar 10 veces un dado.

Las características principales de este modelo de distribución son:

  1. Repetir n pruebas independientes unas de otras.

Proyecto e-Math 5

  1. Para cada una de las pruebas sólo pueden darse dos resultados: éxito o fracaso
  2. La probabilidad de éxito en cada prueba es de p.

En tales condiciones, diremos que la v.a. X = “nº de éxitos en las n pruebas” sigue una

distribución Binomial de parámetros n y p , y lo escribiremos como X ∼ B(n,p).

Observamos que la v.a. X sólo puede tomar los valores 0, 1, 2, 3, … , n siendo por tanto una v.a. discreta.

Así pues, las funciones de probabilidad y de distribución de una distribución binomial son las siguientes:

px^ p n^ x

x

n

f x P X x  − −

( )= ( = )= ( 1 ) para x=0,1,2,3….n

donde

x n x

n

x

n

y

=

n

i

F x P X x P X i

0

De la misma manera, la media y la desviación estándar de una distribución binomial son:

μ = n * p , σ= n * p *( 1 − p )

La distribución de Bernoulli es un caso particular de la binomial cuando n=.

Veamos unos ejemplos que muestran cómo aplicar la distribución Binomial:

Ejemplos:

  1. Una empresa industrial que fabrica componentes mecánicos para aviones dispone de dos distribuidores por Europa, uno situado en Francia y otro en Alemania. Ambos tienen el 20% de posibilidades de cerrar un pedido con un consorcio industrial de farbicación de aviones.

Si el distribuidor francés contacta con 5 consorcios:

a) ¿Cuál es la probabilidad de que el distribuidor francés consiga a lo sumo 2 acuerdos de distribución?

Sea X=”Número de acuerdos de distribución del distribuidor francés a 5 consorcios”

p = probabilidad de éxito = P(cerrar un acuerdo) = 0, n = número de clientes = 5

X sigue una distribución Binomial, X ∼ B(5 , 0,2)

Nuestro objetivo es calcular P(X < = 2).

P(X<=2) = P(X=2)+P(X=1)+P(X=0)=0,

Proyecto e-Math 7

Para calcular cual será el número de socios medio esperado que se incorpore al proyecto calculamos la media de una distribución Binomial que nos da el número medio de éxitos, en este caso sería, np= 180,6=10,8 que redondeando sería 11. Por tanto, el número medio esperado de socios que se incorporen al proyecto será de 11.

Ejemplos con Minitab:

  1. Supongamos que X es una variable aleatoria (v.a.) que sigue una distribución binomial de parámetros n = 4 y p = 0,.

Veamos cómo podemos calcular la función de probabilidad de esta v.a.:

En primer lugar, en la columna C1 colocaremos los posibles valores que esta v.a. puede tomar, i.e., 0, 1, 2, 3 y 4.

Seleccionamos Calc > Probability Distributions > Binomial y completamos los campos como se indica en la imagen inferior:

Probability Density Function

Binomial with n = 4 and p = 0,

x P( X = x) 0,00 0, 1,00 0, 2,00 0, 3,00 0, 4,00 0,

Análogamente, el siguiente ejemplo nos muestra cómo calcular la función de distribución:

  1. Supongamos que X sigue una distribución Binomial de n=20 y cuya probabilidad de

éxito es 0.3333, es decir X ∼ B(20 , 0,3333).

Proyecto e-Math 8

Queremos calcular la probabilidad de que X tome un valor menor o igual a 11, i.e., P(X<=11):

Seleccionamos Calc > Probability Distributions > Binomial y completamos los campos como se indica en la imagen inferior:

El resultado es el siguiente:

Cumulative Distribution Function

Binomial with n = 20 and p = 0,

x P( X <= x) 11,00 0,

Por tanto, P(X<=11)=0.

Veamos un ejemplo de cómo aplicar la función de distribución inversa:

3. Sea X ∼ B(5,0,4). En esta ocasión, queremos saber cuál será el valor c de X tal que

P(X ≤ c) = 0,913 :

Seleccionar Calc > Probability Distributions > Binomial y completamos los campos como se indica en la imagen inferior:

Proyecto e-Math 10

Cumulative Distribution Function

Binomial with n = 10 and p = 0.

x P( X <= x) 2.00 0.

Por tanto, la probabilidad de que menos de 2 vuelos se retrasen es de aproximadamente el 0.53.

‰ La distribución de Poisson

Consideremos X una variable que da el número de individuos que presentan una cierta característica por unidad de tiempo, volumen, superficie,… Entonces diremos que X sigue una distribución de Poisson.

Ejemplos: X= Número de coches que cruzan un cruce en una hora. Y= Número de enfermos de Sida por año y por Comunidad Autónoma.

La función de probabilidad de la distribución de Poisson es:

x

e

Px

λ x −^ λ

= para x=0,1,2,3,….

donde λ es el número medio de ocurrencias durante un intervalo específico de tiempo,

superficie, .. e es la constante exponencial y x es el número de ocurrencias (éxitos).

Observamos de la expresión de la función de probabilidad que el parámetro λ caracteriza las

variables con distribuciónde Poisson. Otra característica de la Poisson es que su media es igual a su varianza y ambas son igual al

parámetro λ :

Observamos además que una variable con distribución Poisson toma infinitos valores, 0,1,… Ahora bien, las probabilidades van disminuyendo cada vez más rápidamente cuando el valor es alto, haciéndose prácticamente nulas a partir de un valor. Por esto muchas veces la distribución de Poisson también se la llama distribución de los sucesos “raros” o poco probables.

Aproximación de la Binomial a la Poisson.

Una distribución Binomial con una probabilidad de éxito p muy pequeña y n grande se aproxima a una distribución de Poisson con λ= n*p. Algunas referencias utilizan esta aproximación cuando n>30 y p>0.1 y/o np<5.

Veamos un ejemplo que muestra cómo aplicar la distribución de Poisson haciendo uso de Minitab:

Ejemplo con Minitab:

Siguiendo con el ejemplo anterior, supongamos que tomamos una muestra aleatoria de 1000 vuelos y observamos que se perdieron 240 maletas. Esto indica que el número medio de maletas perdidas por vuelo es 0.24. Si el número de maletas perdidas por vuelo sigue una distribución de Poisson de media 0.24, ¿cuál es la probabilidad de no perder ninguna maleta?

Sea X = ”número de maletas perdidas” y sabemos que X ∼ Po(0.24)

Proyecto e-Math 11

Seleccionamos Calc > Probability Distributions > Poisson y obtenemos :

Probability Density Function

Poisson with mu = 0.

x P( X = x) 0.00 0.

Por tanto, se espera que aproximadamente el 79% de los vuelos no tengan ningún problema con la pérdida de equipaje.

‰ La distribución normal

La distribución normal es la distribución de probabilidad continua más importante. Multitud de variables aleatorias continuas siguen una distribución normal o aproximadamente normal. Una de sus características más importantes es que cualquier distribución de probabilidad, tanto discreta como continua, se puede aproximar por una normal bajo ciertas condiciones.

La distribución de probabilidad normal y la curva normal que la representa, tienen las siguientes características:

  • La curva normal tiene forma de campana y un solo pico en el centro de la distribución. De esta manera, la media aritmética, la mediana y la moda de la distribución son iguales y se localizan en el pico. Así, la mitad del área bajo la curva se encuentra a la derecha de este punto central y la otra mitad está a la izquierda de dicho punto.
  • La distribución de probabilidad normal es simétrica alrededor de su media.
  • La curva normal desciende suavemente en ambas direcciones a partir del valor central. Es asintótica, lo que quiere decir que la curva se acerca cada vez más al eje X pero jamás llega a tocarlo. Es decir, las “colas” de la curva se extienden de manera indefinida en ambas direcciones.

Para indicar que una variable aleatoria (v.a.) sigue una distribución normal de media μ y

desviación estándar σ usaremos la expresión: X ∼ N( μ , σ ).

La curva normal es simétrica

colas

media=mediana=moda

Proyecto e-Math 13

expresión anterior, es posible encontrar el área de probabilidad bajo cualquier curva normal haciendo referencia a la distribución normal estándar en las tablas correspondientes.

Así pues, para averiguar el área encerrada bajo la curva utilizaremos la tabla que encontraremos al final de este apartado. Dicha tabla nos proporciona la probabilidad de que la v.a. normal estándar Z tome un valor situado a la izquierda de un número c , i.e.: P(Z<c). En

otras palabras, esta tabla nos da el valor del área encerrada por f(x) entre - ∞ y c.

Distribución muestral de la media de las muestras:

Consistiría en una distribución de probabilidad de todas las medias posibles de las muestras de un tamaño de muestra dado.

Así pues, dada una población (a la cual representaremos por la v.a. X ), podemos extraer de la misma k muestras, cada una de ellas de tamaño n. Para cada una de las k muestras podemos calcular un estadístico, p.e., la media de las n observaciones que la componen.

Así tendremos un total de k nuevos valores x i , i = 1 ,..., k. Podemos asociar estos valores

a una nueva v.a. X , cuya distribución llamaremos distribución muestral.

Una de las propiedades más importantes es la siguiente:

Teorema (Distribución de las Medias Muestrales):

Sea X una v.a. cualquiera de media μ y desviación típica σ , entonces:

o Si consideramos todas las muestras aleatorias posibles, cada una de ellas de

tamaño n , se cumplirá queμ x = μ y

n

x

o Además, si X sigue una distribución normal, X también será normal.

Teorema Central del Límite:

Sea X una v.a. cualquiera de media μ y desviación típica σ , entonces:

Si el tamaño muestral n es “suficientemente grande” (en la práctica suele valer n>30 ), la distribución de las medias muestrales se aproxima a la de una normal, i.e.:

n

X N

σ

La importancia del TCL radica en que sea cuál sea la distribución de la población original (v.a. X ), conforme el tamaño de las muestras ( n ) aumenta, la distribución de las medias se va aproximando a la de una normal (de la cual conocemos muchas propiedades). Así, si la población tiene una distribución de probabilidad normal, entonces, para cualquier tamaño de muestra la distribución del muestreode la media también tendrá una distribución normal. Si la distribución de la población es simétrica (pero no normal), se verá que surge la forma normal como lo establece el TCL aún con muestras de al menos 30 para observar las características de normalidad.

Aproximación de la Binomial a la distribución Normal.

(una aplicación del teorema Central del límite)

Proyecto e-Math 14

Si X ≈ B ( n , p ) y el nº de pruebas n es “muy grande” (en la práctica es suficiente

con verificar: np ≥ 5 y n(1-p) ≥ 5 ), entonces podemos aproximar la distribución binomial

anterior a una normal, en concreto: X ≈ N ( n * p , n * p *( 1 − p )). Esta aproximación

será tanto mejor cuanto mayor sea n.

Hay que tener en cuenta que, antes de aplicar la distribución normal, es necesario asegurarse de que la distribución que queremos aproximar es, efectivamente, binomial.

Para ello, hay que comprobar:

  • Que un experimento sólo puede tener dos resultados posibles y mutuamente excluyentes: un “éxito” y un “fracaso”.
  • La distribución es consecuencia de contar el número de éxitos de un número fijo de pruebas.
  • Cada prueba es independiente.
  • La probabilidad, p, permanece igual de una prueba a la siguiente.

En el caso de una v.a. discreta, tiene sentido preguntarse por la probabilidad de que ésta tome un determinado valor. Sin embargo, si consideramos que la v.a. X es continua,

entonces P(X=a) = 0, ∀ a ∈ R. Por este motivo tendremos que aplicar el llamado factor de

corrección por continuidad que veremos a continuación, es decir, en el caso anterior calcularemos P(a-0,5<X<a+0,5).

Ejemplos:

  1. El PER de una acción que cotiza en bolsa indica el número de veces que su precio es mayor que el beneficio por acción y este ratio es uno de los más importantes que utilizan habitualmente los inversores. Supongamos que tenemos la población de todos los PER que tiene una media de 10,5 y una desviación estándar de 4,5. ¿Cuál es la probabilidad de que, en una muestra de 40 acciones, el PER medio sea menor que 9?

Por el teorema del Límite central, como n=40 y es mayor que 30 podemos afirmar que la distribución muestral de la media de los PER se aproximará a una distribución normal.

< = < = PZ TABLAS

n

X
PX PX P

Por lo tanto existe una probabilidad del 1,74% de que la media de los PER de la muestra sea menor que 9.

  1. El Presidente de una multinacional de telecomunicaciones, está preocupado por el número de teléfonos móviles producidos por su empresa que tienen algún defecto. En promedio, 110 teléfonos al día son devueltos por este problema, con una desviación estándar de 64. El presidente de esta empresa ha decidido que a menos que pueda estar un 80% seguro de que, en promedio, no se devolverán más de 120 teléfonos al día durante lo siguientes 48 días, ordenará una reorganización general del proceso productivo. ¿se ordenará el reajuste decidido por el Presidente?

Proyecto e-Math 16

Cumulative Distribution Function

Normal with mean = 406,150 and standard deviation = 5,

x P( X <= x) 400,0000 0,

Por lo tanto existe una probabilidad del 13;39 % de que el salario medio se menor de

  1. La probabilidad de que la media de la muestra esté entre 400 y 410 €.

Sabemos que P ( 400 < X < 410 )= P ( X < 410 )− P ( X < 400 ). La segunda de éstas

probabilidades ya la hemos calculado en el apartado anterior.

Para calcular la primera se razona análogamente, obteniendo que:

Cumulative Distribution Function

Normal with mean = 406,150 and standard deviation = 5,

x P( X <= x) 410,0000 0,

Por tanto, tendremos: P ( 400 < X < 410 )= P ( X < 410 )− P ( X < 400 )=0,

  1. La probabilidad de que la media de la muestra sea mayor de 415 €.

En este caso, P ( X > 415 )= 1 − P ( X < 415 ). Hemos de calcular pues esta última

probabilidad, lo cual haremos de forma análoga a los apartados anteriores.

Obtendremos lo siguiente:

Cumulative Distribution Function

Proyecto e-Math 17

Normal with mean = 406,150 and standard deviation = 5,

x P( X <= x) 415,0000 0,

Por consiguiente, P ( X > 415 )= 1 − P ( X < 415 )=0,

4. Hallar el valor del salario medio c tal que P ( X < c )= 0 , 95.

Seleccionamos nuevamente: Calc > Probability Distributions > Normal , pero ahora elegiremos la opción Inverse Cumulative Probability , con lo que obtendremos :

Inverse Cumulative Distribution Function

Normal with mean = 406,150 and standard deviation = 5,

P( X <= x) x 0,9500 415,

NOTA.- En la siguiente dirección: http://huizen.dds.nl/~berrie/ encontraréis algunos vídeos que ilustran las distintas distribuciones que se han descrito en este apartado.

CASOS PRÁCTICOS CON SOFTWARE___________________________________

  1. Una compañía de seguros tiene una cartera de 2.000 pólizas que cubren la asistencia psicológica en caso de accidente. La empresa estima que este siniestro tiene una probabilidad de ocurrencia del 2 por mil en un año, y un coste medio de 100000 u.m. por siniestro. Calcular:

a) La probabilidad de afrontar más de 3 siniestros en el año.

Sea X=”Número de siniestros” Como el número de pruebas es muy grande y la probabilidad de éxito es muy pequeña, vemos que X sigue una distribución de Poisson, donde μ=2000.2/1000, es decir, X∼Po(4)

Para calcular la probabilidad de P(X>3), seleccionamos Calc > Probability Distributions > Poisson :

Cumulative Distribution Function

Poisson with mu = 4.

x P( X <= x) 3.00 0.

Por tanto, P(X>3) = 1 - P(X<3) = 1- 0.433 = 0.

b) La reserva que ha guardado la compañía para los siniestros del año, nos asegura que tiene una probabilidad del 99,2% de poder afrontar todos los siniestros que ocurran.

Proyecto e-Math 19

Cumulative Distribution Function

Normal with mean = 38.4000 and standard deviation = 3.

x P( X <= x) 44.0000 0.

c) Si queremos conseguir que un porcentaje de un 90%, ¿qué número de usuarios necesitaríamos?

Seleccionamos Calc > Probability Distributions > Normal :

Inverse Cumulative Distribution Function

Normal with mean = 38.4000 and standard deviation = 3.

P( X <= x) x 0.9000 43.

Así, pues, haría falta unos 43 catalanes para llegar al porcentaje del 90%

  1. Supongamos que en una población, sólo el 47% de los habitantes son favorables a las gestiones municipales realizadas por la alcaldía. Se selecciona aleatoriamente una muestra de 100 personas y se les pasa un cuestionario, de manera independiente a cada una.

a) ¿Cuál es la probabilidad de que, en la muestra, aparezcan exactamente 47 personas favorables al Ayuntamiento?

Sea X=”Número de personas favorables al Ayuntamiento ”

Además, X seguirá una distribución binomial con n=100 y cuya probabilidad de éxito será 0.47, es decir, X ∼ B(100,0.47)

Para calcular P(X=47), seleccionaremos Calc > Probability Distribution > Binomial :

Proyecto e-Math 20

Y obtenemos....

Probability Density Function

Binomial with n = 100 and p = 0.

x P( X = x) 47.00 0.

La probabilidad de que haya exactamente 47 personas que estén a favor del alcalde es 0.08, es decir, el 8%

b) ¿Cuál es la probabilidad de que entre 45 y 50 personas (incluidos estos valores), se muestren a favor de las gestiones del Ayuntamiento?

Queremos calcular P(45<=X<=50), es decir, P(X<=50)-P(X<=45)

Para ello, seleccionamos Calc > Probability Distributions > Binomial , activando la opción Cumulative Probability :