Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


formulario estadistica, Ejercicios de Estadística

Asignatura: Estadistica, Profesor: anonimo anonimo, Carrera: Farmàcia, Universidad: UV

Tipo: Ejercicios

2014/2015

Subido el 14/06/2015

fatima_zahra5914
fatima_zahra5914 🇪🇸

3.8

(8)

3 documentos

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Formulario de Estad´ıstica
Grado en Farmacia (Curso 2014-2015)
Departament d’Estad´ıstica i Investigaci´o Operativa
1. Estad´ısticos muestrales
(a) Media muestral: ¯x=1
nPn
i=1 xi=1
n(x1+. . . +xn)
(b) Varianza muestral:s2
X=1
n1Pn
i=1 (xi¯x)2
(c) Desviaci´on ıpica muestral:sX=ps2
X
(d) Coeficiente de variaci´on:C.V. = 100 sX
¯x%
(e) Mediana: Valor de la variable que ocupa la posici´on central en la muestra ordenada. Cuando
nes impar, posici´on n+1
2. Si nes par, se hace el promedio entre los dos valores que ocupan las
posiciones n
2yn
2+ 1.
(f) Cuartiles: son los tres valores que dividen la muestra ordenada en cuatro partes iguales. Si n+1
es ultiplo de 4, el primer cuartil es el valor que ocupa la posici´on n+1
4en la muestra ordenada, el
tercer cuartil es el valor que ocupa la posici´on 3(n+1)
4y el segundo cuartil coincide con la mediana.
En otro caso, hay que interpolar para obtener sus valores correctos.
2. Regresi´on lineal y correlaci´on
Notaci´on y estad´ısticos descriptivos asicos:
Datos: Son los npares de valores observados {(xi, yi), i = 1, . . . , n}
Medias: ¯x=1
nPn
i=1 xi,¯y=1
nPn
i=1 yi
Sumas de cuadrados:SSX=Pn
i=1 (xi¯x)2= (n1)s2
X, SSY=Pn
i=1 (yi¯y)2= (n1)s2
Y,
Suma de productos:SP X Y =Pn
i=1 (xi¯x)(yi¯y)
Coeficiente de correlaci´on muestral: r=SP XY
SSXS SY
Recta de regresi´on (M´ınimos Cuadrados) de Y sobre X: Y=b0+b1X,
donde b1=SP XY
SSXyb0= ¯yb1¯x
Valores ajustados: Son los valores ˆyi=b0+b1xi(i= 1, . . . , n)
Residuos: Son los valores yiˆyi(i= 1, . . . , n)
Suma de cuadrados residual:SS(resid) = Pn
i=1(yiˆyi)2=SS YSP 2
XY
SSX
Desviaci´on ıpica residual:sY|X=qSS (resid)
n2
Coeficiente de determinaci´on:r2= 1 SS(resid)
SSY.
3. Distribuciones Bernoulli y Binomial
(a) Sea Xuna variable aleatoria dicot´omica, con X = 1 si se obtiene la categor´ıa de inter´es exito) y
con X = 0 si no se obtiene (fracaso). Entonces, X sigue una distribuci´on de probabilidad Bernoulli,
XBer(π), donde π= P(´exito). La media de Xen la poblaci´on es πy la varianza π(1 π).
(b) Se dice que la variable aleatoria Xsigue una distribuci´on de probabilidad binomial, B i(n, π), si
Xcuenta el umero de ´exitos en npruebas repetidas e independientes, todas ellas con la misma
probabilidad (de ´exito), π. En este caso, para los valores de x= 0,1, . . . , n, se puede calcular
probabilidades con la expresi´on P(X=x) = n!
x!(nx)! πx(1 π)nx. La media de Xen la poblaci´on
es y la varianza (1 π).
1
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga formulario estadistica y más Ejercicios en PDF de Estadística solo en Docsity!

Formulario de Estad´ıstica

Grado en Farmacia (Curso 2014-2015)

Departament d’Estad´ıstica i Investigaci´o Operativa

1. Estad´ısticos muestrales

(a) Media muestral: x¯ = (^) n^1

∑n i=1 xi^ =^

1 n (x^1 +^...^ +^ xn) (b) Varianza muestral: s^2 X = (^) n−^11

∑n i=1 (xi^ −^ x¯)

2

(c) Desviaci´on t´ıpica muestral: sX =

s^2 X

(d) Coeficiente de variaci´on: C.V. = 100 sxX ¯ %

(e) Mediana: Valor de la variable que ocupa la posici´on central en la muestra ordenada. Cuando n es impar, posici´on n+1 2. Si n es par, se hace el promedio entre los dos valores que ocupan las posiciones n 2 y n 2 + 1.

(f ) Cuartiles: son los tres valores que dividen la muestra ordenada en cuatro partes iguales. Si n + 1 es m´ultiplo de 4, el primer cuartil es el valor que ocupa la posici´on n+1 4 en la muestra ordenada, el tercer cuartil es el valor que ocupa la posici´on 3(n 4 +1) y el segundo cuartil coincide con la mediana. En otro caso, hay que interpolar para obtener sus valores correctos.

2. Regresi´on lineal y correlaci´on

Notaci´on y estad´ısticos descriptivos b´asicos:

Datos: Son los n pares de valores observados {(xi, yi), i = 1,... , n} Medias: x¯ = (^) n^1

∑n i=1 xi^ ,^ ¯y^ =^

1 n

∑n i=1 yi Sumas de cuadrados: SSX =

∑n i=1 (xi^ −^ ¯x) (^2) = (n − 1)s 2 X , SSY^ =^

∑n i=1 (yi^ −^ ¯y) (^2) = (n − 1)s 2 Y , Suma de productos: SP (^) XY =

∑n i=1 (xi^ −^ x¯)(yi^ −^ y¯) Coeficiente de correlaci´on muestral: r = √SSSPX^ XY SSY

Recta de regresi´on (M´ınimos Cuadrados) de Y sobre X: Y = b 0 + b 1 X, donde b 1 = SP SS^ XYX y b 0 = ¯y − b 1 x¯ Valores ajustados: Son los valores ˆyi = b 0 + b 1 xi (i = 1,... , n) Residuos: Son los valores yi − ˆyi (i = 1,... , n)

Suma de cuadrados residual: SS(resid) =

∑n i=1(yi^ −^ ˆyi)

2 = SSY − SP^2 XY

SSX

Desviaci´on t´ıpica residual: sY |X =

SS(resid) n− 2 Coeficiente de determinaci´on: r^2 = 1 − SS SS(residY ).

3. Distribuciones Bernoulli y Binomial

(a) Sea X una variable aleatoria dicot´omica, con X = 1 si se obtiene la categor´ıa de inter´es (´exito) y con X = 0 si no se obtiene (fracaso). Entonces, X sigue una distribuci´on de probabilidad Bernoulli, X ∼ Ber(π), donde π = P(´exito). La media de X en la poblaci´on es π y la varianza π(1 − π).

(b) Se dice que la variable aleatoria X sigue una distribuci´on de probabilidad binomial, Bi(n, π), si X cuenta el n´umero de ´exitos en n pruebas repetidas e independientes, todas ellas con la misma probabilidad (de ´exito), π. En este caso, para los valores de x = 0, 1 ,... , n, se puede calcular probabilidades con la expresi´on P (X = x) = (^) x!(nn−!x)! πx(1 − π)n−x. La media de X en la poblaci´on es nπ y la varianza nπ(1 − π).

  1. Distribuci´on Normal y Teorema Central del L´ımite

(a) Si X es una variable aleatoria Normal con media μ y varianza σ^2 , X ∼ N (μ, σ^2 ), su funci´on de densidad es una campana de Gauss sim´etrica centrada en μ y que toma valores positivos aproxi- madamente dentro del rango μ − 3 σ y μ + 3σ. Una Normal con media 0 y varianza 1, N (0, 1), se denomina normal est´andar.

(b) Par´ametros de la media muestral Si las variables X 1 , X 2 ,... , Xn son independientes y tienen la misma distribuci´on, con media μ y varianza σ^2 , entonces Xn = (^) n^1

∑n i=1 Xi^ es una variable aleatoria con media^ μ^ y varianza^

σ^2 n (c) Distribuci´on de la media muestral de datos normales Si las variables X 1 , X 2 ,... , Xn son independientes y tienen la misma distribuci´on normal, con media μ y varianza σ^2 , entonces Xn = (^1) n

∑n i=1 Xi^ es normal con media^ μ^ y varianza^ σ^2 n Xn es N ormal(μ, σ

2 n )

(d) Teorema central del L´ımite Si las variables X 1 , X 2 ,... , Xn son independientes y tienen la misma distribuci´on, no necesariamente normal, con media μ y varianza σ^2 , entonces Xn = (^1) n

∑n i=1 Xi^ es aproximadamente normal con media μ y varianza σ

2 n , si^ n^ es suficientemente grande. Xn aproximadamente N ormal(μ, σ

2 n ) (n^ grande)

  1. Pruebas de normalidad e igualdad de varianzas

La dos pruebas siguientes se utilizan para comprobar las condiciones de aplicabilidad de otros m´etodos estad´ısticos.

(a) Prueba de normalidad de Shapiro-Wilk:

H 0 : La variable tiene una distribuci´on normal. HA: La variable no tiene una distribuci´on normal.

(b) Prueba de Levene de igualdad de varianzas:

H 0 : Todas las varianzas poblacionales son iguales. HA: No todas las varianzas poblacionales son iguales.

  1. Inferencia sobre la media de una poblaci´on

(a) Estimaci´on puntual

Estimador puntual de la media poblacional μ: ˆμ = ¯x. Error est´andar del estimador de la media: SE(¯x) = √sn

(b) M´etodos param´etricos

(i) Intervalo de confianza para μ al nivel 100( 1 − α) %: ¯x ± t 1 − α 2 SE(¯x) donde t 1 − α 2 es el percentil de orden 1 − α 2 de una distribuci´on t-Student con gl = n − 1. (ii) Test t Hip´otesis: H 0 : μ = μ 0 HA : μ 6 = μ 0 no direccional HA : μ < μ 0 direccional a la izquierda HA : μ > μ 0 direccional a la derecha

Estad´ıstico del contraste: ts = (^) SE¯x(¯^1 x− 1 −¯x^2 x¯ 2 ) El P -valor es el ´area de la cola, bajo la curva t-Student con ν grados de libertad, en la direcci´on (o direcciones) especificada (especificadas) por HA. Decisi´on: Rechazar H 0 cuando P -valor< α, siendo α el nivel de significatividad del contraste.

(c) M´etodo no param´etrico: Test de Wilcoxon para muestras independientes:

Hip´otesis: H 0 : Las distribuciones poblacionales de X 1 e X 2 coinciden. HA: Las distribuciones poblacionales de X 1 e X 2 son diferentes (hip´otesis no direccional). HA: La distribuci´on poblacional de X 1 tiende a producir valores m´as grandes que la de X 2 (hip´otesis direccional a la derecha). HA: La distribuci´on poblacional de X 1 tiende a producir valores m´as peque˜nos que la de X 2 (hip´otesis direccional a la izquierda).

Decisi´on: Rechazar H 0 cuando P -valor< α, siendo α el nivel de significatividad del contraste.

  1. Comparaci´on de las medias de k muestras independientes

La misma variable X se observa en k ≥ 2 poblaciones dindependientes. Se desea comparar las medias de las k poblaciones.

(a) M´etodos param´etricos: ANOVA y Welch

Hip´otesis: H 0 : μ 1 = μ 2 =... = μk HA: Las medias no son todas iguales. Estad´ıstico del contraste: F = (^) M SM S((dentroentre))

i) Si asumimos que las varianzas son iguales, aplicamos ANOVA: Tabla ANOVA: Fuente Grados libertad (gl) Suma de cuadrados (SS) Cuadrados medios (MS) F

Entre gl(entre)= k − 1 SS(entre)= ∑k i=1 ni( ¯xi^ −^ ¯¯x)^2 MS(entre)=^

SS(entre) gl(entre)

M S(entre) M S(dentro)

Dentro gl(dentro)= n − k SS(dentro)= ∑ki=1(ni − 1)s^2 i MS(dentro)= SS gl((dentrodentro))

Total n − 1 ∑k i=

∑ni j=1(xji^ −^ ¯x)^2

donde {x 1 i, x 2 i,... , xnii} son los ni datos del grupo i = 1,... , k cuya media y varianza son ¯xi y s^2 i , respectivamente. El n´umero total de datos es n =

∑k i=1 ni, y la media de todos los datos es ¯x¯.

ii) Si asumimos que las varianzas no son iguales, aplicamos Welch: En este caso, los gl(dentro) y el MS(dentro) son diferentes a los de la tabla ANOVA.

Significatividad: La distribuci´on del estad´ıstico F bajo la hip´otesis nula es la distribuci´on F , con grados de libertad del numerador gl(entre) y grados de libertad del denominador gl(dentro). Decisi´on: Rechazar H 0 cuando P -valor< α, siendo α el nivel de significatividad del contraste.

(b) M´etodos no param´etricos: Kruskal-Wallis

Hip´otesis: H 0 : Las distribuciones poblacionales de Y 1 , Y 2 ,.. ., Yk coinciden HA: Las distribuciones poblacionales de Y 1 , Y 2 ,.. ., Yk son diferentes (hip´otesis no direccional) Significatividad: El p-valor se obtiene comparando el valor del estad´ıstico con los de una χ^2 (chi-cuadrado) con k − 1 grados de libertad. Decisi´on: Rechazar H 0 cuando P -valor< α, siendo α el nivel de significatividad del contraste.

  1. An´alisis de datos categ´oricos

10.1. Inferencia sobre una proporci´on poblacional

Se desea estudiar π, la proporci´on de individuos de una poblaci´on que cumplen cierta caracter´ıstica de inter´es. Se obtiene una muestra de tama˜no n de esa poblaci´on, observando r individuos que cumplen la caracter´ıstica de inter´es y n − r que no la cumplen.

(a) Estimaci´on puntual

El estimador puntual de la proporci´on poblacional π es ˆπ = (^) nr.

El error est´andar de ˆπ es SE(ˆπ) =

ˆπ(1−ˆπ) n (aunque hay otras posibles aproximaciones).

(b) Intervalo de confianza aproximado para π al nivel 100(1 − α) %: ˆπ ± t 1 −α/ 2 SE(ˆπ)

donde t 1 −α/ 2 es el percentil de orden 1 − α/2 de una distribuci´on t de Student con infinitos grados de libertad. Como este es un c´alculo aproximado del verdadero intervalo de confianza, es recomendable utilizarlo s´olo cuando el tama˜no muestral y el n´umero m´ınimo de observaciones en cualquiera de las dos categor´ıas (nmin) es suficientemente grande.

πˆ = 0.5 0.4 o 0.6 0.3 o 0.7 0.2 o 0.8 0.1 o 0.9 0.05 o 0.95 0.01 o 0. n ≥ 10 15 20 60 180 440 2400 nmin ≥ 5 6 6 12 18 22 25

(c) Contraste de hip´otesis sobre una proporci´on:

Hip´otesis:

H 0 : π = π 0 HA : π 6 = π 0 no direccional HA : π < π 0 direccional a la izquierda HA : π > π 0 direccional a la derecha

Decisi´on: Rechazar H 0 cuando P -valor< α, siendo α el nivel de significatividad del contraste.

10.2. Bondad de ajuste.

Sea X una variable categ´orica con k categor´ıas. Se desea contrastar una hip´otesis que especifica las probabilidades de cada una de las categor´ıas:

Hip´otesis: H 0 : πi = πi 0 para i = 1, 2 ,... , k HA : Al menos una de las igualdades no se cumple

Estad´ıstico del contraste:

χ^2 s =

∑^ k

i=

(Oi − Ei)^2 Ei

Oi:= frecuencia observada de la categor´ıa i.

Ei:= frecuencia esperada para la categor´ıa i si H 0 es cierta, calculada como Ei = n × πi 0

Distribuci´on del estad´ıstico del contraste: χ^2 (chi-cuadrado) con gl = k − 1 Contrastes unilaterales. El contraste es siempre bilateral si k ≥ 3. S´olo si k = 2 puede plantearse una alternativa direccional. En ese caso, el p-valor bilateral se divide por 2 si los datos est´an de acuerdo con la direcci´on de la hip´otesis alternativa; en otro caso, no se rechaza la hip´otesis nula.

Decisi´on: Rechazar H 0 cuando P -valor< α, siendo α el nivel de significatividad del contraste.