Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


resumen estadistica, Ejercicios de Estadística

Asignatura: Estadistica I, Profesor: Héctor Monterde i Bort, Carrera: Psicologia, Universidad: UV

Tipo: Ejercicios

2017/2018

Subido el 05/06/2018

wawaw-8
wawaw-8 🇪🇸

7 documentos

1 / 14

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Descargado en:
patatabrava.com
ESTADISTICA I (UV)
RESUMENES ESTADÍSTICA I
MONTERDE I BORT, HÉCTOR 16-17
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Vista previa parcial del texto

¡Descarga resumen estadistica y más Ejercicios en PDF de Estadística solo en Docsity!

Descargado en:

patatabrava .com

ESTADISTICA I (UV)

RESUMENES ESTADÍSTICA I

MONTERDE I BORT, HÉCTOR 16-

Índice.

    1. Conceptos básicos de inferencia estadística..........................................................
    • 1.1 Definiciones.........................................................................................................................
    • 1.2 Principales tipos de muestreo.
    • 1.3 Distribución muestral de un estadístico.
    • 1.4 Principales distribuciones muestrales.
    1. Estimación de parámetros.
    • 2.1. Tipos de inferencias.
    • 2.2. Concepto de estimador.......................................................................................................
      • 2.2.1. Características de un buen estimador.
    • 2.3. Estimación por intervalos.
      • 2.2.1. Procedimiento del cálculo.
    • 2.4. Principales intervalos confidenciales.
      • 2.4.1. Media.
      • 2.4.2. Varianza.
      • 2.4.3. Proporción.
    • 2.5. Precisión y grandaria de la muestra.
    1. Contraste de hipótesis.
    • 3.1. Introducción.
    • 3.2. Pasos en un contraste de hipótesis.
      • 3.2.1. Planteamiento de las hipótesis: Contraste unilateral y bilateral.
      • 3.2.2. Supuestos.
      • 3.2.3. Elección del nivel de riesgo (α)....................................................................................
      • 3.2.4. Estadístico de contraste.
      • 3.2.5. Determinación de la zona crítica.................................................................................
      • 3.2.6. La regla de decisión.
        1. Tipos de error.
    • 3.4. Potencia de un contraste.
    1. SPSS...................................................................................................................
    •  Tema 2: Calcular intervalos de confianza.
    •  Tema 4: Contraste de hipótesis.

 En función del rol que desempeñan en una investigación: X influye sobre Y. Marco de decisión Tipo de decisión Explicativa Respuesta Independiente Dependiente Predictora Criterio Exógena Endógena Condicionante Condicionada. Eje abscisas Eje de ordenadas.  Escalas de medida: Nominal, Ordinal, Intervalos y Razón.

1.2 PRINCIPALES TIPOS DE MUESTREO.

Muestreo: Se trata de una muestra representativa de la población que permite generalizar los datos. En el caso de que la muestra no sea representativa es una muestra sesgada/ esviaxada. Podemos encontrar diferentes tipos:  Aleatorio: La muestra, los elementos de la población, se extraen al azar, cosa que garantiza que todos los elementos presenten la misma probabilidad de formar parte de la muestra.  Simple: Extracción al azar. Ex: La lotería.  Sistemática: Extracción aleatoria de un elemento de la población, y a partir de este se eligen de forma sistemática los demás elementos (n-1). Es decir, se determina a partir del valor de un número. Por ejemplo, dime un número y se empieza a contar de ese y a la pers. Que le toca es la que “gana”. 1º Se determina la grandaria de la muestra. 2º Se determina el valor de K: valor de incremento  K = N/n 3º Se determina el elemento de partida (i): Extracción al azar de un elemento de los primeros de k. 4º A partir del elemento extraido anteriormente se elige el resto.  Estratificado: La población se agrupa con grupos o niveles, en función de una determinada característica.  Conglomeradas: La unidad muestral no es un individuo, sino un conjunto de individuos que forman un conglomerado, es decir, un grupo. De esta forma, la muestra estará formada por todos los elementos de los conglomerados seleccionados. Por ejemplo, los miembros de un colegio.

1.3 DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO.

Distribución muestral: Función que asigna una probabilidad concreta a cada uno de los valores que puede tomar un estadístico en todas las muestras de una determinada grandaria que se pueden extraer de una población, es decir, obtener la probabilidad de aparición de la muestra. Las más frecuentes son la media, la varianza, la proporción, la diferencia entre medias y el cociente entre variancias.  Teorema central del límite: Cuanto más grande es la muestra el error típico es menor, tiende a reducirse. Si la muestra tiende al infinito, el error tiende a cero.

1.4 PRINCIPALES DISTRIBUCIONES MUESTRALES.

Distribución muestral de la media.  Conocida la variancia poblacional (𝜎^2 ): si n es mayor que 30 (n> 30 ). La distribución muestral de la mediana es normal.

N = (μ , (^) √σn) Al tipificar, la distribución de la media será N (0,1). De esta forma podemos utilizar la distribución normal tipificada para conocer la probabilidad asociada a los diferentes valores. 𝑧 = 𝑚𝑒𝑑𝑖𝑎 𝜎^ −^ μ

 Desconocida la variancia poblacional: Cuando n e^ √𝑛s menos o igual a 30 (n≤ 30 ). La distribución muestral de la media sigue el modelo t: N = (μ , 𝑆 √𝑛−n^1 ) Si se aplica la siguiente expresión, la v.a resultante se distribuye según t con n-1 gl. De esta forma podemos utilizar la distribución 𝑡𝑛− 1 para conocer las probabilidades asociadas a diferentes valores: 𝑧 = 𝑚𝑒𝑑𝑖𝑎 𝑆𝑛−^1 −^ μ

Distribución muestral de la varianza.^ √𝑛 Se da cuando la variable medida tiene una distribución normal a nivel poblacional, N (μ,𝜎). Puede variar en función del tamaño de la muestra:  Muestra pequeñas ( n<100): Al aplicar la siguiente fórmula, la v.a resultante se distribuye según 𝑋^2 𝑐𝑜𝑛 𝑛 − 1 𝑔𝑙. De esta forma podemos utilizar las tablas de la distribución 𝑋^2 , para conocer las probabilidades asociadas a diferentes valores de la varianza: 𝑋^2 = 𝑛 𝜎𝑆^22 𝑛

Muestras grandes (n>100): Conforme aumenta la grandaria de la muestra, la distribución 𝑋^2 se aproxima a la normal. Por lo que, al aplicar la siguiente fórmula, la v.a resultante se distribuye según la distribución normal N (0,1), y, de esta forma, podemos utilizar la distribución normal tipificada para conocer las probabilidades asociadas a diferentes valores de la varianza: 𝑧 =^ (

𝑛𝑆^2 𝑛

𝜎^2 )^ −^ (𝑛^ −^1 )

Distribución muestral de proporción. Cuando trabajamos con proporciones, normalmente tratamos con variables dicotómicas. Dependiendo de la grandaria de la muestra pueden ser:  Con muestras pequeñas (n<30): El estadístico de proporción (P) se distribuye según el modelo de probabilidad binomial con parámetros n y π.  Con muestras grandes (n>30) y donde los valores de π no sean extremos. Conforme aumenta la grandaria, la distribución binomial se aproxima a la normal. Por lo que, al aplicar la siguiente fórmula podremos utilizar la distribución normal tipificada para conocer las probabilidades asociadas a los diferentes valores de proporción: 𝑧 = 𝑃^ −^ π √π(^1 𝑛−^ π)

2.3. ESTIMACIÓN POR INTERVALOS.

No atribuimos un valor concreto al parámetro que deseamos estimar/calcular, sino un rango de valores entre los cuales esperamos encontrar el verdadero valor del parámetro con una probabilidad alta y conocida. Elementos a considerar:  Intervalo de confianza: Intervalo formador por dos límites entre los cuales se encontrará el valor del parámetro estimado con un determinado nivel de confianza. Es decir, se trata de un rango de valores entre el límite inferior (Li) y el límite superior (Ls).  Límites de confianza: Valores del límite inferior (Li) y del límite superior (Ls).

 Nivel de confianza (1-α): Probabilidad que el verdadero valor del parámetro poblacional se encuentre en el intervalo, es decir, probabilidad de acertar en la estimación. 1 - α = 0.95 1 - α = 0.99 1 - α = 0.  Nivel de riesgo (α): Probabilidad de que el verdadero valor del parámetro poblacional NO se encuentre en el intervalo, es decir, probabilidad de error en la estimación. α= 0,05 α = 0.01 α = 0.  Distribución muestra del estadístico: Normal, T, ji cuadrado (𝑋^2 ) 2.2.1. Procedimiento del cálculo.

  1. Establecer el nivel de riesgo: 0,05 o 0,01.
  2. Obtener la puntuación correspondiente al nivel de riesgo en función de la distribución muestral del estadístico, es decir, tipificar.
  3. Calcular la desviación típica de la distribución muestral del estadístico  Error típico (𝑆θ).
  4. Calcular el error máximo:
  5. Obtener los límites de confianza.

2.4. PRINCIPALES INTERVALOS CONFIDENCIALES.

2.4.1. Media.  Conocida la varianza poblacional (^2 ):

 Desconocida la varianza poblacional con muestras pequeñas (n<30):

 Desconocida la varianza poblacional con muestras grandes (n>30):

2.4.2. Varianza.  Con muestras pequeñas (n < 100):

 Con muestras grandes (n >100):

2.4.3. Proporción.  Con muestras pequeñas (n <30):

 Con muestras grandes ( n>30):

2.5. PRECISIÓN Y GRANDARIA DE LA MUESTRA.

  • Cuanto menos amplio - amplitud- sea un intervalo de confianza, este será más preciso, más informativo y más útil.
  • Cuanto más grande sea la muestra, más se aproximará/más probabilidad hay de acertar la media, es decir, que el estadístico muestral representará mejor a la población.
  • La amplitud del intervalo de confianza depende del:  Nivel de confianza ( 1 – α)  Valor del error típico del estimador.
  • Para poder ganar precisión sin aumentar el nivel de riesgo podemos recudir el error típico del estimador y aumentar la grandaria de la muestra:

Homocedasticidad: Se utiliza para dos muestras. Contraste sobre dos varianzas independientes. Que no haya diferencia significativa entre las dos variables, para poder compararlas más fácilmente. 3.2.3. Elección del nivel de riesgo (α). α = 0.05 α = 0.  Si se cumple la hipótesis en el 0.01 se cumplirá también en el 0.05 porque 0.01 > 0.05. 3.2.4. Estadístico de contraste. Se mira en la hoja de las distribuciones y nos permitirá conocer la probabilidad asociada al valor muestral.

3.2.5. Determinación de la zona crítica.  Zona de aceptación de 𝐻 0 : Está determinada para 1 – α. Es el área de la distribución muestral correspondiente a los valores del estadístico suficientemente próximos a la afirmación establecida en 𝐻 0 que es muy probable que se cumpla si 𝐻 0 es verdadera.  Zona crítica o zona de rechazo de la hipótesis nula: Está determinada por α. Es el área de distribución muestral correspondiente a los valores del estadístico tan alejados de la afirmación establecida en 𝐻 0 que es muy poco probable que se cumpla si 𝐻 0 es verdadera.

3.2.6. La regla de decisión.  Rechazar 𝐻 0 : Si el valor del estadístico de contraste se encuentra en la zona crítica o de rechazo.  Mantener/ Aceptar 𝐻 0 : Si el valor del estadístico de contraste se encuentra en la zona de aceptación.

3. 3. TIPOS DE ERROR.

Al aceptar o rechazar 𝐻 0 , como se hace en términos de probabilidad, siempre nos podemos equivocar. Hay diferentes tipos de error:  Error de tipo I (α): es el nivel de riesgo. Se da cuando rechazamos que 𝐻 0 es verdadera. Es decir, se trata de un Falso positivo , al tomar algo por verdadero cuando no lo es : Si la hipótesis nula es verdadera y la rechazamos. Por ejemplo: Aceptar que la terapia es efectiva, que hay diferencias con los sujetos que toman medicación y los que no.  Error II (β): Falso negativo : Tomar una cosa como error cuando es bueno Si la hipótesis nula es falsa y la aceptamos.  Decisión correcta (1- α): Si la hipótesis nula es verdadera y la mantenemos  Potencia (1- β): Si la hipótesis nula es Falsa y la rechazamos.

Probabilidad de producir el error tipo I (α): Queda determinada por el investigador.  Probabilidad de cometer el error tipo II (β): Depende de tres factores:

  • Grandaria del efecto: La verdadera 𝐻 1  Si estás más juntos, β Será mayor.
  • El valor de α: Relación inversa  Si todo lo demás es constante, cuanto mayor sea α menor será β.
  • La grandaria del error típico de la distribución muestral: Para una distancia entre 𝜇 0 y 𝜇 1 , cuanto más grande sea el error típico:  Mayor variabilidad en la distribución.  Mayor solapamiento entre las distribuciones.  Mayor es el valor de β.  Al aumentar la grandaria de la muestra se disminuiría el error típico de una distribución normal: La manipulación de la grandaria de la muestra proporciona soluciones más eficaces y sencillas para recudir β.

3.4. POTENCIA DE UN CONTRASTE.

Potencia (1- β): Es la probabilidad de rechazar 𝐻 0 cuando esta es realmente falsa, es decir, si la hipótesis nula es Falsa y la rechazamos. Por lo tanto, la probabilidad de cometer el error tipo II (β). Determinado por tres factores:

  • Grandaria del efecto: Distancia entre 𝐻 0 𝑦 𝐻 1. Si están muy juntos, la potencia es menor.
  • Valor de α: Cuanto mayor sea, mayor será la potencia.
  • Tamaño de la muestra/ Grandaria del error típico de la distribución muestral: Si aumenta la muestra:  Disminuye el error típico (I).  Disminuye el error tipo II (β).  Aumenta la potencia (1 – β).  La manipulación de la grandaria de la muestra proporciona soluciones más eficaces y sencillas para aumentar la potencia.
  • Supuesto de homocedasticidad (para dos muestras): Se verifica con la prueba de Levene (ver output de la prueba T), y determina qué procedimiento es el adecuado utilizar, y por tanto qué información se debe interpretar de la tabla del output (“Se han asumido varianzas iguales” o “No se han asumido varianzas iguales”). H0 ↔ Las varianzas son iguales. H1 ↔ Las varianzas son desiguales.

SPSS Analizar / Comparar medias / Prueba T para muestras independientes / Contrastar variables = Variable a analizar (TOTSALU) Variable de agrupación = (Ejemplo) Sexo) / Definir gruposUsar valores especificados: Grupo 1: 1 (código hombre 1) Grupo 2: 2 (código mujer 2) Botón Opciones marcar: nivel de confianza: 95% ó 99%Estadístico de contraste:

  • Para una muestra: Pero nos pedían que comprobáramos si la puntuación media poblacional de x difería de manera estadísticamente significativa de la puntuación media de nuestra muestra. SPSS Analizar / Comparar medias / Prueba T para una muestra / Contrastar variables = variable a analizar Valor de prueba = media Botón Opciones marcar: nivel de confianza 95% o 99% La primera tabla ofrece resultados descriptivos de la muestra analizada. Se observa que la muestra está compuesta por x sujetos, y su media ha sido x. En la segunda tabla aparece la información relativa al contraste de hipótesis planteado. Se observa el valor del estadístico de contraste t= x , los grados de libertad asociados a la prueba gl= x , y el valor de probabilidad o significación (Sig.(bilateral)) p=.000.
  • Para a las tablas obtenidas en la comprobación de supuestos): dos muestras independientes (varianza y media independientes (hace referencia La primera tabla ofrece resultados descriptivos. Observamos x sujetos muestra 1, cuya media ha sido de x y de y sujetos muestra 2 cuya media ha sido que la muestra se compone de de y es .x,. Respecto a la variabilidad de ambas muestras, la dt en el grupo de y en el grupo de las sujetos muestra 2 es y. sujetos muestra 1 En la segunda tabla aparece información sobre el contraste de hipótesis planteado. En primer lugar ambas poblaciones (, aparece la prueba de Levene, que contrasta la hipótesis nula de que la varianza desujetos muestra 1y sujetos muestra 2) son iguales. En la segunda parte de la tabla aparece la Prueba T, el estadístico de contraste que pone a prueba la hipótesis nula de que la media de los sujetos muestra 1 y los sujetos muestra 2 son iguales (contraste bilateral).
  • Para SPSS dos medias reladionadas: Analizar / Comparar medias / Prueba T para muestras relacionadas / Variables relacionadas = (seleccionar las variables. relacionadas) Botón Opciones marcar: nivel de confianza 95% ó 99%. La primera tabla ofrece resultados descriptivos. Se observa que la muestra analizada está compuesta por x sujetos, que han obtenido una media de x en la variable 1 y de y en la variable 2. La segunda tabla indica la correlación entre ambas variables.

Finalmente, la tercera tabla ofrece información sobre el contraste de hipótesis relativo a las dos medias. El valor del estadístico de contraste t= x, los grados de libertad asociados al estadístico son gl= x, y el nivel de probabilidad o significación encontrado p=x.  Determinación de la zona crítica y toma de decisión: Respuesta.

  • Para una muestra: Respuesta: Ya que el nivel de probabilidad encontrado (=.000/2 (=0.05), El estadístico de contraste cae dentro de la zona crítica (^) se =.000) es menor que rechaza la hipótesis nula y se acepta la hipótesis alternativa.
  • Para dos muestras independientes (varianza y media independientes): Atendiendo a la prueba de Levene, ya que el nivel de probabilidad encontrado (=.sig) es menor poblaciones comparadas ( que alfa(=0.05), se rechaza lsujetos muestra 1 y sujetos muestra 2a hipótesis nula --> Las) en la variable varianzas de las escogida dos , no son iguales. Según los datos comentados arriba, la población de presenta mayor variabilidad (dt = .xy) que los hombres (dt = .xy). sujetos de muestra xy Dado que las varianzas no pueden considerarse iguales, de los valores de la Prueba T debemos fijarnos en el que se encuentra en la fila de “NO se han asumido varianzas iguales”. ES UN CONTRASTE BILATERAL El valor del estadístico es t=.xy, y la significación o probabilidad encontrada (=.sig bilateral la hipótesis nula. ) es mayor que alfa (=0.05), por lo que se mantiene
  • Para dos Ya que el valor de medias relacionadas: probabilidad encontrado (p= x) es mayor que el nivel de riesgo adoptado ( = 0.05), se mantiene la hipótesis nula (contraste bilateral).  Comprueba que tanto si trabajamos con un de resultados obtenidas en ambos casos son exactamente idénticas. = 0.05 como con un (^) La única d= 0.01, las tablasiferencia es a nivel de interpretación, ya que sabemos que el nivel de riesgo adoptado determina el valor de probabilidad a partir del cual debemos mantener o rechazar la hipótesis nula.