Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Decisión Estadística: Distribución Muestral, Error Tipico y Pruebas de Hipotesis - Prof. A, Apuntes de Psicología

Una introducción a la decisión estadística, incluyendo conceptos básicos como la distribución muestral, el error tipico y las pruebas de hipotesis. Se explica el uso de pruebas estadísticas concretas y se discuten los riesgos y confianzas asociados a las mismas. Además, se presentan ejemplos prácticos para calcular el valor de p o probabilidad de que una diferencia empírica se encuentre dentro de una distribución muestral.

Tipo: Apuntes

2013/2014

Subido el 25/02/2014

naorma
naorma 🇪🇸

4.2

(50)

42 documentos

1 / 20

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Tema 1
___________________
2. Decisión estadística
Índice
1.Distribución muestral y error típico..............................................................2
1.1.Estadísticos y parámetros..........................................................................2
1.2.Distribución muestral de medias................................................................ 3
1.3.Distribución muestral de diferencias de medias.........................................5
2.La tarea de la decisión estadística............................................................... 6
2.1.Riesgos y confianzas asociados a las pruebas de decisión estadística.... 8
2.2.Pruebas de una y dos colas.....................................................................12
3.Significación estadística y tamaño de efecto............................................ 13
3.1.Significación estadística y tamaño de efecto........................................... 13
3.2.Tamaño de efecto a priori........................................................................ 17
3.3.Tamaño de efecto a posteriori.................................................................. 19
Este capítulo incluye contenidos que se supone ya conoces
del curso de Diseños y Análisis de datos 1 en el primero
de grado: concepto de distribución muestral y los riesgos
asociados a las pruebas de decisión estadística.
Sin embargo, se recuerdan aquí porque es muy importante
que manejes estos conceptos al aplicar cualquiera de las
pruebas estadísticas que vamos a estudiar en este curso.
No sólo para que comprendas la lógica subyacente a las
mismas sino también para saber cuantificar las
probabilidades de error que asumes al establecer las
conclusiones tras aplicar estas pruebas.
1
Tema 1. Decisión estadísca
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Vista previa parcial del texto

¡Descarga Decisión Estadística: Distribución Muestral, Error Tipico y Pruebas de Hipotesis - Prof. A y más Apuntes en PDF de Psicología solo en Docsity!

Tema 1

___________________

2. Decisión estadística

Índice

1.Distribución muestral y error típico. ............................................................. 1.1.Estadísticos y parámetros.......................................................................... 1.2.Distribución muestral de medias................................................................ 3 1.3.Distribución muestral de diferencias de medias......................................... 2.La tarea de la decisión estadística ............................................................... 6 2.1.Riesgos y confianzas asociados a las pruebas de decisión estadística.... 8 2.2.Pruebas de una y dos colas..................................................................... 3.Significación estadística y tamaño de efecto ............................................ 13 3.1.Significación estadística y tamaño de efecto........................................... 13 3.2.Tamaño de efecto a priori........................................................................ 17 3.3.Tamaño de efecto a posteriori..................................................................

Este capítulo incluye contenidos que se supone ya conoces del curso de Diseños y Análisis de datos 1 en el primero de grado: concepto de distribución muestral y los riesgos asociados a las pruebas de decisión estadística.

Sin embargo, se recuerdan aquí porque es muy importante que manejes estos conceptos al aplicar cualquiera de las pruebas estadísticas que vamos a estudiar en este curso. No sólo para que comprendas la lógica subyacente a las mismas sino también para saber cuantificar las probabilidades de error que asumes al establecer las conclusiones tras aplicar estas pruebas.

Tema 1. Decisión estadís�ca

1. Distribución muestral y error típico.

1.1. Estadísticos y parámetros.

Un estadístico es un valor obtenido en una muestra de estudio y un parámetro el valor obtenido en una población. Por ejemplo, estos son algunos de los estadísticos y sus parámetros correspondientes usados con asiduidad:

Índices Estadístico Parámetro Media μ Desviación típica σY

Una población es un conjunto de sujetos (/objetos) definidos por determinadas características como la población de alumnos de la escuela pública Ramón y Cajal de Madrid, los empleados en una fábrica de papel de la ciudad de Alicante o los alumnos de la asignatura Diseños y análisis de datos 2 matriculados en el curso 2011/12. Esta definición puede abarcar mayor o menor número de sujetos, puede ser más o menos extensa, pero siempre se referirá al universo al que deseamos extrapolar o generalizar los resultados de una investigación.

La extracción de unidades o sujetos de la población para configurar la muestra debe ser en lo posible aleatoria para que la representación de la población esté garantizada. Una muestra sesgada (sujetos voluntarios o escogidos por orden de llegada) no garantizan las inferencias sobre la población que nos sirve de referencia. En estadística trabajamos normalmente con muestras pero las decisiones o conclusiones a las que aspiramos son aquéllas que describen a la población. Esta tarea es la denominada “ inferencia estadística ” y constituye el proceso de trabajo típico a la hora de hacer investigaciones y concluir sobre ellas.

1.2. Distribución muestral de medias.

El concepto de distribución muestral tiene que ver con este proceso que hemos mencionado: La inferencia. Para explicar qué es una distribución muestral seguiremos los siguientes pasos:

1. Supongamos una población (empleados en una fábrica) en la que

medimos una variable Y (edad) y calculamos su media (μ):

de la distribución muestral, es decir, sus valores fluctúan menos. En esta dirección puedes hacer simulaciones para apreciar cómo cambia la forma de la distribución muestral en función de diferentes valores de n 1.

5. Puede delimitarse además, un intervalo de probabilidad de

esta distribución, al 95% o al 99%. En el primer caso dicho intervalo incluye el 95% de las medias de edad alrededor de μ y el 99% en el segundo:

Calculando estos dos valores límites del intervalo se conoce alrededor de qué valores se encontrarán en el 95% de los casos las medias de edad extraídas de la población de edad media 45 años. Todos estos valores se conciben como variaciones aleatorias del valor 45, es decir, productos del azar.

1.3. Distribución muestral de diferencias de medias.

Mediante un procedimiento similar al descrito arriba puede configurarse la distribución muestral de diferencias de medias. Imaginemos que partimos ahora de dos poblaciones, ambas iguales y por tanto con medias iguales, y extraemos al azar infinitas muestras de tamaño n de cada una de ellas. Calculamos las diferencias por pares de estas medias (di ) y los resultados los ordenamos en la distribución muestral correspondiente: Distribución muestral de diferencias de medias :

1 Parte de una población de 2000 sujetos y dibuja la distribución muestral para muestras de tamaño 19. Cambia el tamaño de la muestra a 11 y compara la forma de su distribución muestral con la anterior. ¿Es más ancha o más estrecha?

Población 2

2 =

Población 1

1 =

Muestras 1 Muestras 2

Distribución muestral de

diferencias de medias

En esta distribución el valor promedio será 0, diferencia más probable ya que se parte del supuesto que las poblaciones tienen iguales medias, y tendremos valores tanto más improbables de este 0 cuanto más no alejemos hacia lo derecha o izquierda de la distribución. En este caso, la medida de esta dispersión de diferencias o error típico de la distribución será:

siendo S una desviación típica ponderada a partir de las dos desviaciones típicas obtenidas de dos muestras cualesquiera.

También en esta distribución puede delimitarse, como en la anterior, el intervalo de confianza al 95% o al 99% donde se encuentran el 95% o el 99% de las diferencias aleatorias obtenidas en este proceso alrededor del valor 0.

Cualquier estadístico de diferencia o diferencia entre dos muestras fuera de este intervalo se considera un valor poco probable y en consecuencia, se estima que las dos muestras comparadas no proceden de poblaciones de iguales medias. Este esbozo de decisión lo desarrollaremos más ampliamente a continuación a tenor del uso de pruebas de decisión estadísticas concretas.

2. La tarea de la decisión estadística.

Dado que 1.1 (diferencia empírica entre 6.8 y 5.7) no se encuentra dentro del intervalo de probabilidad de la distribución de diferencias -obtenida a partir de dos poblaciones con iguales medias- (-.96 y +.96), se concluye que 1.1. es una diferencia estadísticamente diferente a 0, es decir, existe una diferencia significativa entre las notas de ambos grupos de alumnos siendo la muestra o grupo 2 el que supera en nota a la restante.

Como puede suponerse, existen en estadística variados tipos de distribuciones que permiten hacer inferencias similares para otros tipos de estadísticos que definen a las muestras. La distribución del estadístico t es una de las más conocidas y usadas al respecto. Otros tipos de distribuciones son las de proporciones para variables nominales o la de la F de Snedecor cuando se miden varianzas. En general, todas ellas nos permiten efectuar inferencias y resolver problemas de estimación y decisión estadística. La cuestión es elegir en cada caso la distribución adecuada de acuerdo a nuestro objeto de estudio, la naturaleza de nuestros datos u otros condicionantes.

1.4. Riesgos y confianzas asociados a las pruebas de decisión

estadística.

Pongamos por caso la aplicación de la prueba t de Student Fisher para estudiar la diferencia encontrada entre dos muestras. Esta prueba evalúa dicha diferencia cuando se trata de muestras cuya n es menor a 30 y los datos

cumplen ciertos supuestos 3. La distribución muestral del estadístico t tiene

aproximadamente la forma que se dibuja abajo y un error típico medido de la manera como se indica en la parte superior derecha de la distribución:

3 Es importante probar estos supuestos los cuales pueden consultarse en el documento correspondiente a los supuestos de los modelos de análisis.

D. muestral de diferencias de medias de dos poblaciones iguales

Muestra 1 ¿pertenece d= ±1.1 a? S=1. n=

S= n=

Muestra 2 = HHH^ μ -.96 =0 000

t=

Calculamos la probabilidad de que una diferencia empírica entre medias (como el caso de las notas medias de dos grupos de alumnos instruidos por diferentes profesores) se sitúe dentro del área central de la distribución (valores de t similares a 0). Con otras palabras, calculamos la probabilidad de que el valor de t obtenido en nuestra investigación se encuentre dentro de la zona de la hipótesis nula (H 0 ).

Para ello calculamos primero el número de desviaciones típicas (en el denominador) en que nuestra diferencia empírica (en el numerador) se distancia del 0, es decir, a cuántas desviaciones típicas se encuentra nuestra diferencia del centro (t=0):

Utilizando un paquete estadístico como el SPSS, o unas tablas on line (por ejemplo en la dirección on-line 2) se responde a esta pregunta rápidamente 4 , ya que ambos medios nos proporcionan directamente el valor de p o probabilidad de que nuestra t se encuentre dentro. Si dicha probabilidad es baja (p<.05 o p<.01), decidimos que no lo está –y por lo tanto nuestra diferencia es diferente del azar, o sea, diferente de 0. Si, por el contrario, la probabilidad obtenida es alta (p≥.05 o p≥.01), concluimos que nuestra diferencia es una de las posibles provocadas por el azar –es explicable por azar-, o lo que es lo mismo, nuestra diferencia no puede considerarse distinta de 0.

Supongamos que obtenemos un valor t en nuestra investigación de 2.4 y contamos con 15 sujetos (lo que quiere decir que contamos con 13 grados de libertad – DF- 5 ). Anotamos estos datos en el cuadro de diálogo que nos proporciona esta pantalla interactiva:

4 Tradicionalmente, a falta de ordenadores, se u�lizaban tablas en papel en las que se podían encontrar los valores límites de las diferentes distribuciones estadís�cas a los niveles de significación requeridos (normalmente .05 y .01) a par�r de los cuales se tomaban las decisiones de aceptar o no Ho. Véanse, por ejemplo, las tablas referentes a las distribuciones estadís�cas como la t de Student o la de la F de Snedecor en la siguiente dirección: on line 1. 5 DF es la abreviatura inglesa que corresponde al término grados de libertad ( D egree F reedom).

De no relación (más infrecuentes)

Aceptación H 0 Se acepta H (^0)

Tanto si la decisión es aceptar o rechazar la H 0 , se asume un determinado riesgo asociado. Si la rechazamos, el riesgo asumido es α o riesgo de primera especie (. en el caso anterior); en el caso de aceptarla, el riesgo de equivocarse se llama β o riesgo de segunda especie. Los dos tipos de riesgos mencionados tienen sus correspondientes complementarios de confianza en las diferentes conclusiones. El cuadro siguiente resume las diferentes circunstancias de riesgos y confianzas asociadas a las pruebas de significación estadística:

Decisión Acepto H 0 Rechazo H 0 Supuesto de partida Ho es verdadera 1-α α Ho es falsa β 1-β (potencia)

Se parte de la solución correcta al problema que o bien confirma la veracidad de la Ho o bien su falsedad (las dos soluciones expresadas en el supuesto de partida). Si la Ho es de hecho verdadera, la decisión de aceptarla tiene una confianza de 1-α; si la rechazamos, la decisión tiene un riesgo de equivocación α (o p). Si la Ho es de hecho falsa, la decisión de rechazarla tiene una confianza de 1-β y la de aceptarla un riesgo de error β. El riesgo α –p en los programas de cálculo de probabilidades exactas- de equivocarnos al rechazar se denomina riesgo de primera especie e incurrir realmente en esta equivocación es cometer error tipo 1. El riesgo β o equivocarnos al aceptar Ho se denomina riesgo de segunda especie e incurrir realmente en este error se denomina cometer error tipo 2.

Es decir, si el riesgo α llega a cumplirse cometemos error tipo 1 (hemos rechazado la Ho sin deberlo). Si por el contrario incurrimos en el riesgo β, cometemos el llamado error tipo 2 (hemos aceptado la Ho habiendo sido correcto rechazarla).

Como muy frecuentemente las pruebas de decisión estadística son aplicadas a problemas que intentan probar diferencias, es decir, probar que es realmente diferente a μ (o que dos son realmente diferentes entre sí), la bondad o confianza asociada a esta conclusión de diferencia (1-β) se hace denominar potencia de la prueba. Potencia de la decisión es pues, la confianza de acertar al rechazar Ho 6 y por tanto el grado de certeza que hay en la conclusión de que es diferente a μ (o de que dos son diferentes entre sí).

1.5. Pruebas de una y dos colas.

Como hemos visto, los valores de probabilidades asociadas a las pruebas de significación estadística, tanto en programas on line como en los programas 6 Subrayamos este concepto por la importancia que se le concede actualmente en los resultados derivados de las inves�gaciones..

informáticos de análisis de datos como SPSS, informan por defecto de valores de probabilidades bilaterales. Esto quiere decir que nos informan de la probabilidad de obtener valores del estadístico obtenido por encima de un valor teórico de contraste o por debajo de este valor en la parte complementaria de la distribución muestral. Por ejemplo, en la siguiente figura se sombrean las probabilidades de las dos colas para valores de z =±2.58 (como sabemos, una z que corresponde a una probabilidad del .01).

Como vemos en la figura anterior, el valor de p = .01 se reparte en ambos lados de la distribución, así que para cada lado, p = .01/2 = .005.

Sin embargo, generalmente, cuando se lleva a cabo un contraste estadístico la hipótesis u objetivo del investigador es contestar a una pregunta en la que se plantea un determinado sentido. Es decir, la idea no es saber si un determinado valor de z (o t) es o no diferente de 0, por encima o por debajo, indiferentemente, sino si dicho valor es grande en una determinada dirección. Por ejemplo ¿resulta la nota media de los alumnos con los que se ha probado un determinado método de enseñanza de una materia superior a la media de aquellos con los que no se ha aplicado dicho método? En este caso la idea es probar el cambio o diferencia en un determinado sentido, no evaluar la diferencia sin más.

Así, en éste y en otros casos similares es necesario dividir los valores de probabilidad bilaterales proporcionados por los paquetes estadísticos entre dos para calcular el valor exacto de la probabilidad en nuestro caso concreto. Obviamente, esto únicamente se hará si el valor obtenido se ubica en la zona de la curva que corresponde estrictamente a nuestras predicciones, nunca si dicho valor inesperadamente cae en la cola contraria.

Ejemplo: Supongamos que realizamos un contraste estadístico para evaluar la bondad de un nuevo método de enseñanza respecto a un método usado tradicionalmente. Obtenemos una = 7 en una muestra de 35 alumnos frente a la media obtenida por los alumnos de cursos anteriores con los que no se aplicó dicho método μ=6. La desviación típica de las notas de estos últimos fue de 2 puntos. ¿Se ha conseguido mejorar la nota de los alumnos mediante este nuevo método?

El valor de z obtenido es acorde a la predicción planteada, es decir, es positiva, por lo que la nota obtenida es superior a la nota de referencia (7>6). Entonces, se calcula la probabilidad asociada a este valor que según las tablas on line es:

z= 2.958, p (^) (bilateral)=.

P(z < -2.58)=.005P(z> +2.58)=.005z=-2.58 z=0 z=2.

que es a lo que se llama potencia de la prueba o probabilidad de acertar al rechazar la H 0 (o aceptar H 1 ).

Gráficamente, podemos representar el riesgo β, junto a su contrario, el riesgo α, utilizando dos distribuciones diferentes, aquélla que representa la del 0 o la de la H 0 –en rojo- y la que representa la hipótesis alternativa en la investigación o H 1 –en azul-:

Como vemos, la primera distribución es la definida por la H 0 y su valor central es 0; la segunda tiene en este caso el valor central 2.5. En el proceso de la decisión estadística nos posicionamos generalmente en la distribución de la H 0 de tal manera que si topamos con valores más allá del límite verde (zona α, en rosa) concluimos que tal valor no pertenece a esta distribución, conclusión que tiene asociado un posible error - α- de que sí pertenezca. Por el contrario, si topamos con uno de los valores de la H 0 ubicado en la zona azul de la gráfica decidiríamos que nuestro valor pertenece a la distribución H 0 –está dentro de sus límites- con una probabilidad β de que realmente pertenezca a la distribución alternativa (H 1 ).

Tenemos además y por otro lado, la probabilidad 1-α, aquélla extendida en la distribución del 0 que constituye la probabilidad de que nuestro valor

1-β1-α HHo 1

pertenezca realmente a los dominios de la H 0 y la probabilidad alternativa 1-β, aquélla extendida en la otra distribución que supone la probabilidad de que nuestro valor pertenezca realmente a los dominios de la H 1.

Examinando la gráfica representada puede observarse que 1-β depende de los valores que adopte α. Si utilizamos un valor α= .05, conseguimos un valor de β más pequeño que si utilizamos un α=. (basta con desplazar imaginariamente el límite de color verde hacia la izquierda), por lo tanto, un valor 1-β –potencia- mayor. Por otro lado, 1- β depende también el valor que define a la distribución alternativa (en azul). Cuanto más alejado del 0 está el centro de esta distribución tanto más se consigue disminuir el riesgo β, puesto que habría poca zona compartida entre una y otra distribución (menos área de color azul). Alejar por tanto a la distribución alternativa de la distribución de Ho no es otra cosa que incrementar 1- β. Obsérvese cómo disminuye β de una gráfica a otra cuando aumentamos el valor del centro de la distribución azul (de 2.5 a 3.5):

O este caso más extremo donde β es prácticamente 0 y máximo, en contrapartida, el valor de 1-β (potencia):

≈≈≈7.52.53.

y tamaño de efecto, nos aportan una comprensión más cabal de los resultados obtenidos en una investigación

De otra manera ordenada la tabla anterior y tomando como referencia la significación, por un lado, y el tamaño de la muestra utilizada, por otra, podemos establecer así las diferentes conclusiones que pueden desprenderse de las investigaciones:

Significación (.05 o .01)

Tamaño muestral Tamaño de efecto Conclusión

Sí Pequeño Grande Resultado importante La Ho es probablemente falsa Grande Grande o pequeño Resultado poco concluyente (podría o no No Pequeño Grande o pequeño tener relevancia prác�ca) Grande Pequeño La Ho es probablemente verdadera

1.6. Tamaño de efecto a priori

Dadas las argumentaciones anteriores sobre la importancia de considerar el tamaño de efecto en las investigaciones y visto también que se consigue potencia estadística cuanto mayor tamaño de efecto consigamos y cuantos más sujetos contemos en la misma, las preguntas que siguen son: ¿Cómo podemos optimizar el tamaño de esta muestra de manera que no desperdiciemos esfuerzo humano y económico pero que permita alcanzar una potencia mínima para la prueba?, ¿qué tamaño de efecto mínimo necesitamos a nivel práctico de acuerdo con lo que se conoce sobre el tema y/o las necesidades existentes? Son preguntas fácilmente resolubles si utilizamos el

programa G*Power que puedes instalarlo gratis en tu ordenador activando

este enlace y utilizarlo de ahora en adelante cuanto planifiques investigaciones.

Por ejemplo, supongamos que tenemos entre manos una investigación de comparación de dos grupos en la que supuestamente utilizaremos la prueba t de Student para analizar los datos. Queremos saber qué tamaño de muestra necesitamos para conseguir una potencia de 0.95, un tamaño de efecto medio (.5) utilizando un α=.05 y un contraste unilateral o de una sola cola. Para ello, anotamos esta información en el siguiente cuadro de diálogo que nos proporciona el Gpower:

La salida correspondiente es:

El programa nos informa que necesitamos una muestra de 176 sujetos repartidos por igual en ambos grupos (88 y 88) tal y como habíamos planteado al establecer la ratio de 1 de proporcionalidad entre ellos. La potencia queda ajustada a 0.9514 y el valor crítico de t es de 1.653, es decir, si conseguimos con nuestros datos empíricos resultantes de la investigación un valor de t superior a éste, confirmaríamos la existencia de diferencias significativas entre nuestros grupos.

1.7. Tamaño de efecto a posteriori.

También si mantenemos pulsado el recuadro “Determinar” con nuestro ratón, el programa nos informa de la importancia de los diferentes valores de tamaños de efectos (d =.2 –bajo-; d =.5 –medio- y d =.8 –alto-). Para el caso que tratamos hemos conseguido, pues, un tamaño de efecto medio y con este dato junto con el resto de condicionantes (tamaño de grupos, prueba unilateral y nivel de significación de .05), la potencia de nuestro estudio es .95, muy alta.

Junto con el índice de tamaño de efecto usado en este estudio, d de Cohen

(1988, 1992) 8 , existen otros que se aplican en las diferentes investigaciones y

8 siendo S (^) Y la desviación �pica de los grupos ponderada. Una fórmula alterna�va ú�l cuando se aplica la prueba t es

que derivan a veces del tipo de pruebas usadas en ellas. En el siguiente cuadro aparece un resumen de estos índices de tamaños de efectos junto con los valores de importancia que se le otorga a cada uno de ellos:

Desde… Tamaño efecto Pequeño Medio Grande r de Pearson Coeficiente de correlación .10 .30. t Student o F del ANOVA (dos muestras)

Coeficiente de correlación Diferencia de medias estandarizadas (d)

.20 .50.

R cuadrado (R^2 ) .01 .07. F del ANOVA (más dos muestras)

R cuadrado (R^2 )

Regresión lineal simple y múl�ple

R cuadrado (R^2 )

Existen diferentes páginas web con las que se puede calcular los tamaños de efectos a posteriori. Algunas de estas direcciones son:

  • http://www.cognitiveflexibility.org/effectsize
  • http://www.cedu.niu.edu/~walker/calculators/effect.asp
  • http://www.uccs.edu/~lbecker/

Referencias.

Cohen, J. (1988): Statistical power analysis for the behavioral sciences (2ª Ed.). Hillsdale, NJ: Lawrence Erlbaum Associates.

Cohen, J. (1992): A power primer. Psychological Bulletin, 112 , 155-159.

Fisher, R.A. (1935): The design of experiments. Edinburgh: Oliver and Boyd.