Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


anova, Apuntes de Administración de Empresas

Asignatura: metodos cuantitativos, Profesor: emili emili, Carrera: Administració i Direcció d'Empreses, Universidad: UJI

Tipo: Apuntes

2013/2014

Subido el 02/06/2014

sandra_st33
sandra_st33 🇪🇸

3.8

(4)

6 documentos

1 / 30

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Tema 3
Análisis de la varianza (ANOVA)
3.1. Introduction
Una de las múltiples definiciones de ANOVA (ANalysis Of VAriance) que podemos en-
contrar en la extensa literatura de análisis multivariante es aquella según la cual se trata
de un procedimiento para descomponer la variabilidad de un determinado experimento
en componentes independientes atribuibles a causas distintas.
Esta definición, en misma, es difícil de entender. Sin embargo, a través de numerosos
ejemplos es fácil diseccionar la definición en varios fragmentos con significados muy claros
cada uno de ellos.
Uno de estos ejemplos, podría hacer referencia a la posible relación entre la nota obtenida
en la asignatura de Métodos Cuantitativos para la Empresa de segundo curso del Grado
en Administración de Empresas, Economía y Finanzas y Contabilidad y el grupo en el
que los alumnos están matriculados (2oA, 2oB, 2oC, 2oD, 2oE ó 2oF). El analista podría
tener interés, de cara a diseñar un plan de incentivos de mejora de la calidad docente,
en averiguar si existe algún tipo de relación entre la nota obtenida en la asignatura y
el hecho de estar matriculado en uno u otro grupo. En este contexto, el ANOVA de un
factor permitiría contestar la pregunta de si existe algún tipo de relación entre la nota
obtenida y el grupo en el que cada alumno está matriculado.
Si tratamos de dar cierta formalización al ejemplo presentado en el párrafo anterior,
podemos considerar que el problema (o experimento, de acuerdo con la nomenclatura de
las ciencias naturales) estaría constituido por una serie de componentes:
Elementos, que en nuestro caso serían los alumnos matriculados en los grupos A, B, C,
D, E y F.
Característica, que varía aleatoriamente entre los distintos alumnos/as, en nuestro caso
la nota obtenida en la asignatura.
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e

Vista previa parcial del texto

¡Descarga anova y más Apuntes en PDF de Administración de Empresas solo en Docsity!

Tema 3

Análisis de la varianza (ANOVA)

3.1. Introduction

Una de las múltiples definiciones de ANOVA (ANalysis Of VAriance) que podemos en- contrar en la extensa literatura de análisis multivariante es aquella según la cual se trata de un procedimiento para descomponer la variabilidad de un determinado experimento en componentes independientes atribuibles a causas distintas.

Esta definición, en sí misma, es difícil de entender. Sin embargo, a través de numerosos ejemplos es fácil diseccionar la definición en varios fragmentos con significados muy claros cada uno de ellos.

Uno de estos ejemplos, podría hacer referencia a la posible relación entre la nota obtenida en la asignatura de Métodos Cuantitativos para la Empresa de segundo curso del Grado en Administración de Empresas, Economía y Finanzas y Contabilidad y el grupo en el que los alumnos están matriculados (2oA, 2oB, 2oC, 2oD, 2oE ó 2oF). El analista podría tener interés, de cara a diseñar un plan de incentivos de mejora de la calidad docente, en averiguar si existe algún tipo de relación entre la nota obtenida en la asignatura y el hecho de estar matriculado en uno u otro grupo. En este contexto, el ANOVA de un factor permitiría contestar la pregunta de si existe algún tipo de relación entre la nota obtenida y el grupo en el que cada alumno está matriculado.

Si tratamos de dar cierta formalización al ejemplo presentado en el párrafo anterior, podemos considerar que el problema (o experimento, de acuerdo con la nomenclatura de las ciencias naturales) estaría constituido por una serie de componentes:

Elementos, que en nuestro caso serían los alumnos matriculados en los grupos A, B, C, D, E y F.

Característica, que varía aleatoriamente entre los distintos alumnos/as, en nuestro caso la nota obtenida en la asignatura.

Factor, que en nuestro caso sería el grupo en el que cada uno de los alumnos está matriculado.

Pues bien, ANOVA de un factor trata de contestar la pregunta de si existe relación entre el valor medio esperado de la característica y el factor. En el presente contexto, ANOVA trataría de contestar si existe algún tipo de relación entre la nota obtenida en la asignatura Métodos Cuantitativos y el grupo en el que cada alumno/a está matriculado/a.

Se trata además de un proceso que opera en dos etapas. En la primera de ellas, de carácter no estadístico (por lo que no formaría parte de ANOVA en sí misma) se calcularían las medias de los elementos en cada uno de los grupos o niveles del factor, mientras que en la segunda fase se aplicarían métodos estadísticos (que constituyen ANOVA en sí mismos) para contrastar si las diferencias entre las medias de cada grupo (o niveles del factor) son o no estadísticamente significativas.

Una de las primeras cuestiones que puede plantearse el lector avezado es el origen del nombre de la metodología analizada, pues parecería tener poco sentido plantear un aná- lisis de la varianza cuando lo que se va a llevar a cabo es una comparación de medias. Si bien en una primera instancia podría llegar a pensarse que el nombre más adecuado sería análisis de las medias en lugar de análisis de la varianza, más adelante veremos en profundidad el porqué de llamar a este tipo de análisis ANOVA.

De un modo más formal, y siguiendo a Uriel and Aldás (2005), entre otros, podríamos definir el ANOVA de un factor como un método estadístico que permite determinar si una variable toma valores promedio iguales o distintos en los grupos (o niveles del factor) que forma otra variable. Denominaremos factor a la variable que, en principio, ejercería una influencia sobre la variable dependiente. Recordemos que en nuestro ejemplo el factor sería el grupo en el que cada alumno está matriculado y la variable dependiente sería la nota obtenida en la asignatura.

Los ejemplos del mundo económico, financiero y empresarial que podrían ser objeto de una formalización a través de ANOVA son múltiples y se irán desarrollando a lo largo del curso. Se anima al lector a plantear algunas de las preguntas que podría ayudar a contestar esta técnica.

3.2. Modelo, supuestos y estimación de los parámetros

3.2.1. Formulación del modelo:

La formulación de ANOVA más comúnmente utilizada es la siguiente:

Ygi = μg + εgi, (3.1)

3.2.2. Supuestos del modelo:

Los supuestos del modelo nos dirán si ANOVA es un procedimiento adecuado para ana- lizar los datos experimentales (o datos del problema). De no cumplirse, la validez del procedimiento el resultado puede quedar en entredicho. En el epígrafe destinado a eva- luar la validación del modelo (epígrafe 3.4) esta problemática se discutirá en toda su extensión.

Podemos hablar de cuatro supuestos básicos, muy habituales en estadística y econome- tría. Dos de ellos (aleatoriedad e independencia) hacen referencia al diseño del problema o del experimento, los otros dos (normalidad y homogeneidad de las varianzas) hacen referencia a las poblaciones de las que se extraen las muestras. Como se verá en sucesivos temas, muchos de los supuestos hacen referencia a un entorno multivariante, por lo que serían necesarios instrumentos para contrastar los supuestos en un contexto multivarian- te. Dichos instrumentos presentan en ocasiones un grado de complejidad considerable, que va más allá del alcance de este curso, o directamente no están disponibles.

Aleatoriedad: las muestras deben haberse extraído de manera aleatoria de los G grupos o poblaciones. Analíticamente, esto equivale a suponer:

E(εgi) = 0, ∀g, i (3.4)

Independencia: las muestras deben haberse extraído de manera independiente de los G grupos o poblaciones. Analíticamente, equivaldría a suponer:

E(εgiεhj ) = 0, ∀g 6 = h, ∀i 6 = j (3.5)

Normalidad: las observaciones de cada muestra/grupo deben provenir de poblaciones normalmente distribuidas, formalmente, N (μg, σ^2 ). Sin embargo, al igual que ocu- rre con el contraste t-Student, ANOVA es robusto a desviaciones respecto de la distribución normal. Mientras las distribuciones no sean radicalmente diferentes de la normal, el contraste que se lleva a cabo no se ve afectado por la falta de normalidad, especialmente para muestras grandes. Asimismo, si sólo se viola el su- puesto de normalidad, existen alternativas no paramétricas tales como el contraste de Kruskal-Wallis.

Homogeneidad de varianzas: la varianza debe ser la misma para cada una de las poblaciones, esto es, σ 12 = σ 22 =... = σ^2 G. Este supuesto es esencialmente el mismo que el supuesto de homocedasticidad que se lleva a cabo en regresión lineal, si bien la equivalencia no es del todo análoga y, por tanto, los contrastes para determinar su cumplimiento no serán exactamente los mismos.

El incumplimiento de los dos primeros supuestos, referentes al diseño del problema, es di- fícilmente solucionable, a menos que rediseñemos el experimento, algo que en la práctica supone extraer de nuevo las muestras (remuestrear). La lógica es simple. Un ejemplo claro

de falta de aleatoriedad sería, en el ejemplo de las notas de clase, seleccionar únicamente a chicas (no sería una muestra aleatoria). Siguiendo con el mismo ejemplo, falta de inde- pendencia podría venir generada si hay estudiantes que estudian juntos en la biblioteca (compartirían apuntes, métodos, recursos, etc., con lo que el “efecto grupo” se diluiría).

3.2.3. Estimación de los parámetros del modelo:

Los parámetros a estimar del modelo son dos: media poblacional de cada grupo, μg, y va- rianza poblacional, σ^2 , que es común a todos los grupos por el supuesto de homogeneidad de varianzas. Se trata por tanto de un modelo que depende de G + 1 parámetros, esto es, G medias (μ 1 , μ 2 ,... , μG) de los distintos grupos y una varianza, común para todos los grupos (σ^2 = σ^21 = σ^22 =... = σ^2 G).

Para estimar estos G + 1 parámetros desconocidos utilizaremos máxima verosimilitud. Dado el supuesto de normalidad (supuesto 3), la función de densidad correspondiente a las observaciones Ygi será:

f (Ygi, μg, σ^2 ) =

σ

2 π

e(−^1 /2)

(Ygi−μg σ

Aplicando los procedimientos correspondientes a máxima verosimilitud, se obtendrían los estimadores del modelo correspondientes a la media:

μ̂ g = Y¯g =

∑ng i=1 Ygi ng

esto es, el estimador de la media poblacional ( μ̂ g) es la media muestral ( Y¯g). Por su parte, el estimador correspondiente a la varianza, que obtenemos derivando con respecto a σ, sería:

σ̂^2 =

∑G

g=

∑ng i=1(Ygi^ −^ Y¯g) 2

n

∑^ G

g=

ng n

s^2 g (3.8)

siendo s^2 g la varianza muestral del grupo g.

Ejercicio opcional teórico #1: obtener, por máxima verosimilitud cómo, partiendo de la función de densidad (3.6), se llega finalmente a las expresiones (3.7) y (3.8).

Conjunto de datos 1 A B C 1 2 2.2 2. 2 1.9 2.2 2. 3 2 2.2 2. 4 2.1 2.2 2. Conjunto de datos 2 A B C 1 4.5 0.8 1. 2 0 3 4. 3 1 3.8 0. 4 2.5 1.2 3.

Si calculamos las medias simples para cada grupo (o nivel del factor) en ambos conjuntos de datos, se comprueba que toma valores 2, 2 , 2 y 2 , 4 para los grupos A, B y C, respectiva- mente, independientemente del conjunto de datos que estemos utilizando. Sin embargo, nuestra “intuición” nos sugeriría que en el caso 1 los grupos son diferentes pero en el caso 2 no. Si esta “intuición” no se genera de forma natural la ver los datos, podríamos representarlos gráficamente:

Gráfico 3.1: Representación de las observaciones segun los niveles del factor A, B y C para los dos conjuntos de datos

l l

l

l

1.0 1.5 2.0 2.5 3.0 3.5 4.

Conjunto de datos 1

valor

l (^) A B C

l

l

l

l

1.0 1.5 2.0 2.5 3.0 3.5 4.

0

1

2

3

4

5

Conjunto de datos 2

valor

En el caso 1 vemos que las diferencias entre las medias de los grupos son grandes con respecto a la variabilidad dentro de los grupos. Por el contrario, en el caso 2 las diferencias entre las medias de los grupos son pequeñas con respecto a la variabilidad experimental, o la variabilidad total del problema.

En otras palabras, es improbable que la variabilidad presente en el caso 1 genere la diferencia entre las medias de los distintos grupos, perfectamente esperable en el caso 2. En definitiva, la diferencia entre las medias del caso 1 parece generada porque los grupos

son diferentes (pues su variabilidad intra-grupo es pequeña), mientras que las diferencias entre las medias en el caso 2 parece originada por la variabilidad (pues la variabilidad intra-grupo es grande).

Por tanto, el contraste de igualdad de medias para analizar las hipótesis planteadas al principio de esta sección se basa en comparar el tamaño relativo de:

Variabilidad entre (inter) grupos vs. variabilidad dentro (intra) de los grupos, o bien

variabilidad explicada por el factor vs. variabilidad no explicada por el factor, o bien

variabilidad explicada vs. variabilidad residual.

Y, para juzgar la importancia de dicho tamaño relativo, debemos saber cuál es la distri- bución en el muestreo de dicho tamaño, esto es, debemos llevar a cabo un contraste que permita evaluar el tamaño relativo de la variabilidad entre grupos vs. variabilidad intra grupos.

En este punto podemos entender ya en toda su extensión el concepto de ANOVA que dá- bamos al principio del tema, según el cual se trata de un procedimiento para descomponer la variabilidad total de un problema o experimento en componentes independientes (que serán la variabilidad intra-grupo e inter-grupo) atribuibles a causas distintas (residuo y factor).

3.3.1. La descomposición de la variabilidad

Por tanto, dado que hemos de llevar a cabo un contraste basado en la comparación de la variabilidad, deberemos llevar a cabo en primer lugar la definición de las magnitudes que la describen, esto es, de las magnitudes que describen la variabilidad total, la variabilidad intra-grupo y la variabilidad inter-grupo.

Variabilidad intra-grupo

En cuanto a la variabilidad intra-grupo (o dentro de los grupos o niveles del factor), tenemos que una medida combinada de la variación dentro de los G grupos, muestras o niveles del factor es la suma de cuadrados intra-grupo, esto es:

SC(intra-grupo) = SC(residual) = SCR =

∑^ G

g=

∑^ ng

i=

(Ygi − Y¯g)^2 (3.9)

Sustituyendo en s^2 p nos quedará:

s^2 p =

∑n 1 i=1(Y^1 i^ −^ Y¯^1 )

(^2) + ∑n 2 i=1(Y^2 i^ −^ Y¯^2 )

(^2) +... + ∑nG i=1(YGi^ −^ Y¯G)

2 n − G

∑ng i=

∑G

g=1(Ygi^ −^ Y¯g)^2 n − G

= M CR (3.14)

Variabilidad inter-grupo

Las magnitudes que describen la variabilidad inter-grupos, o que explica el factor, se describen de forma análoga a las que describen la variabilidad residual. Para empezar, resulta conveniente utilizar la suma de cuadrados inter-grupo o entre grupos, que defini- remos como:

SC(inter-grupo) = SC(factorial) = SCF =

∑^ G

g=

∑^ ng

i=

( Y¯g − Y¯ )^2 =

∑^ G

g=

ng( Y¯g − Y¯ )^2 (3.15)

Cada término en la expresión (3.15) es el cuadrado de la diferencia entre la media del grupo, Y¯g, y la media total, Y¯ , multiplicada por el tamaño del grupo, ng. Por tanto, decimos que recoge la variabilidad inter-grupo porque representa el cuadrado de la dife- rencia entre cada grupo g (representado por su media muestral, Y¯g) y el resto de grupos (representados por su media muestral global, Y¯ ).

Asimismo, asociada a la variabilidad inter-grupo tenemos unos grados de libertad:

g.d.l.(inter-grupo) = g.d.l.(factorial) = G − 1 (3.16)

Como en el caso intra-grupo, no es necesario utilizar técnicas de tipo mnemotécnico para recordar la expresión (3.16). Basta recordar que en la expresión (3.15) a cada una de las Y^ ¯g medias muestrales le restamos la media muestral global ( Y¯ ). Dado que hay G grupos y 1 media muestral global, es fácil concluir que los grados de libertad serán G − 1.

Asimismo, a partir de las expresiones (3.15) y (3.16) podemos definir la media cuadrática inter-grupo o entre grupos como:

M C(inter-grupo) = M C(factorial) = M CF =

SCF

g.d.l.(factorial)

Variabilidad total: la relación fundamental de ANOVA

Llegados a este punto, ya conocemos las componentes independientes –esto es, variabili- dad inter-grupo o factorial y variabilidad intra-grupo o residual– a la que hace referencia

la definición de ANOVA. Quedaría ahora por ver cómo se relacionan estas con la varia- bilidad total existente en el problema o experimento.

A la hora de formalizar la variabilidad total del problema podemos razonar de manera análoga a como lo hemos hecho para la variabilidad intra-grupo e inter-grupo. De es- te modo, partiríamos de la discrepancia entre cada observación Ygi y la magnitud que describe a todos los grupos, esto es, la media muestral global Y¯ :

Ygi − Y¯

Sumando y restando Y¯g en la parte derecha de la expresión nos quedaría:

Ygi − Y¯ = ( Y¯g − Y¯ ) + (Ygi − Y¯g) (3.18)

Esta expresión considera la desviación de una observación de la media total como la suma de dos partes: una desviación inter-grupo Y¯g − Y¯ , esto es, cuál es la discrepancia del grupo g con respecto al resto de grupos, y una desviación intra-grupo Ygi − Y¯g, esto es, cuál es la discrepancia o desviación de cada observación Ygi con respecto al resto de observaciones en todos los grupos, representadas por la media global.

Elevando al cuadrado y tomando dobles sumatorios en ambos lados de la igualdad pode- mos comprobar que:

∑^ G

g=

∑^ ng

i=

(Ygi − Y¯ )^2 =

∑^ G

g=

ng( Y¯g − Y¯ )^2 ︸ ︷︷ ︸ SCF

∑^ G

g=

∑^ ng

i=

(Ygi − Y¯g)^2 ︸ ︷︷ ︸ SCR

es decir, hemos llegado a un nuevo concepto que es la suma de cuadrados total del problema o experimento: ∑G

g=

∑^ ng

i=

(Ygi − Y¯ )^2 (3.20)

Como es fácil suponer, la parte izquierda de la ecuación se conoce como suma de cuadrados total o SCT , que mide la variabilidad total dentro del problema, al evaluar la diferencia entre cada observación Ygi y el resto de observaciones en el problema, representadas por Y^ ¯.

Por tanto, la relación SCT = SCF + SCR es lo que se conoce como relación funda- mental de ANOVA, pues muestra cómo la variabilidad total de un conjunto de datos (o experimento) puede ser dividida en dos componentes interpretables: la variabilidad entre grupos, o explicada por el factor, y la variabilidad dentro de los grupos, o residual. En general, es a esta partición a la que se conoce como “análisis de la varianza”.

3.3.2. Construcción del estadístico

La hipótesis nula que estamos considerando evalúa la igualdad de las medias poblacionales de los distintos grupos. Hemos visto que el contraste necesario para ello se basa en la comparación de las distintas magnitudes que componen la variabilidad del experimento (intra-grupo/inter-grupo). Y para evaluar la importancia del tamaño relativo de dichas magnitudes debemos saber cuál es la distribución en el muestreo de dicho tamaño o, dicho de otro modo, necesitaremos un estadístico de distribución en el muestreo conocida que nos permita llevar a cabo el contraste de la hipótesis.

El estadístico que permite llevar a cabo el contraste de igualdad de medias se basa en la evaluación del tamaño relativo de las magnitudes que describen la variabilidad inter-grupo e intra-grupo, que hemos dicho que serían en última instancia M C(inter) y M C(intra). Por tanto, para evaluar si su tamaño relativo es suficiente para concluir que “el factor es relevante” (cuando M C(inter) es grande en comparación con M C(intra)) o “el factor no es relevante” (cuando M C(intra) es grande en comparación con M C(inter)) necesitaremos un criterio que nos permita llegar a una u otra conclusión. Ese criterio nos lo da un estadístico, pero... ¿cuál?

Sabemos, por nociones de Estadística, que siendo Z 1 , Z 2 ,... , Zn variables aleatorias i.i.d., de manera que Zi ∼ N (0, 1), se tiene que:

∑^ n

i=

Z i^2 = Z 12 + Z 22 +... + Z n^2 ∼ χ^2 n

(véase Gujarati, 1999, pág.160).

En nuestro caso, dado que Ygi ∼ N (μg, σ^2 ), se cumplirá que:

SCR =

∑^ G

g=

∑^ ng

i=

(Ygi − Y¯g)^2 ∼ χ^2 n−G

SCF =

∑^ G

g=

ng( Y¯g − Y¯ )^2 ∼ χ^2 G− 1

Sabemos también, por nociones de Econometría, que siendo Z 1 ∼ χ^2 k 1 y Z 2 ∼ χ^2 k 2 variables aleatorias, se tiene que:

F =

Z 1 /k 1 Z 2 /k 2

∼ Fk 1 ,k 2

y en nuestro caso concreto se tendría que:

F =

SCF/(G − 1)

SCR/(n − G)

M CF

M CR

∼ FG− 1 ,n−G

donde FG− 1 ,n−G es una distribución F -Snedecor con G − 1 grados de libertad en el nu- merador y n − G en el denominador (véase Mood et al., 1974, págs.239–249).

3.3.3. La relación entre el contraste de la F y el contraste de l t

Suponiendo que tenemos que comparar únicamente dos grupos (G=2), serían igualmente válidos los contrastes de la F como los de la t. En concreto, puede demostrarse que el contraste de la F y de la t son equivalentes (t^2 = F ).

Podemos verlo a través de un ejemplo (si bien no es este el procedimiento para llevar a cabo una demostración). Suponiendo que n 1 = 10 y n 2 = 7, se tiene que los grados de libertad de la distribución t correspondiente serán tαn 1 +n 2 − 2 = t^0 10+7,^05 − 2 = t^015 ,^05 = 2, 131. Por

su parte, en lo que hace referencia a la F , F (^) Gα− 1 ,n−G = F (^20) −,^051 ,10+7− 2 = F (^10) ,, 1505 = 4, 54. Se puede comprobar que 2 , 1312 = 4, 54.

3.4. Diagnosis y validación del modelo

El analista debe ocuparse de verificar, por una parte, si es importante la variabilidad que explica el factor y, por otra, el cumplimiento de los supuestos básicos del modelo.

3.4.1. ¿Es importante la variabilidad total explicada por el fac-

tor?

Como se ha apuntado, ANOVA descompone la variabilidad total de un experimento o problema en componentes independientes atribuibles a causas distintas, esto es, factor y residuo. Es razonable que nos preguntemos cuál de estas componentes independientes representa un mayor porcentaje de la variabilidad total del problema. En este sentido, podemos definir una magnitud que denominaremos η^2 como una medida relativa de la variabilidad explicada por los grupos y que responde a la expresión:

η^2 =

SCF

SCT

La interpretación es sencilla y absolutamente análoga a la que se hace en regresión del coeficiente de determinación: si el coeficiente η^2 está más cercano a la unidad será in- dicativo de que el factor explica la mayor parte de la variabilidad total presente en el problema/experimento, mientras que si está cercano a cero será indicativo de que es el residuo lo que explica la mayor parte de la variabilidad (el factor no sería relevante).

utiliza específicamente para contrastar si G grupos tienen la misma varianza. Por tanto, la hipótesis que contrastaremos será:

Contraste de Levene:

{ H

0 :^ σ 2 1 =^ σ

2 2 =^...^ =^ σ

2 g =^...^ =^ σ

2 G H 1 : σ g^2 6 = σ^2 h para algún g 6 = h

El contraste de Levene (1960) es una alternativa al contraste de Bartlett. La ventaja del contraste de Levene (1960) es que es menos sensible que el de Bartlett a desviaciones de la normal. El contraste de Bartlett es superior únicamente en el caso en el que haya una evidencia abrumadora de que los datos se distribuyan como una normal.

El estadístico de Levene se define como:

W =

∑ng g=1 ng( Z¯g − Z¯)^2 /(G − 1) ∑G g=

∑ng i=1(Zgi^ −^ Z¯g) (^2) /(n − G) (3.22)

donde Zgi responde a: Zgi = |Ygi − Y¯g|

siendo Y¯g la media, mediana, o media “trimmed”^3 del grupo g. Levene propuso única- mente el uso de la media, si bien más adelante otros autores (Brown and Forsythe, 1974) plantearon la extensión a los otros dos casos basados en evidencia de Monte Carlo.

De acuerdo con el contraste de Levene, rechazaremos la H 0 de igualdad de varianzas cuando W > FG− 1 ,n−G.

El contraste de Bartlett (ver, por ejemplo Snedecor and Cochran, 1989), al igual que el de Levene, se utiliza para contrastar si G muestras tienen la misma varianza. Sin embargo, el contraste de Bartlett es sensible a desviaciones de la normalidad. Es decir, si las muestras son no-normales (no se cumple el supuesto de normalidad multivariante), el contraste de Bartlett podría estar contrastando únicamente la no-normalidad. En tal caso, el contraste de Levene resultará más apropiado.

Como es fácil de suponer, la hipótesis nula a contrastar es la misma:

Contraste de Bartlett:

{ H

0 :^ σ^21 =^ σ 22 =^...^ =^ σ g^2 =^...^ =^ σ G^2 H 1 : σ^2 g 6 = σ h^2 para algún g 6 = h

Y el estadístico que utilizaremos para el contraste es:

T =

(n − G)lns^2 p −

∑G

g=1(ng^ −^ 1)lns

2 g 1 + (^) 3(G^1 −1)

G g=

1 ng − 1 −^

1 n−G

(^3) Media en la que se eliminan observaciones atípicas, en general de los extremos de la distribución.

donde s^2 g es la varianza muestral del grupo g (¿cuál es la varianza poblacional?) y spg es la varianza agrupada (pooled variance) que, como se ha demostrado con anterioridad, coincide con la media cuadrática residual o intra-grupo (M C(intra)).

Dado que T ∼ χ^2 con G − 1 grados de libertad (T ∼ χ^2 G− 1 ), rechazaremos la hipótesis nula cuando: T > χ^2 G− 1

Nótese, por otra parte, que la valoración al interpretar el resultado de ambos contrastes (Levene y Bartlett) es, por así decirlo, opuesta a un contraste de hipótesis habitual, donde en general se busca evidencia empírica suficiente para poder rechazar la H 0 a un nivel de significación que consideremos razonable. En este caso, dado que la hipótesis nula estipula la igualdad de varianzas, que es uno de los supuestos necesarios para poder aplicar ANOVA, lo bueno será que no podamos rechazar la H 0 , a un nivel de significación estipulado a priori.

De no cumplirse el supuesto de homogeneidad de varianzas, análogamente al incumpli- miento del supuesto de homocedasticidad en el modelo de regresión lineal, podremos llevar a cabo algún tipo de transformación que puedan facilitar su cumplimiento. Algu- nas transformaciones habituales, sobre todo en casos como la existencia de datos de corte transversal, son tomar logaritmos, la raíz cuadrada o elevar al cuadrado. Una familia de transformaciones más sistematizada es la conocida como transformaciones Box-Cox.

La familia de transformaciones Box-Cox suele considerarse no sólo cuando las varianzas son diferentes según el nivel del factor (por ejemplo, cuando hay mayor varianza para valores más altos de las medias de cada grupo), sino también cuando a través de la representación gráfica de los residuos tenemos indicios de la ausencia de aleatoriedad e independencia. Si bien a través de la representación gráfica de los residuos simplemente podemos tener “indicios” del incumplimiento de la aleatoriedad e independencia, también es cierto que después de llevar a cabo transformaciones Box-Cox la representación gráfica de los residuos puede ofrecer un aspecto más razonable.

Según la familia de transformaciones Box-Cox podremos agrupar las transformaciones sobre los datos dentro de la siguiente tipología:

h(Ygi) =

{ Y (^) giλ− 1 λ si^ λ^6 = 0 lnYgi si λ = 0

El valor de λ puede aproximarse partiendo del hecho de que si sg = k × Y¯ (^) gα , entonces λ = 1 − α, donde sg sería la desviación típica muestral del grupo g, e Y¯g sería la media muestral del grupo g. Dependiendo del valor que tome el parámetro α, que determinará la forma funcional que relaciona la desviación típica y la media del grupo g, tendremos que llevar a cabo una u otra transformación de entre las posibles dentro de la familia.

Algunas de las transformaciones más populares y habituales que pueden corregir el in- cumplimiento del supuesto de homogeneidad de varianzas son las que aparecen en el

3.5. Análisis ex post: intervalos de confianza y compa-

raciones múltiples

Si una vez llevado a cabo el contraste de la hipótesis de igualdad de medias el resultado ha sido que rechazamos la hipótesis nula, el factor será relevante (esto es, explica la mayor parte de las diferencias entre las medias). Sin embargo, dicha conclusión implica únicamente que al menos dos medias difieren, algo que, en caso de tener un número elevado de grupos, puede tener un significado limitado. Por ejemplo, en el caso de tener 3 grupos (G = 3), la hipótesis nula a contrastar es:

H 0 : μ 1 = μ 2 = μ 3 H 1 : μg 6 = μh algún g 6 = h

Pues bien, podemos obtener unas conclusiones mucho más precisas y de mayor utilidad para el analista llevando a cabo un análisis en el que comparamos las hipótesis que subyacen a esta hipótesis compuesta, esto es:

Hipótesis 1:

{ H

0 :^ μ 1 =^ μ 2 H 1 : μ 1 6 = μ 2

Hipótesis 2:

{ H

0 :^ μ 1 =^ μ 3 H 1 : μ 1 6 = μ 3

Hipótesis 3:

{ H

0 :^ μ 2 =^ μ 3 H 1 : μ 2 6 = μ 3

Si bien en un ejemplo sencillo en el que G = 3 el número de posibles comparaciones (múltiples) es controlable, crece muy rápidamente conforme aumenta el número de grupos. En concreto, dado que en general contemplaremos problemas con G grupos en los que hacemos las comparaciones por pares de grupos o grupos escogidos de dos en dos, el número total de comparaciones en el caso general será:

c =

( G

G!

2!(G − 2)!

G(G − 1)

A la hora de llevar a cabo el análisis ex post podremos proceder por dos vías equivalentes. Una es calcular intervalos de confianza individuales. La otra consiste en aplicar el método de Bonferroni.

3.5.1. Intervalos de confianza

En el contexto que acabamos de describir, un modo de contrastar las hipótesis simples planteadas una por una es calcular intervalos de confianza individuales para cada una de las medias de cada grupo μg. De esta forma, en caso de que los intervalos que obtenemos para las medias se solapen será evidencia a favor de que las diferencias entre las dos medias no son significativas, mientras que si los intervalos no se solapan las diferencias entre las medias serán significativas.

Los límites superior e inferior del intervalo de confianza pueden calcularse a partir de los datos. En este intervalo estará siempre la media muestral, Y¯g, y “confiamos” (de ahí el nombre de intervalo de confianza) que también esté μg.

En nuestro problema tenemos muestras de tamaño ng, con media μg y varianza constante σ^2. Bajo estas circunstancias, y sabiendo que la media muestral de cada grupo responde a la expresión:

Y^ ¯g =

∑ng i=1 Ygi ng

se tendrá que los parámetros que describen su distribución en el muestreo serán:

Media : E[ Y¯g] = E

[∑ng i=1 Ygi ng

]

= (1/ng)E

[ (^) ∑ng

i=

Ygi

]

= (1/ng)

[ (^) ∑ng

i=

E[Ygi]

]

= (1/ng)

∑^ ng

i=

μg = μg

Varianza : V ar[ Y¯g] = V ar

[∑ng i=1 Ygi ng

]

= (1/n^2 g)V ar

[ (^) ∑ng

i=

Ygi

]

= (1/n^2 g)

[ (^) ∑ng

i=

V ar(Ygi)

]

= (1/n^2 g)

[ (^) ∑ng

i=

σ^2

]

= (1/n^2 g)

[

ngσ^2

]

= σ^2 /ng

Por tanto, la distribución en el muestreo de la varianza muestral de cada grupo, Y¯g, será:

Y^ ¯g ∼ N (μg, σ^2 /ng) (3.26)

A partir de la expresión (3.26) podremos llegar a construir un intervalo de confianza para μg. Si tipificamos la expresión (3.26) se tendrá que:

Y^ ¯g − μg √ σ^2 ng

∼ N (0, 1) (3.27)