Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Introducción al Análisis de Varianza: Prueba de Hipotesis entre Múltiples Grupos - Prof. S, Apuntes de Biología

Este documento introduce el análisis de variancia (anova) como herramienta estadística para comparar las medias de varios grupos y determinar si existen diferencias significativas entre ellas. El texto explica el cálculo de las sumas de cuadrados totales, entre grupos y error, y la prueba de levene para la homocedasticidad. Además, se presentan ejemplos con datos para ilustrar el proceso.

Tipo: Apuntes

2013/2014

Subido el 26/02/2014

lauralauritaa
lauralauritaa 🇪🇸

4

(9)

9 documentos

1 / 24

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA11.INTRODUCCIÓNALANÁLISISDELAVARIANZA
Queremos saber si el efecto de cuatro plaguicidas es el mismo o no. Para ello
plateamos el análisis del factor Plaguicida con 4 niveles o tratamientos (los cuatro
plaguicidas) respecto de la variable respuesta Y=porcentaje de hortalizas dañadas.
Tomamos una muestra de cada tratamiento con tamaños muestrales n1=13, n2=9,
n3=7 y n4=10. N=39, k=4. Los datos obtenidos son los siguientes:
Plaguicida1 Plaguicida2Plaguicida3 Plaguicida4
8,7 8,4 9,3 8,4
7,2 7,9 8,1 5,8
8,3 6,9 6,7 9,2
7,7 5,8 9,9 7,8
5,9 7,2 7,6 6,6
8,3 4,7 3,9 5,8
4,5 6,8 8,8 6,7
8,4 5,7 6,9
8,1 8,3 8,3
7,3 5,8
8,6
5,3
6,5
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18

Vista previa parcial del texto

¡Descarga Introducción al Análisis de Varianza: Prueba de Hipotesis entre Múltiples Grupos - Prof. S y más Apuntes en PDF de Biología solo en Docsity!

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

Queremos saber si el efecto de cuatro plaguicidas es el mismo o no. Para elloplateamos el análisis del factor Plaguicida con 4 niveles o tratamientos (los cuatroplaguicidas) respecto de la variable respuesta Y=porcentaje de hortalizas dañadas.Tomamos una muestra de cada

tratamiento con tamaños muestrales n

=13, n 1

n=7 y n^3

=10. N=39, k=4. Los datos obtenidos son los siguientes: 4

Plaguicida

1

Plaguicida

2

Plaguicida

3

Plaguicida

4

8,^

8,^

9,^

8,

7,^

7,^

8,^

5,

8,^

6,^

6,^

9,

7,^

5,^

9,^

7,

5,^

7,^

7,^

6,

8,^

4,^

3,^

5,

4,^

6,^

8,^

6,

8,^

5,^

6,

8,^

8,^

8,

7,^

5,

8,6 5,3 6,

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

El análisis de la varianza (ANOVA) de un factor o una vía a efectos fijos nospermite contrastar la igualdad de las medias de varias poblaciones, no deúnicamente dos como hemos hecho hasta ahora. Es decir, si tenemos kmuestras provenientes de k poblaciones vamos a plantear el contraste:Para poder utilizar esta técnica es indispensable que las k poblaciones siganuna ley de probabilidad normal y que sean homocedásticas, esto es, quetengan la misma varianza. Es decir, cada i

‐ésima población seguirá una normal

con media

μy desviación típicai^

σ. Si alguno de estos requisitos no se cumplen

no es apropiado utilizar esta técnica y tendríamos que utilizar un contraste noparamétrico equivalente (por ejemplo, Kruskal

‐Wallis).

0 1

2 : : al menos dos son distintos 1

k

H^ μ H

=^
=^ ="

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

Cada nivel (esto es, cada muestra proveniente de una población) tendrá unamedia muestral que vendrá dada por:Esto es, la suma de todas las observaciones del nivel (o muestra) i

‐ésimo

entre el número de observaciones n

de dicho nivel. Además podemos definiri^

la media muestral total, esto es, la suma de las medias muestrales de cadanivel entre el número de niveles k:A partir de estas medias muestrales y las observaciones definimos variassumas de cuadrados

n^ i ij^1 j i

Y i Y^

= n

k Yi^1 i Y^

  • = k

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

-^ Suma de cuadrados total o SST. Es la suma de las diferencias al cuadradode cada observación menos la media muestral total: •^ Suma de cuadrados de los tratamientos o SSA. Es la suma de la diferenciaal cuadrado de la media muestral de cada nivel menos la media muestraltotal por el número de observaciones en cada nivel: •^ Suma de cuadrados del error o SSE. Suma de las diferencias al cuadrado decada observación menos la media de su tratamiento:De manera que se cumple que

(^

nk^ i 1 1 ij i^ j SST^

Y^ Y

•• =^ =^ =

(^

k i^^1

i i SSA^

n^ Y^

Y • ••
=^ =

(^

nk^ i 1 1 ij^ i i^ j SSE^

Y^ Y

=^ =^ =

∑∑ SST^ SSA

SSE
=^

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

A partir de las sumas de cuadrados anteriores podemos calcular la suma decuadrados media del error (MSE) y de los tratamientos (MSA):Puesto que cada uno de estos cuadrados medios es un estadístico, es tambiénuna^

variable

aleatoria.

Como

tal,

cada

uno

tiene

una

distribución

de

probabilidad y un valor medio o esperado. Estos valores esperados sonparticularmente

importantes

porque

proporcionan

la^

base

lógica

para

contrastar la igualdad de las medias por el procedimiento ANOVA. Se puedeprobar que:

1 , donde 1

k i i

SSE MSE

N^

n

N^ k SSA MSA k

=

=^

(^

) (^

)

(^

)

2

2

2

1

1 , donde 1 k i^

i^

k

i^

i i

E MSE

n

E MSA

k^

k

σ^

μ^ μ

=

=

=^
+^

∑^

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

Es^ decir,

MSE

es^ un

estimador

insesgado de

2 σ.^ ¿Qué

sucede

con^

MSA?

Si

consideramos

Hcierta,^0

debe

cumplirse

que:

Y,^ por

lo^ tanto

Y,^ entonces

E(MSA)=

2 σ.^ Es

decir,

bajo

Hcierta,^0

MSA

también

es^ un

estimador

insesgado de

2 σ.^ En

cambio,

si^ H^0

es^ falsa,

MSA

sobreestima

2 a σ

,^ ya^ que

el

término

que

se^ suma

será

siempre

positivo.

1

2

i

μ^ μ

μ^ μ

=^
=^ =

(^

)^

(^

)

2

2

1

1

k^

k i^ i^

i

i^

i n^

n

k^

k

μ^ μ

μ^ μ

=^

= −^

=^
−^

∑^

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

En este caso, cuando H

es cierta, este cociente debe estar próximo a 1, 0

mientras que si no es cierta tomará valores superiores a 1. Es decir, valoresmuy grandes de este estadístico nos llevan a rechazar H

y, por lo tanto, el 0

criterio de rechazo que aplicaremos, para un nivel de significación

α, será:

(^

)

(^

) 0

1,

0

Rechazo Ho equivalentementesi^

, se rechaza H

k^ N^ k msaf

f mse

P^ valor

p F

f^

P^ valor

α^

−^ −

⇔^

=^
−^
=^
≥^
⇔^
−^

Los resultados de un análisis de la varianza se suelen presentar en una tablallamada tabla de ANOVA:

Fuente de variación

suma de cuadrados

g.l.^

cuadrados medios

f^

p-valor

Tratamientos

ssa^

k-1^ msa=ssa/(k-1)

msa/mse

p(F≥f)

Error^

sse^

N-k^ mse=sse/(N-k)

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

Queremos saber si el efecto de cuatro plaguicidas es el mismo o no. Para elloplateamos el análisis del factor Plaguicida con 4 niveles o tratamientos (los cuatroplaguicidas) respecto de la variable respuesta Y=porcentaje de hortalizas dañadas.Tomamos una muestra de cada

tratamiento con tamaños muestrales n

=13, n 1

n=7 y n^3

=10. N=39, k=4. Los datos obtenidos son los siguientes: 4

Plaguicida

1

Plaguicida

2

Plaguicida

3

Plaguicida

4

8,^

8,^

9,^

8,

7,^

7,^

8,^

5,

8,^

6,^

6,^

9,

7,^

5,^

9,^

7,

5,^

7,^

7,^

6,

8,^

4,^

3,^

5,

4,^

6,^

8,^

6,

8,^

5,^

6,

8,^

8,^

8,

7,^

5,

8,6 5,3 6,

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

Prueba de Levene para homogeneidad de varianzas La técnica del ANOVA es muy sensible a la homocedasticidad. Por eso esconveniente comprobar que las varianzas son iguales. Es decir, plantearemosel contraste: Para desarrollar este contraste se utiliza, entre otros, el estadístico W deLevene, definido como:donde

2

2

2

0 1

2 : : al menos dos difieren 1

k

H^ σ H

=^
=^ =…

(^

)^

(^

(^

)^

(^

1

2 1 1

k i^ i

i i nk

ij^ i i^ i^ j N^ k

n^ Z^

Z
W

k^

Z^
•^ •• Z

=

  • =^ = −^ ×
−^

1 1

1

,^

mediana de la iésima clase

1

i^

i

ij^

ij^ i^

i n^

n

k

ij^

i^

ij

i^ j^

ji

Z^
Y^ Y
Y
Z^
Z^
Z^
Z
N^

n

-^

••^

=^ =^

=

=^
−^
=^
^

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

Este estadístico bajo H

cierta sigue una ley F de Fisher con (k 0

‐1) y (N

‐k)

grados de libertad. Entonces el criterio para rechazar H

, con un nivel de 0

significación

α, es:

(^

)(^

)

(^

)(^

)

(^

0

0

se Rechaza H

se Rechaza H

w^ F

k^

N^ k

o si P^

valor

p F

k^

N^ k

w

P^ valor

α

⇔^
≥^
−^
−^
=^
−^
−^ ≥
⇔^
−^

En el ejemplo anterior de los plaguicidas el valor del estadístico w=0.3484. Como

(^ )(^

) (^3) 0.

F^

no^ rechazamos

la^ hipótesis

de^ homocedasticidad.

El^ P‐

valor

sería:

(^ )(^

)

(^

P^ valor

p F −^

=^
≥^

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

EJERCICIO 63

Para investigar si hay diferencias significativas en el efecto producido por cuatro fármacos respecto de una determinada variable fisiológica, se diseñó elsiguiente

experimento.

Se^

tomó

una

muestra

aleatoria

de^

45 pacientes

y^ se

distribuyeron al azar en cinco grupos del mismo tamaño, reservando un grupo paracontrol y administrando cada fármaco a los pacientes de un grupo. Se contrastó lanormalidad y la homocedasticidad

y se aplicó un anova. Para la suma de los

cuadrados de los tratamientos (SSA) se obtuvo el valor 70,856 y para la suma de loscuadrados del error o dentro de los grupos (SSE) el valor 25,395. Describir la tablaanova.

Explicar

razonadamente

si^ debe

aceptarse

o^ rechazarse,

a^ un

nivel

de

significación

α =0,05, la hipótesis "no hay diferencia entre los efectos". Una vez

realizado el contraste y adoptada la decisión consecuente ¿de qué modo debieraprocederse?^ Como

el^ p‐

valor

es^ menor

que^

el^ nivel

de^ significación,

rechazamos

la^ hipótesis

de

que^ no

hay^ diferencia

entre

los^ efectos.

Lo^ que

deberíamos

hacer

ahora

es^ un

contraste

a^ posteriori

(LSD

de^ Fisher

por^ ejemplo)

para

determinar

entre

qué

tratamientos

hay^ diferencias

(^0 1) significativas. :^2 : al menos dos son distintos 1

k

H^ μ H

μ

μ =^ =

="

Fuente^

de^ variación

suma

de^ cuadrados

g.l.^

cuadrados

medios

f^

p‐valor

Tratamientos

70.^

5 ‐^1

17.^ 27.^

4e‐^11

Error^

25.^

45 ‐^5

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

EJERCICIO 64

Interesa comparar la rapidez con que actúan tres analgésicos, se eligen aleatoria e independientemente 18 pacientes se les distribuye al azar en cuatro grupos, demodo que haya 3 en el primero y 5 en cada uno de los otros tres, cuando el paciente declaraestar afectado por dolor de cabeza se le administra el fármaco y se mide el tiempotranscurrido hasta que declara que ha desaparecido el dolor, en unidades de 15 minutosredondeando a la más próxima. Al grupo 1 se le administra un placebo (sin efecto alguno),al 2 el fármaco A, al 3 el fármaco B y al 4 el fármaco C. Los resultados se recogen en lasiguiente tabla:

Vamos a analizar el factor analgésico con 4 niveles: 1 placebo, 2fármaco A, 3 fármaco B y 4 fármaco C, respecto a la variablerespuesta

Y=tiempo

transcurrido

hasta

que

se^

declara

la

desaparición del dolor. N=18 y k=4 (k

‐1=3, N

‐k=14)

Grupo^ 1 Grupo

2 Grupo

3 Grupo

4

7

4

3

3

6

6

4

3

8

5

5

2 4

5

4 5

5

3

Primero contrastamos la homocedasticidad para ver si podemos aplicar un ANOVA. El valordel estadístico de Levene es w=0.1324, y su p

‐valor=0.94. Por lo tanto no rechazamos la

hipótesis nula de igualdad de las varianzas y podemos aplicar el ANOVA.

Fuente^ de

variación

suma

de^ cuadrados

g.l.^

cuadrados

medios

f^

p‐valor

Tratamientos

(entre^ grupos)

30.^

3

10.^ 14.^

Error^ (intra

grupos)

10.^

14

Como el p

‐valor del ANOVA es inferior a

α, rechazamos la hipótesis nula de igualdad entre

las medias de los tratamientos o niveles. Es decir, al menos dos tratamientos tienen mediasdiferentes.

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

EJERCICIO 66 Se ha diseñado un experimento de laboratorio reservando un grupo 0 comogrupo control y tratando a otros dos grupos, I y II; en todos los casos con muestras delmismo tamaño; con diferentes acciones. Los resultados se recogen en el siguiente cuadro:Las medias de los grupos o tratamientos han sido: grupo 0: 22.858, grupo I: 29.57, grupo II:31.638, y

t (12)(0.025)

=2.179. La prueba de Levene ha provocado un

P ‐valor de 0.37. Analizar las

siguientes proposiciones y señalar cuáles son acertadas y cuáles son erróneas: a)^ El

análisis

es^ válido

si^ se ha^ contrastado

normalidad

en^ los

tratamientos.

Cierto

Fuente^

de^ variación

suma

de^ cuadrados

g.l.^

cuadrados

medios

f^

p‐valor

Tratamientos

(entre^ grupos)

2

16.^

Error^ (intra

grupos)

76.^

12

Totales

14

b)^ La

prueba

de^ Levene

no^ induce

al^ rechazo

de^ la

hipótesis

nula,

es^ admisible

la

homocedasticidad de

los^ grupos.

Cierto c) Se^ rechaza

la^ hipótesis

nula

de^ que

las^ medias

de^ las

poblaciones

es^ la

misma

Cierto

para

un^ nivel

de^ significación

α=0.05,

puesto

que^

el^ p‐valor=0.

d)^ p(F

Falso,

este valor

es^ precisamente

el^ P‐

valor=0.

TEMA

INTRODUCCIÓN

AL^

ANÁLISIS

DE

LA^

VARIANZA

e)^ Hay

diferencias

estadísticamente

significativas

entre

los^ grupos

I^ y^ II.

Falso, ya que: f) Hay^

diferencias

estadísticamente

significativas

entre

los^ grupos

0 y^ I.

Cierto, ya que: g) Hay^

diferencias

estadísticamente

significativas

entre

los^ grupos

0 y^ II.

Cierto,

ya^ que: h)^ Se

concluye

que^ las^ dos

acciones

tienen

efecto

y^ que

no^ hay

una^

diferencia

estadísticamente

significativa

entre

ellas

Cierto

(^ )

2 3

2 3

12

1 1

1 1

5 5

y^ y

t

mse^ −^ • • n^ n

− =^

=^

<^

=

⎛^

⎞^

⎛^

⎞+

+^

⎜^

⎜^

⎟^

⎝^

⎝^

(^ )

1 2

1 2

12

1 1

1 1

5 5

y^ y

t

mse^ −^ • • n^ n

− =^

=^

^

=

⎛^

⎞^

⎛^

⎞+

+^

⎜^

⎜^

⎟^

⎝^

⎝^

(^ )

1 3

1 3

12

1 1

1 1

5 5

y^ y

t

mse^ −^ • • n^ n

− =^

=^

^

=

⎛^

⎞^

⎛^

⎞+

+^

⎜^

⎜^

⎟^

⎝^

⎝^

i)^ El

número

total

de^ observaciones

es^14

Falso,

es^15 j)^ Una

estimación

puntual

de^ la

varianza

común

a^ todos

los^ grupos

es^ 6.

Cierto,

se^ trata

de^ mse=6.