Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


ANOVA, Apuntes de Psicología

Asignatura: MEP, Profesor: , Carrera: Psicologia, Universidad: UAB

Tipo: Apuntes

2013/2014

Subido el 27/02/2014

nrp91
nrp91 🇪🇸

4.1

(96)

20 documentos

1 / 42

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Diseño de experimentos: ANOVA
Elisa Mª Molanes López
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a

Vista previa parcial del texto

¡Descarga ANOVA y más Apuntes en PDF de Psicología solo en Docsity!

Diseño de experimentos: ANOVA

Elisa Mª Molanes López

Un ejemplo introductorio ¾

Un ingeniero de desarrollo de productos desea maximizar la resistencia a

la tensión de una nueva fibra sintética que se utilizará para fabricar camisas. ¾

Por experiencia, parece que la resistencia (o fortaleza) se ve influida por el

% de algodón presente en la fibra. ¾

También se sospecha que valores elevados de % de algodón repercuten

negativamente en otras cualidades de calidad que se desean (por ej. que lafibra pueda recibir un tratamiento de planchado permanente). ¾

Ante esta situación, el ingeniero decide tomar cinco muestras para

diferentes niveles de % de algodón y medir la fortaleza de las fibras asíproducidas.

Un ejemplo introductorio

A la hora de fabricar las 25 fibras anteriores se debe seguir una secuencia

aleatorizada. ¾

Esta aleatorización en la secuencia de fabricación es necesaria para evitar que los

datos observados (la fortaleza de los tejidos), sean contaminados por el efecto deotras variables que no conocemos y por tanto no podemos controlar. ¾

Supongamos que se fabrican las 25 fibras sin un mecanismo aleatorizado, es decir,

siguiento el orden original (primero se fabrican las 5 fibras con un 15 % de algodón,luego las 5 fibras con un 20% de algodón, y así sucesivamente). ¾

En esta situación, si la máquina que mide la fortaleza de la fibra presentase un

efecto de calentamiento de modo que a mayor tiempo de funcionamiento diesemenores lecturas de resistencia, entonces los datos se contaminarían. Por ese efectode calentamiento, la fortaleza de las fibras fabricadas con un 35% de algodónresultarían negativamente muy contaminadas. No pasaría lo mismo con las fabricadascon un 15% de algodón. ¾

Si aleatorizamos la fabricación de las 25 fibras, se espera que este efecto esté

presente por igual en todos los % de algodón, de modo que las comparaciones entrelos distintos niveles siguen siendo válidos.

Un ejemplo introductorio

El análisis de la varianza nos ayudará a responder las siguientescuestiones: ¾

¿Influye el % de algodón en la fortaleza de la fibra fabricada?

Si es así, ¿qué niveles de % de algodón son similares y

cuáles no?

Notación

y

ij

se refiere a la observación

j

-ésima de la variable

y

(fortaleza) en el

grupo

i

-ésimo del factor (% de algodón).

y

i

P

n

i

j

y

ij

El punto significa que sumamos sobreel índice que sustituye.

y

i

y

i

n

i

Es la suma de las

n

i

observaciones

del grupo

i

Es la media de la

n

i

observaciones

del grupo

i

y

P

I i

P

n

i

j

y

ij

y

y

n

n

n

I

n

n

n

I

n

El modelo teórico

Es la media global de

y

Lo que se desvía la mediade

y

en el grupo

i

-ésimo con

respecto a la media globalde

y

Es el error aleatorio. Lo que se desvíala observación

y

ij

de su media de

grupo. Es la pertubación debida alerror experimental

Media de

y

en el grupo

i

-ésimo

Las observaciones se describen según el siguiente modelo lineal:

i

i

y

ij

i

u

ij

Estimación del modelo

¾

En el modelo teórico existen ciertos parámetros desconocidos que

estimaremos utilizando los datos observados. ¾

Existen I+1 parámetros desconocidos, las I medias de grupo y la

varianza del error experimental. ¾

Para estimar estos parámetros utilizaremos el método de máxima

verosimilitud. ¾

Para ello, primero necesitamos definir la función de verosimilitud

L

y

maximizarla. ¾

Maximizar

L

será equivalente a maximizar el logaritmo neperiano de

L

,

ln

(L)

.

¾

Para maximizar ln

(L)

, derivamos con respecto a los I+1 parámetros

desconocidos, igualamos a cero las I+1 derivadas que obtenemos yresolvemos el sistema de I+1 ecuaciones que resulta (en este sistema lasincógnitas son los parámetros desconocidos del modelo).

Estimación por máxima verosimilitud

En base a las hipótesis del modelo se verifica que:

y

ij

=

μ

τ

i

u

ij

u

ij

N

(

,

σ

)

y

ij

N

(

μ

i

,

σ

)

La función de verosimilitud es:

L(

μ

,... , μ

I

,

σ

) =

Q

I i

Q

n

i

j

f

(

y

ij

)

donde:

f

(

y

ij

) =

πσ

2

exp

n

y

ij

μ

i

2

σ

2

o

es la función de densidad de una normal con media

y varianza

μ

i

σ

Estos parámetros delmodelo se suponen fijos,y por tanto, no aleatorios

Estimación de la varianza

P

Ii

=

P

n

i

j

=

y

ij

μ

i

2

n

Este estimador de la varianza presentaun problema. Se trata de un estimadorsesgado.

Un buen estimador de la varianza debería ser insesgado, i.e. deberíaverificar que su media fuese igual a la varianza (el parámetro queestima). Sin embargo sucede que:

E

Buscaremos otro estimador de la varianza que sea insesgado.Pero antes de ello, definiremos los residuos y veremos cómo expresaren función de los residuos.

Estimación de la varianza

De acuerdo con el modelo:Así que podemos estimar los errores mediante:A estas estimaciones de los errores o perturbaciones del modelo, se lesllama

residuos

y los denotaremos por

Estos residuos miden la variabilidad de

y

no explicada por el modelo.

(Se sustituye por su estimación)

Además, sucede que:

e

ij

e

ij

u

ij

y

ij

y

i

u

ij

y

ij

i

u

ij

y

ij

i

¯e

n

P

I i

P

n

i

j

e

i

n

P

I i

P

n

i

j

y

ij

y

i

n

P

I i

y

i

n

i

y

i

n

P

I i

y

i

y

i

n

P

I i

P

n

i

j

e

2 ij

n

P

I i

P

n

i

j

e

ij

e

es la varianza de los residuos

ˆ σ

2

Estimación de la varianza

Como ya sucedió en otras ocasiones, utilizaremos entonces la varianzaresidual para estimar la varianza del error, que es una corrección depor grados de libertad.

Se trata de una media ponderada de las cuasivarianzas de cada grupo

n

I

P

I i

n

i

S

i

S

i

n

i

P

n

i

j

y

ij

y

i

Cuasivarianza de

y

en el grupo

i

-ésimo

Dividimos entre (

n-I)

en

lugar de

n

s

2 R

n

I

P

I i

P

n

i

j

e

2 ij

Estimación de la varianza

Se puede comprobar que

sí es un estimador

insesgado para

s

2 R

n

I

P

I i

P

n

i

j

e

2 ij

Propiedades de los estimadores

Se verifica que:

n

i

S

2 i

σ

2

P

n

i

j

=

y

ij

y

i

2

σ

2

2 n

i

La suma de variables aleatorias chi cuadrado sigue una distribución chicuadrado con g.l igual a la suma de los g.l de cada componente en la suma

P

I i

n

i

n

I

Son losgrados delibertad (g.l.)

s

2 R

n

I

P

I i

n

i

S

i

n

I

s

2 R

σ

2

P

Ii

=

n

i

S

2 i

σ

2

2 P

Ii

=

n

i

n

I

s

2 R

σ

2

P

Ii

=

n

i

S

2 i

σ

2

2 n

I

Objetivo: Comparar los grupos

Una vez estimadas las medias de grupo y la varianza del error, a partirde los datos, podremos realizar comparaciones entre grupos.Los grupos se compararán a través de sus medias de grupo, perotambién teniendo en cuenta su variabilidad.

Nos interesará, contrastar en primer lugar si existen diferenciasestadísticamente significativas entre las medias de grupo.Si este contraste nos indica que sí existen diferencias, entonces ensegundo lugar nos interesará saber qué par de medias (es decir, qué parde grupos) se diferencian entre sí

ANOVA

Método de Fischer