Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


no paramétricos, Apuntes de Idioma Español

Asignatura: español, Profesor: Hidatidosis Hidatidosis, Carrera: Ingeniero Técnico Agrícola, especialidad Explotaciones Agropecuarias, Universidad: UNAVARRA

Tipo: Apuntes

2013/2014

Subido el 28/12/2014

jfrankieb
jfrankieb 🇪🇸

2 documentos

1 / 200

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Curso de Modelos no Param´etricos
Pedro Delicado
Departament d’Estad´ıstica i Investigaci´o Operativa
Universitat Polit`ecnica de Catalunya
14 de septiembre de 2008
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga no paramétricos y más Apuntes en PDF de Idioma Español solo en Docsity!

Curso de Modelos no Param´etricos

Pedro Delicado

Departament d’Estad´ıstica i Investigaci´o Operativa

Universitat Polit`ecnica de Catalunya

14 de septiembre de 2008

    1. Contrastes no param´etricos cl´asicos Prefacio V
    • 1.1. Introducci´on
    • 1.2. Contrastes de bondad de ajuste
      • 1.2.1. La funci´on de distribuci´on emp´ırica
      • 1.2.2. El contraste de Kolmogorov-Smirnov
      • 1.2.3. Bondad de ajuste a un modelo param´etrico.
    • 1.3. Contrastes de localizaci´on
      • 1.3.1. El test del signo
      • 1.3.2. Test de Wilcoxon de los rangos signados
    • 1.4. Comparaci´on de dos muestras independientes
      • 1.4.1. Test de Kolmogorov-Smirnov para dos muestras
      • 1.4.2. Test de Mann-Whitney-Wilcoxon
    • 1.5. Comparaci´on de m´as de dos muestras
      • 1.5.1. Muestras independientes: Test de Kruskal-Wallis
      • 1.5.2. Muestras relacionadas: Test de Friedman
    • 1.6. Medida de la dependencia
      • 1.6.1. Coeficiente τ de Kendall
      • 1.6.2. Coeficiente de correlaci´on de rangos de Spearman
    • 1.7. Comentarios finales
    1. Introducci´on a los m´etodos de suavizado
    • 2.1. Introducci´on
    • 2.2. Usos de los m´etodos de suavizado.
    1. Estimaci´on no param´etrica de la densidad
    • 3.1. La estimaci´on de la densidad
    • 3.2. El histograma y el pol´ıgono de frecuencias
      • 3.2.1. Motivaci´on del histograma
    • 3.2.2. Caracter´ısticas del histograma ii ´INDICE GENERAL
    • 3.2.3. Propiedades locales del estimador histograma
    • 3.2.4. Propiedades globales del estimador histograma
    • 3.2.5. Elecci´on del par´ametro de suavizado b
    • 3.2.6. El pol´ıgono de frecuencias
    • 3.2.7. Comportamiento asint´otico del pol´ıgono de frecuencias
  • 3.3. Estimador n´ucleo de la densidad - densidad 3.3.1. Comportamiento asint´otico del estimador n´ucleo de la
    • 3.3.2. Problemas de los estimadores n´ucleo y algunas soluciones
  • 3.4. Selecci´on autom´atica del par´ametro de suavizado
    • 3.4.1. Regla de referencia a la normal
    • 3.4.2. Sobresuavizado
    • 3.4.3. Validaci´on cruzada por m´ınimos cuadrados
    • 3.4.4. Plug-in directo
    • 3.4.5. Validaci´on cruzada por m´axima verosimilitud
    • 3.4.6. Otros m´etodos
  • 3.5. Estimaci´on de la densidad multivariante
    • 3.5.1. Elecci´on de la matriz ventana
    • 3.5.2. Representaci´on de densidades tri-variantes
    • 3.5.3. La maldici´on de la dimensionalidad
  • 3.6. Inferencia basada en la estimaci´on de la densidad
    • 3.6.1. Bandas de variabilidad
    • 3.6.2. Contraste de normalidad
    • 3.6.3. Bandas de referencia normal
    • 3.6.4. Contraste de independencia
    • 3.6.5. Bootstrap en la estimaci´on de la densidad
    • 3.6.6. Contraste de igualdad de distribuciones
      • de la densidad 3.6.7. Discriminaci´on no param´etrica basada en estimaci´on
  • 3.7. Otros estimadores de la densidad
    • 3.7.1. Los k vecinos m´as cercanos
    • 3.7.2. Desarrollos en series de funciones ortogonales
    • 3.7.3. M´axima verosimilitud penalizada
    • 3.7.4. Verosimilitud local
    • 3.7.5. Representaci´on general
  • 3.8. Software
    • 3.8.1. Estimaci´on de la densidad en R
    • 3.8.2. Estimaci´on de la densidad en MATLAB
    1. Estimaci´on de la funci´on de regresi´on ´INDICE GENERAL iii
    • 4.1. El modelo de regresi´on no param´etrica
    • 4.2. Estimadores n´ucleo y polinomios locales
      • 4.2.1. Derivaci´on directa del estimador n´ucleo de la regresi´on
      • 4.2.2. Expresi´on matricial del estimador por polinomios locales
        • locales 4.2.3. Propiedades locales de los estimadores por polinomios
      • 4.2.4. Comportamiento en la frontera del soporte de x
      • 4.2.5. Elecci´on del grado del polinomio local
    • 4.3. Elecci´on del par´ametro de suavizado
      • 4.3.1. Error de predicci´on en una muestra test
      • 4.3.2. Validaci´on cruzada
      • 4.3.3. Validaci´on cruzada generalizada.
      • 4.3.4. Plug-in
      • 4.3.5. Comportamiento asint´otico de selectores de h
      • 4.3.6. Ventana variable
    • 4.4. Verosimilitud local - naria local 4.4.1. Discriminaci´on no param´etrica mediante regresi´on bi-
      • 4.4.2. Modelo de verosimilitud local
    • 4.5. Inferencia en el modelo de regresi´on no param´etrica
      • 4.5.1. Bandas de variabilidad
      • 4.5.2. Contraste de ausencia de efectos
      • 4.5.3. Contraste de un modelo lineal
      • 4.5.4. Contraste de un modelo lineal generalizado
      • 4.5.5. Igualdad de curvas de regresi´on
    1. Estimaci´on por splines
    • 5.1. Estimaci´on m´ınimo cuadr´atica penalizada
    • 5.2. Splines y splines c´ubicos. Interpolaci´on por splines
    • 5.3. Suavizado por splines
    • 5.4. Propiedades del estimador spline de m(x)
    • 5.5. B-splines
    • 5.6. Ajuste de un modelo no param´etrico general
    1. Regresi´on m´ultiple y modelo aditivo generalizado
    • 6.1. Regresi´on m´ultiple
    • 6.2. Modelos aditivos
    • 6.3. Regresi´on projection pursuit
    • 6.4. Modelos aditivos generalizados
    • 6.5. Modelos semiparam´etricos

Prefacio

Modelos param´etricos versus no param´etricos

Sea X variable aleatoria con distribuci´on de probabilidad dada por la funci´on de distribuci´on F. Diremos que la v.a. X sigue un modelo pa- ram´etrico si su distribuci´on de probabilidad F pertenece a una familia de distribuciones indexada por un par´ametro θ de dimensi´on finita:

X ∼ F ∈ FΘ = {Fθ : θ ∈ Θ ⊆ Rk}.

La familia de distribuciones FΘ recibe el nombre de modelo estad´ıstico param´etrico. Diremos que la v.a. X sigue un modelo estad´ıstico no param´etrico si sobre su distribuci´on F ´unicamente se suponen algunas condiciones de regularidad. Algunos ejemplos de estas condiciones son los siguientes:

F es una funci´on de distribuci´on absolutamente continua,

F es sim´etrica en torno a su mediana,

F tiene funci´on de densidad f con dos derivadas continuas.

Las restricciones impuestas sobre F indican que esta distribuci´on pertenece a un subconjunto de todas las posibles distribuciones de probabilidad, pero este subconjunto tiene dimensi´on infinita (no se puede indexar por un par´ametro de dimensi´on finita).

M´etodos no param´etricos

Son m´etodos de inferencia estad´ıstica v´alidos cuando no se hacen hip´otesis param´etricas sobre la distribuci´on de los datos. Distinguiremos dos familias de m´etodos. La primera fue desarrollada principalmente en las d´ecadas de los 40 y 50 del siglo XX, y la segunda en el ´ultimo tercio de ese siglo.

v

vi PREFACIO

M´etodos no param´etricos cl´asicos

Tienen por objetivo hacer inferencia sobre la distribuci´on de probabilidad F de X o sobre alguna caracter´ıstica suya que est´e bien definida sea cual sea la distribuci´on F (por ejemplo, la mediana o el rango intercuart´ılico de F ). Como no se conoce la distribuci´on F los m´etodos que se proponen se basan en estad´ısticos cuya distribuci´on en el muestreo no depende de F. Por ello se conocen como m´etodos libres de la distribuci´on de los da- tos, o m´etodos de distribuci´on libre (una mala traducci´on del t´ermino distribution-free en ingl´es). Estos son los m´´ etodos que trataremos en el Cap´ıtulo 1. Concretamente nos centraremos en contrastes de hip´otesis no param´etricos.

Estimaci´on no param´etrica de curvas

Son t´ecnicas que permiten estimar funciones relacionadas con la distri- buci´on de probabilidad de los datos. Por ejemplo se puede tener inter´es en estimar la funci´on de distribuci´on F (x), la funci´on de densidad f (x), la tasa de fallo λ(x) = f (x)/(1 − F (x)), la funci´on de regresi´on m(x) = E(Y |X = x) o la varianza condicional σ^2 (x) = V (Y |X = x). A estas t´ecnicas se dedicar´an los restantes cap´ıtulos.

2 CAP´ITULO 1. CONTRASTES NO PARAM ETRICOS CL ´ ASICOS´

Para ello se dispone de una muestra aleatoria simple (m.a.s.) X 1 ,... , Xn de X. Tambi´en consideramos las hip´otesis alternativas unilaterales H 1 : F (x) > F 0 (x) para todo x, o H 1 : F (x) < F 0 (x) para todo x. Vamos a estudiar el contraste de Kolmogorov-Smirnov (existen otras for- mas de realizar contrastes de bondad de ajuste, por ejemplo los contrastes de la χ^2 , basados en la categorizaci´on de los datos). El contraste de Kolmogorov-Smirnov se basa en calcular una distancia entre la funci´on de distribuci´on emp´ırica de los datos, Fn, y la funci´on de distribuci´on F 0 postulada bajo H 0. Recordemos la definici´on y propiedades de la funci´on de distribuci´on emp´ırica.

1.2.1. La funci´on de distribuci´on emp´ırica

Sea la variable aleatoria X con funci´on de distribuci´on F. Consideramos una muestra aleatoria simple de tama˜no n de X, es decir, X 1 ,... , Xn v.a.i.i.d. con distribuci´on dada por F. Sea x 1 ,... , xn una realizaci´on de esa m.a.s. Se llama funci´on de distribuci´on emp´ırica a la funci´on

Fn(x) =

n

#{xi ≤ x : i = 1... n} =

n

∑^ n

i=

I(−∞,x](xi),

donde

I(−∞,x](xi) =

1 , si xi ≤ x 0 , si xi > x,

que a cada n´umero real x le asigna la proporci´on de valores observados que son menores o iguales que x. Es inmediato comprobar que la funci´on Fn as´ı definida es una funci´on de distribuci´on:

  1. Fn(x) ∈ [0, 1] para todo x ∈ R.
  2. Fn es continua por la derecha.
  3. Fn es no decreciente.
  4. l´ımx−→−∞ Fn(x) = 0.
  5. l´ımx−→∞ Fn(x) = 1.

Concretamente, Fn es la funci´on de distribuci´on de una variable aleatoria discreta (que podemos llamar Xe) que pone masa 1/n en cada uno de los n puntos xi observados:

1.2. CONTRASTES DE BONDAD DE AJUSTE 3

xi x 1 x 2 · · · xn pi = P(Xe = xi) 1 /n 1 /n · · · 1 /n

A la distribuci´on de Xe se le llama distribuci´on emp´ırica asociada al conjunto de valores {x 1 ,... , xn}. Obs´ervese que si fijamos el valor de x y dejamos variar la muestra, lo que obtenemos es una variable aleatoria. En efecto, se tiene entonces que

Fn(x) =

n

∑^ n

i=

I(−∞,x](Xi),

donde

I(−∞,x](Xi) =

1 , si Xi ≤ x 0 , si Xi > x

y, por lo tanto, cada t´ermino I(−∞,x](Xi) es una variable aleatoria de Bernoulli con probabilidad de ´exito

p = P(I(−∞,x](Xi) = 1) = P(Xi ≤ x) = F (x).

De ah´ı se deduce que Fn es una variable aleatoria y que nFn(x) tiene distri- buci´on binomial con par´ametros n y p = F (x). De lo anterior se sigue que la funci´on de distribuci´on emp´ırica es un pro- ceso estoc´astico: si consideramos un espacio probabil´ıstico (Ω, A, P ) donde est´an definidas las sucesiones de variables aleatorias {Xn}n≥ 1 a partir de las cuales definiremos la funci´on de distribuci´on emp´ırica, tenemos que

Fn : (Ω, A, P ) × (R, B) −→ [0, 1] (ω, x) −→ Fn(x)(ω) = (^1) n

∑n i=1 I(−∞,x](Xi(ω)).

Fijado x, Fn(x)(·) : (Ω, A, P ) −→ [0, 1] es una variable aleatoria. Fijado ω, Fn(·)(ω) : R −→ [0, 1] es una funci´on de distribuci´on (en la notaci´on usual se omite la dependencia de ω ∈ Ω). Por lo tanto, la funci´on de distribuci´on emp´ırica es una funci´on de distribuci´on aleatoria. El siguiente teorema recoge algunas de las propiedades de la funci´on de distribuci´on emp´ırica.

Teorema 1.1 Sea {Xn}n≥ 1 , sucesi´on de variables aleatorias independientes e id´enticamente distribuidas definidas en el espacio de probabilidad (Ω, A, P ) con funci´on de distribuci´on com´un F. Se denota por Fn la funci´on de distri- buci´on emp´ırica obtenida de las n primeras variables aleatorias X 1 ,... , Xn. Sea x ∈ R. Se verifica lo siguiente:

(a) P(Fn(x) = jn ) =

(n j

F (x)j^ (1 − F (x))n−j^ , j = 0,... , n.

1.2. CONTRASTES DE BONDAD DE AJUSTE 5

y los sucesos de A siguientes:

Ajk = Axjk = {w ∈ Ω : Fn(xjk) −→ F (xjk)}

Bjk = Bxjk = {w ∈ Ω : Fn(x− jk) −→ F (x− jk)}

Dk =

⋂^ k

j=

(Ajk ∩ Bjk), D =

⋂^ ∞

k=

Dk.

Dk es el suceso definido por la condici´on de que la funci´on de distribuci´on emp´ırica converja a la te´orica para todos los puntos xjk (y tambi´en para los l´ımites por la izquierda), para un k fijo. D es el suceso en que esto ocurre simult´aneamente para todo k. Seg´un la ley fuerte de los grandes n´umeros, P(Ajk) = P(Bjk) = 1 para todo j y todo k, luego P(Dk) = 1 para todo k y, por tanto, P(D) = 1. Obs´ervese que si x ∈ [xjk, x(j+1)k), por ser F y Fn funciones de distribu- ci´on se tiene que

F (xjk) ≤ F (x) ≤ F (x− (j+1)k), y Fn(xjk) ≤ Fn(x) ≤ Fn(x− (j+1)k).

Como adem´as F (x− (j+1)k) − F (xjk) ≤ 1 /k,

Fn(x) − F (x) ≤ Fn(x− (j+1)k) − F (xjk) ≤ Fn(x− (j+1)k) − F (x− (j+1)k) +

k

y

Fn(x) − F (x) ≥ Fn(xjk) − F (x− (j+1)k) ≥ Fn(xjk) − F (xjk) −

k

con lo cual, si δ( nk )es la mayor entre todas las diferencias |Fn(xjk) − F (xjk)| y |Fn(x− jk) − F (x− jk)| (para n y k fijos), se tiene que

Fn(x) − F (x) ≤ δ( nk )+

k

y Fn(x) − F (x) ≥ −δ n(k )−

k

As´ı, para cualquier k ∈ IN,

sup x∈R

|Fn(x) − F (x)| ≤ δ( nk )+

k

Obs´ervese que si se verifica el suceso D, para cualquier k ∈ IN y cualquier ε > 0, se tiene que δ( nk )< ε a partir de un cierto n, de forma que

sup x∈R

|Fn(x) − F (x)| < ε +

k

6 CAP´ITULO 1. CONTRASTES NO PARAM ETRICOS CL ´ ASICOS´

a partir de cierto n. Por lo tanto,

sup x∈R

|Fn(x) − F (x)| −→n 0

siempre que se verifique D. Como P(D) = 1, se sigue que

sup x∈R

|Fn(x) − F (x)| −→n 0 casi seguro.

2

Ejemplo 1. En la figura siguiente se muestra la funci´on de distribuci´on de una variable aleatoria N (0, 1) y la funci´on de distribuci´on emp´ırica de dos muestras de esa variable aleatoria una de tama˜no n = 10 (la m´as alejada de la te´orica) y la otra de tama˜no n = 100. Se aprecia que cuando n crece la proximidad entre la funci´on de distribuci´on emp´ırica y la te´orica es cada vez mayor.

−3 −2 −1 0 1 2 3

F.distr. de la N(0,1) y f.distr.emp. de dos muestras (n=10, n=100)

x

Fx

8 CAP´ITULO 1. CONTRASTES NO PARAM ETRICOS CL ´ ASICOS´

Si X ∼ F 0 entonces F 0 (X) ∼ U ([0, 1]).

Si U ∼ U ([0, 1]) entonces F 0 − 1 (U ) ∼ F 0.

Observar que la funci´on de distribuci´on emp´ırica puede reescribirse as´ı:

Fn(x) =

n

∑^ n

i=

I(−∞,x](Xi) =

n

∑^ n

i=

I(−∞,x](F 0 − 1 (Ui)) =

n

∑^ n

i=

I(−∞,F 0 (x)](Ui) = Fn U (F 0 (x)),

donde U 1 ,... , Un es una m.a.s. de una U ([0, 1]) y F (^) nU es su funci´on de distri- buci´on emp´ırica. As´ı,

Dn = sup x∈R

|Fn(x) − F 0 (x)| = sup x∈R

|F (^) nU (F 0 (x)) − F 0 (x)| = sup u∈[0,1]

|F (^) nU (u) − u|,

que es el valor del estad´ıstico de Kolmogorov-Smirnov calculado a partir de una m.a.s. de una U ([0, 1]). Por lo tanto la distribuci´on de Dn no depende de F 0. An´alogos argumentos pueden hacerse para D+ n y D− n. 2

Distribuci´on exacta. La distribuci´on exacta de Dn, D+ n y D− n puede calcularse para cualquier ta- ma˜no muestral n utilizando t´ecnicas est´andar de c´alculos de probabilidades a partir de la funci´on de densidad conjunta de la variable aleatoria multi- variante (U 1 ,... , Un). Tambi´en pueden aproximarse esas distribuciones me- diante simulaci´on. Estas distribuciones est´an tabuladas en muchos libros de estad´ıstica (ver Gibbons 1997 o Hollander y Wolfe 1999, por ejemplo). Obs´ervese que la distribuci´on de D− n coincide con la de D n+ para cualquier tama˜no muestral.

Distribuci´on asint´otica. Si el tama˜no muestrral n es grande (en la pr´actica, n ≥ 30 es suficiente), la distribuci´on de los estad´ısticos Dn, D+ n y D n− bajo H 0 puede aproximarse seg´un indica la sigiente proposici´on.

Proposici´on 1.2 1. Para z > 0

l´ım n−→∞

P (

nDn ≤ z) = 1 − 2

∑^ ∞

i=

(−1)i−^1 e−^2 i^2 z^2.

  1. Para z > 0 nl´−→∞ım P^ (

nD n+ ≤ z) = 1 − e−^2 z^2.

1.3. CONTRASTES DE LOCALIZACI ON´ 9

  1. Para tama˜nos muestrales n grandes

4 n(D n+ )^2 ≈ χ^22.

  1. Para tama˜nos muestrales n grandes y α = 0, 05

Dn,α ≈

n

, D+ n,α = D− n,α ≈

n

1.2.3. Bondad de ajuste a un modelo param´etrico.

Se trata de contrastar

H 0 : F = Fθ para alg´un θ ∈ Θ, frente a H 1 : F 6 = Fθ para ning´un θ ∈ Θ.

Sea θˆ el estimador m´aximo veros´ımil de θ calculado a partir de la muestra observada. El estad´ıstico del contraste de Kolmogorov-Smirnov queda modi- ficado como sigue: Dˆn = sup x∈R

|Fn(x) − Fθˆ(x)|.

La distribuci´on de este estad´ıstico no coincide con la de Dn. Adem´as esa dis- tribuci´on depende de la familia param´etrica que se especifica en la hip´otesis nula. Algunos casos concretos est´an tabulados (por ejemplo, en el caso de contrastar normalidad este test se conoce como test de Lilliefors).

1.3. Contrastes de localizaci´on en una mues-

tra o en dos muestras apareadas

En sta secci´on nos planteamos contrastar si la mediana de una muestra es un valor dado, y si la diferencia entre los datos de dos muestras tiene mediana igual a 0. Sea X 1 ,... , Xn m.a.s. de X ∼ F. Sea M = mediana(F ), desconocida, y sea M 0 un valor conocido. Se desea contrastar

H 0 : M = M 0 frente a H 1 : M 6 = M 0 (o H 1 : M > M 0 , o H 1 : M < M 0 ).

En el caso de datos apareados, (X 1 , Y 1 ),... , (Xn, Yn) es una m.a.s. de (X, Y ) y se desea contrastar la hip´otesis nula

H 0 : MD = M 0 ,

donde MD es la mediana de la variable diferencia D = X − Y. En este caso el valor M 0 que se contrasta usualmente es M 0 = 0.

1.3. CONTRASTES DE LOCALIZACI ON´ 11

se asigna un signo + a cada observaci´on Xi > M 0 , y un signo - si Xi < M 0. Se usa como estad´ıstico del contraste

S = n´umero de signos +.

Obs´ervese que bajo H 0

Yi = I{Xi > M 0 } ∼ Bernoulli(p = 0,5)

y que

S =

∑^ n

i=

Yi ∼ B(n, p = 0,5),

con lo que queda perfectamente determinada la distribuci´on exacta del estad´ıstico del contraste para cualquier tama˜no muestral. Obs´ervese que esta distribuci´on es independiente de la distribuci´on F de los datos: el test del signo es de distribuci´on libre. Para n grande (n > 20 es suficiente) se puede aproximar la distribuci´on exacta de S por la distribuci´on normal de par´ametros μ = n/2 y σ^2 = n/4. Es recomendable usar una correcci´on por continuidad en esta aproximaci´on asint´otica:

P (S ≤ r) ≈ P

Z ≤

r − n/2 + 0, 5 √ n/ 4

donde Z ∼ N (0, 1). La siguiente tabla resume la forma de llevar a cabo el test del signo:

Hip´otesis Hip´otesis nula alternativa Rechazar H 0 si ... p-valor M = M 0 M > M 0 SObs grande P (S ≥ SObs) M = M 0 M < M 0 SObs peque˜no P (S ≤ SObs) M = M 0 M 6 = M 0 SObs lejos de n/ 2 2 m´ın{ 1 / 2 , P (S ≥ SObs), P (S ≤ SObs)}

Vale la pena mencionar que el test del signo puede adaptarse trivialmente para contrastar si el cuantil p de la distribuci´on F , al que llamaremos Qp(F ), es igual a un valor dado Q 0 frente a que es ditinto, mayor o menor que Q 0. El caso de la mediana corresponde a p = 0,5. Por ´ultimo se˜nalemos que en el caso (muy improbable, al suponerse F absolutamente continua) de que alguna observaci´on sea igual a M 0 , se elimina ´esta y se reduce el tama˜no muestral n consecuentemente.

12 CAP´ITULO 1. CONTRASTES NO PARAM ETRICOS CL ´ ASICOS´

1.3.2. Test de Wilcoxon de los rangos signados

El test del signo s´olo utiliza la informaci´on de si cada dato es mayor o menor que la mediana M 0 propuesta bajo H 0 , pero desaprovecha la informa- ci´on relativa a la magnitud de la diferencia entre las observaciones y M 0. El test de Wilcoxon de los rangos signados s´ı tiene en cuenta esa informaci´on. Para poder aplicarlo se requiere una hip´otesis adicional: la distribuci´on F de X ha de ser sim´etrica alrededor de su mediana M. La hip´otesis de simetr´ıa de X alrededor de su mediana permite reexpresar esta variable como X ∼ M + (2Z − 1)A,

donde Z ∼ Bernoulli(1/2), A ∼ |X − M |, y Z y A son variables aleatorias independientes. Observar que (2Z − 1) toma los valores 1 y −1 con probabi- lidades 1/2. Dada la muestra X 1 ,... , Xn de X ∼ F , que se supone absolutamente continua y sim´etrica alrededor de su mediana M , y planteada la hip´otesis nula H 0 : M = M 0 , se descompone la informaci´on contenida en cada Xi en dos partes:

Se asigna un signo + a cada observaci´on Xi > M 0 , y un signo - si Xi < M 0 , como en el test del signo. De forma equivalente se puede definir Zi = I{Xi > M 0 }.

Se calcula Ai = |Xi − M 0 |.

Bajo la hip´otesis nula, Ai y Zi son independientes y, por lo tanto, es como si los signos + y - se hubiesen asignado aleatoriamente, sin guardar relaci´on con el tama˜no de Ai. Por el contrario, si H 0 es falsa (para fijar ideas podemos suponer que M > M 0 ) los signos + tender´an a acompa˜nar a valores grandes de Ai y los signos - corresponder´an a valores peque˜nos de Ai. As´ı, tiene sentido basar el contraste de H 0 en los siguientes estad´ısticos:

T +, definido como la suma de los rangos de los Ai a los que corres- ponden signos +.

T −, definido como la suma de los rangos de los Ai a los que corres- ponden signos -.

En estas definiciones, el rango de un valor Ai = |Xi − M 0 | es el lugar que ocupa este valor en la lista ordenada de los valores A 1 ,... , An. M´as formalmente, sea A(1) < A(2) < · · · < A(n)