Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


intro a la estadistica v, Apuntes de Estadística

correlacion lineal, teoria del ajustamiento y diagramas de dispersion

Tipo: Apuntes

2019/2020

Subido el 12/04/2020

nazareno-cenoz
nazareno-cenoz 🇦🇷

5 documentos

1 / 19

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Introducción a la Estadística
78
Unidad V - TEORÍA DEL AJUSTAMIENTO
1. CONCEPTO Y APLICACIONES.
A menudo se encuentra en la práctica que existe una relación entre dos o más va-
riables. Por ejemplo, supongamos que la variable (X) define el precio anual del arroz y
la variable (Y) las hectáreas sembradas anualmente en la provincia. Si descubrimos la
relación que liga al precio del arroz con la cantidad de hectáreas sembradas, podremos
predecir cuantas hectáreas se sembrarán cuando se producen variaciones en los precios
del bien. Se trata de problemas con una distribución que tiene dos variables X e Y, es
decir que la distribución es bivariada.
Cuando dos variables cualesquiera Xi e Yi están relacionadas por una expresión
matemática de cualquier tipo (por ejemplo,
ii bXaY
o
bx
iaeY
) se dice que entre
ellas existe una dependencia funcional. Este tipo de dependencia es tal que a determi-
nados valores de la variable Xi le corresponden determinados y definidos valores de la
variable Yi.
En cambio, se dice que entre dos variables Xi e Yi existe una dependencia esta-
dística cuando se presupone que entre ambas hay algún tipo de relación y a determina-
dos valores de la variable Xi le corresponden indeterminados e indefinidos valores de la
variable Yi. Ejemplos de dependencia estadística son los siguientes:
la variable Xi es el ingreso y la variable Yi es el ahorro, en cuyo caso, si
bien se sabe por el imperio de las leyes económicas hay una relación directa entre el
ingreso y el ahorro, dos personas con iguales ingresos no ahorrarán lo mismo.
la variable Xi es el precio de un bien y la variable Yi es la demanda: entre
ambas variables sólo existe una dependencia estadística.
la variable Xi es el precio de un auto y la variable Yi es la edad del com-
prador: se supone que entre ambas variables sólo existe una dependencia estadística.
Por consiguiente, la dependencia estadística entre dos variables presupone la
existencia de una relación entre ellas. Inicialmente, esa relación se descubre funda-
mentalmente por medio de mecanismos empíricos, en especial, la observación de los
fenómenos que ligan a ambas variables.
Cuando entre dos variables no existe dependencia estadística se dice que ellas
son estadísticamente independientes. Por ejemplo, no parece que exista dependencia
estadística alguna entre el precio del algodón en bruto y la producción de uva para el
consumo, por lo que estas dos variables serían estadísticamente independientes.
El problema principal en una distribución de dos variables es el de determinar la
verdadera relación entre X e Y; es decir, como se comportan una con respecto a la otra.
Esto lo hace el análisis de regresión.
El análisis de regresión calcula una ecuación que produce valores de Y para va-
lores dados de X. Por ejemplo: para la concesionaria de autos, precio del auto y edad de
los compradores. La concesionaria que venda a personas de más edad probablemente
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13

Vista previa parcial del texto

¡Descarga intro a la estadistica v y más Apuntes en PDF de Estadística solo en Docsity!

Unidad V - TEORÍA DEL AJUSTAMIENTO

1. CONCEPTO Y APLICACIONES.

A menudo se encuentra en la práctica que existe una relación entre dos o más va-

riables. Por ejemplo, supongamos que la variable (X) define el precio anual del arroz y

la variable (Y) las hectáreas sembradas anualmente en la provincia. Si descubrimos la

relación que liga al precio del arroz con la cantidad de hectáreas sembradas, podremos

predecir cuantas hectáreas se sembrarán cuando se producen variaciones en los precios

del bien. Se trata de problemas con una distribución que tiene dos variables X e Y, es

decir que la distribución es bivariada.

Cuando dos variables cualesquiera Xi e Yi están relacionadas por una expresión

matemática de cualquier tipo (por ejemplo, i i

YabX o

bx i

Yae ) se dice que entre

ellas existe una dependencia funcional. Este tipo de dependencia es tal que a determi-

nados valores de la variable Xi le corresponden determinados y definidos valores de la

variable Yi.

En cambio, se dice que entre dos variables Xi e Yi existe una dependencia esta-

dística cuando se presupone que entre ambas hay algún tipo de relación y a determina-

dos valores de la variable Xi le corresponden indeterminados e indefinidos valores de la

variable Yi. Ejemplos de dependencia estadística son los siguientes:

 la variable Xi es el ingreso y la variable Yi es el ahorro , en cuyo caso, si

bien se sabe por el imperio de las leyes económicas hay una relación directa entre el

ingreso y el ahorro, dos personas con iguales ingresos no ahorrarán lo mismo.

 la variable Xi es el precio de un bien y la variable Yi es la demanda: entre

ambas variables sólo existe una dependencia estadística.

 la variable Xi es el precio de un auto y la variable Yi es la edad del com-

prador: se supone que entre ambas variables sólo existe una dependencia estadística.

Por consiguiente, la dependencia estadística entre dos variables presupone la

existencia de una relación entre ellas. Inicialmente, esa relación se descubre funda-

mentalmente por medio de mecanismos empíricos, en especial, la observación de los

fenómenos que ligan a ambas variables.

Cuando entre dos variables no existe dependencia estadística se dice que ellas

son estadísticamente independientes. Por ejemplo, no parece que exista dependencia

estadística alguna entre el precio del algodón en bruto y la producción de uva para el

consumo, por lo que estas dos variables serían estadísticamente independientes.

El problema principal en una distribución de dos variables es el de determinar la

verdadera relación entre X e Y; es decir, como se comportan una con respecto a la otra.

Esto lo hace el análisis de regresión.

El análisis de regresión calcula una ecuación que produce valores de Y para va-

lores dados de X. Por ejemplo: para la concesionaria de autos, precio del auto y edad de

los compradores. La concesionaria que venda a personas de más edad probablemente

venderá autos más caros y los que tengan clientes jóvenes autos más baratos. Esta rela-

ción es cierta solamente en promedios, pues ocasionalmente observaremos que hay au-

tos caros comprados por persona jóvenes y viceversa. El problema que se nos plantea es

establecer este tipo de relación en forma de ecuación, de tal manera que basados en la

edad de un cliente (X), podamos hallar una estimación promedio del precio del auto

comprado (Y).

El principal objetivo del análisis de regresión es estimar el valor de una variable

aleatoria (variable dependiente o variable de respuesta) conociendo el valor de una

variable asociada (variable independiente o variable de predicción). Podemos ex-

presar esta relación mediante una ecuación matemática que ligue las variables.

La técnica del análisis de regresión no es otra cosa que un procedimiento de es-

timación o predicción. El término “regresión” lo utilizamos simplemente porque es

usual en la estadística. Fue introducido por primera vez por Sir Francis Galton en 1877,

un experto ingles en estudios de herencia, quien encontró en sus estudios que padres

altos tendían a engendrar hijos altos y que los padres bajos mostraban tendencia a tener

hijos bajos. Pero, la estatura promedio de los hijos de padres muy altos era menor que la

estatura promedio de los padres, en tanto que los hijos de padres muy bajos, en prome-

dio, eran más altos que sus padres. Galton llamó esta tendencia hacia la estatura prome-

dio con el nombre de regresión.

El análisis de regresión simple indica que se estima el valor de la variable de-

pendiente a partir de una variable independiente, en tanto que el análisis de regresión

múltiple se ocupa de la estimación del valor de la variable dependiente en base a dos o

más variables independientes.

Para encontrar la ecuación que relacione las variables, el primer paso es recoger

datos que muestren valores correspondientes a las variables bajo estudio. El próximo

paso es marcar los puntos sobre un sistema de coordenadas rectangulares.

La construcción del diagrama de dispersión es imprescindible y debe ser la

primera acción que realice el investigador cuando tiene los datos empíricos en su

poder. Una vez construido, es sumamente conveniente observar la disposición de los

puntos contenidos en él, lo que permite decidir si un ajuste lineal es procedente o si

corresponde un ajuste de otro tipo, aunque debe aclararse que cualquiera sea la disposi-

ción de los puntos todo diagrama de dispersión admite un ajustamiento de tipo lineal. En

todo caso, la decisión de que un ajuste sea lineal o no depende del investigador del pro-

blema, por lo que es imprescindible construir, en primer lugar, el diagrama de dis-

persión.

A partir del diagrama de dispersión es posible, con frecuencia ver una curva sua-

ve que aproxima los datos, que se denomina curva de aproximación. El problema ge-

neral de hallar ecuaciones de curvas de aproximación que se ajusten a un conjunto de

datos se llama ajuste de curvas.

Algunos casos no lineales se muestran en los gráficos siguientes:

ajustar linealmente los puntos del diagrama de dispersión, lo cual significa encon-

trar la ecuación de la función de primer grado (línea recta) que mejor explique la

dependencia estadística existente, es decir, que mejor explique el comportamiento

de los n puntos del diagrama.

En el gráfico se ve que los datos se aproximan bien a una línea recta, que es la

relación más simple, y se dice que entre las variables existe una relación lineal.

Este procedimiento difiere del método de la interpolación que consiste en ha-

llar la función de grado (n-1) que pase exactamente por todos esos puntos, lo que

resulta una tarea tanto laboriosa como excesiva por varias razones, a saber:

 como puede apreciarse, los puntos señalados en el diagrama de dispersión son el re-

flejo de los datos empíricos registrados, y normalmente ese conjunto de datos provie-

ne de una muestra. Ahora bien, muestras diferentes con toda seguridad pueden dar

lugar a resultados diferentes, lo cual conlleva a que, en ese caso, los puntos de un

diagrama de dispersión no coincidirán con los de otro diagrama y, por eso mismo, re-

sultará necesario recalcular todo el proceso de interpolación, repitiendo una tarea su-

mamente laboriosa.

 asimismo, el trabajo que se propicia con el ajustamiento, es explicar el comporta-

miento de los puntos del diagrama, lo que significa encontrar una función que

muestre la tendencia general que sigue el fenómeno bajo estudio. Con la interpola-

ción, en cambio, tal como se señaló, se estaría encontrando una función que pase

por todos los puntos , un objetivo completamente alejado de las intenciones de la

Teoría del Ajustamiento.

Por otro lado, además de describir linealmente la relación existente entre dos va-

riables, otro de los objetivos del ajustamiento es la estimación o el pronóstico , es decir

que una vez hallada la expresión de la función matemática de primer grado, ella puede

ser utilizada para estimar valores de la variable dependiente Yi para valores selec-

cionados de la variable independiente Xi.

Si la concesionaria desea estudiar la relación existente entre el precio de los au-

tos y la edad de los compradores a fin de diseñar una campaña publicitaria, tomamos

una muestra de pares de datos, y construimos el diagrama de dispersión.

PRECIO

EDAD Precios de automóviles según la edad del

comprador

0

10

20

30

40

50

60

70

80

90

100

110

0 10 20 30 40 50 60

Edad

Precios (en miles $)

(en miles $)

Yi Xi

80,620 33

62,184 26

81,424 44

96,208 56

87,924 43

89,768 41

78,752 35

63,176 30

2. TIPOS DE AJUSTAMIENTO

El diagrama de dispersión nos puede dar una idea aproximada del tipo de rela-

ción que existe entre las variables. La naturaleza de la relación puede adoptar muchas

formas, que van desde las funciones matemáticas más sencillas hasta las muy complica-

das. La relación más simple es una línea recta o relación lineal.

El modelo lineal se pude presentar como:

Y = a 0 + a 1 X

donde: a 0 : es la intersección con el eje X

a 1 : es la pendiente

La pendiente, a 1 , representa el cambio de Y, Y, ante un cambio unitario en X,

X; muestra el cambio de Y (positivo o negativo) para un cambio particular de X. En

tanto, a 0 , es la intersección con el eje Y, es un factor constante, representa el valor de Y

cuando X es igual a cero.

Las relaciones entre las variables pueden ser:

 Relación lineal positiva: edad de los compradores y precio de los autos

 Relación lineal negativa: precio de un modelo de auto y cantidades vendidas

 Relación curvilínea positiva: años de antigüedad del auto y costo de manteni-

miento.

 Relación curvilínea negativa: modelo del auto y precio de venta.

 Relación curvilínea en forma de U: número de errores por hora de trabajo en el

taller de la concesionaria y cantidad de horas trabajadas.

métodos objetivos. Los métodos subjetivos pueden concluir en diferentes soluciones

para un mismo problema según quien sea el investigador, mientras que los objetivos

permiten encontrar la misma solución para cada caso, independientemente del investi-

gador que la desarrolle.

El método de Ajustamiento a mano alzada es un método subjetivo. Este mé-

todo consiste en analizar la disposición de los puntos del diagrama de dispersión para,

posteriormente, trazar aquella recta que, a juicio del dibujante, cumpla con los requisitos

del ajustamiento lineal. Si bien el método es sumamente simple, su carácter de subjetivo

le quita rigurosidad por las posibles diferencias entre las rectas trazadas por diferentes

investigadores. También llamado método libre de ajuste de curvas.

Si se conoce el tipo de ecuación de esta curva, es posible obtener el valor de las

constantes de la ecuación eligiendo tantos puntos en la curva como constantes haya en la

ecuación. Por ejemplo, si es una línea recta, son necesarios dos puntos; si es una parábo-

la, son necesarios tres puntos. El método tiene la desventaja de que diferentes observa-

dores obtendrán diferentes curvas y ecuaciones.

La ecuación de la recta es: Y = a 0 + a 1 X, dados dos puntos cuales quiera (X 1 ;

Y 1 ) y (X 2 ; Y 2 ) de la recta, podemos obtener la ecuación de la recta a partir de dos

puntos. Las constantes a 0 y a 1 pueden ser determinadas.

La constante a 1 es la pendiente m. La constante a 0 es el valor de Y cuando X = 0,

se llama intersección de Y. Toda recta que corta a dos de los lados de un triángulo, man-

teniéndose paralela al tercero, determina un triángulo menor semejante al primero. Los

triángulos semejantes tienen los lados proporcionales.

El triángulo PQS es semejante al PRT, por tanto:

    (^) i 1  1 2 1

2 1 i 2 1

i 1 2 1 i 1 2 1

i 1

2 1

i 1 X X Y X X

Y Y

Y

X X

X X Y Y

Y Y

X X

X X

Y Y

Y Y

PS

PT

QS

RT

Y (^) imXiX 1  Y 1

donde

2 1

2 1

X X

Y Y

m

 es la pendiente y representa el cambio de Y dividido por el cambio

de X.

Si en el caso de la concesionaria seleccionamos los puntos (26; 62,184) y (56;

96,208), podemos calcular la recta aplicando la ecuación.

PRECIO

EDAD Precios de automóviles según la edad del

comprador

0

10

20

30

40

50

60

70

80

90

100

110

0 10 20 30 40 50 60

Edad

Precios (en miles $)

(en miles $)

Yi Xi

80,620 33

62,184 26

81,424 44

96,208 56

87,924 43

89,768 41

78,752 35

63,176 30

     26  62 , 184 30

1 1 2 1

2 1      

i ^ Xi X Y Xi Xi X X

Y Y

Y

Yi  1 , 1341  Xi  26  62 , 184  1 , 1341 Xi  1 , 1341. 26  62 , 184

Yi  1 , 1341 Xi  32 , 697

La ecuación nos muestra que el precio de los autos comprados es de $ 3 2 .697,

independientemente de la edad del comprador y que aumenta en $ 1.134 en función de

la edad.

4. SEMIPROMEDIOS

Para aplicar este método, se ordena, en primer lugar, el grupo de n pares de datos

(Xi;Yi) en forma creciente, tomando como referencia la variable Xi.

Posteriormente se divide al grupo en dos subgrupos de tamaños j, donde j = n/2.

Esta última condición se cumple sin dificultades cuando n es par.

Si n fuera impar, existen dos procedimientos:

 1 , 1341  32 , 697 i i Y X

1 71 ,^183

2 1

2 1 1     

i

X

i

X

i

X X Y

X X

Y Y

Y Y

i i

Yi  1 , 1765 Xi  36 , 4725  71 , 183  Yi  34 , 7105  1 , 1765 Xi

La ecuación nos muestra que el precio de los autos comprados es de $ 34.710,

independientemente de la edad del comprador y que aumenta en $ 1.177 en función de

la edad.

Pares no ordenados Pares ordenados

PRECIO

EDAD

PRECIO

EDAD

(en miles $) (en miles $)

Yi Xi Yi Xi

Precios de automóviles según la edad del

comprador

0

10

20

30

40

50

60

70

80

90

100

110

0 10 20 30 40 50 60

Edad

Precios (en miles $)

5. MÍNIMOS CUADRADOS DE GAUSS. DEDUCCIÓN DE LOS PARÁME-

Y 1 (^)  34 , 7105  1 , 1765 Xi

TROS. MÉTODO ABREVIADO DE CÁLCULO. CASO CON “Y” COMO VA-

RIABLE INDEPENDIENTE. INTERSECCIÓN DE LAS RECTAS DE AJUS-

TAMIENTO.

Este procedimiento es creación del matemático alemán Gauss quien sugirió un

criterio objetivo para determinar cuál es la mejor recta de ajustamiento. Según él, es

aquella que minimiza la sumatoria de los cuadrados de los desvíos existentes entre

los puntos empíricos del diagrama de dispersión y la propia recta de ajustamiento.

Es decir que este procedimiento consiste en encontrar una función lineal del tipo

Yia 1 (^)  b X 1 i^ que cumpla las condiciones sugeridas por Gauss.

Según el criterio de Gauss, un desvío di es la diferencia entre un punto empírico

de ordenada Yi y un punto teórico de ordenada

Yi , es decir que d (^) iYiYi

. Gráficamen-

te, si ampliamos un sector del diagrama de dispersión y tomamos en él a un punto empí-

rico particular de coordenadas (Xj; Yj) observaremos que el desvío d (^) jY (^) jYj

Si bien el gráfico precedente es parcial porque presenta la situación referida a un

solo punto siendo que en un diagrama de dispersión hay n puntos, sirve para explicar de

una manera sencilla cómo se debe entender el desvío, y permite verificar con claridad

que cualquier desvío di puede ser positivo (si el punto empírico está por encima de la

recta, como en este caso), negativo (si el punto empírico está por debajo de la recta) o

nulo (si el punto empírico coincide con la recta).

Considerando ahora todos los posibles desvíos en el diagrama de dispersión, si

los elevamos al cuadrado y los sumamos, obtendremos la siguiente expresión, a la que

llamaremos 

   ^  ^ ^   

(^22)

1 1

i i i i i

d Y Y Y a bX

Como ya se indicó, Gauss postula que la mejor recta es aquélla que minimiza

esos desvíos al cuadrado. Si bien en el plano existen infinitas rectas, cada una con un par

de parámetros a 1 y b 1 , de todas ellas sólo una cumple con la condición impuesta por

Gauss. Se trata de encontrarla, y eso equivale a encontrar sus parámetros a 1 y b 1. De

acuerdo con los procedimientos del Análisis Matemático, eso se consigue minimizando

la función , es decir haciendo

2 2

2

1

i i

i i i i

i i

i

i i i

i

n X X

n YX X Y

X X

n X

X YX

n Y

b

Lo que quedaría por analizar es si el punto crítico obtenido corresponde a un

máximo o a un mínimo, para lo cual se debería obtener la segunda derivada y verificar

su signo. Sin embargo, en este caso eso no es necesario porque aquí ocurre algo similar

a lo visto en la tercera propiedad de la media aritmética. En su recorrido a través del

diagrama de dispersión, la recta de ajustamiento se comporta como una medida de

tendencia central aunque de carácter dinámico (no de carácter estático, como sería el

caso de una media aritmética) ya que cumple con esa propiedad (equivalente a la segun-

da propiedad de la media aritmética) de que    ˆ 0

i i

Y Y , cuya verificación es senci-

lla: aplicando sumatoria tenemos

1 1 1 1

 ^      

i i i i

Y a bX Y na b X

para la primera ecuación normal de Gauss.

Si la recta de ajustamiento se comporta como una medida de posición y cumple

con todas sus propiedades, el criterio de los mínimos cuadrados de Gauss nos remite a la

tercera propiedad de la media aritmética, en la cual el único punto crítico obtenido en

el proceso del análisis debe ser mínimo, ya que el máximo no tiene límite. Efectiva-

mente: si una recta particular minimiza la suma de los desvíos al cuadrado, alejarla de

los puntos empíricos (tanto en un sentido como en el otro) produce un aumento en el

valor de los desvíos y, por consiguiente, de su suma al cuadrado, por lo que el máximo

no tiene límite y la única cota obtenida mediante este procedimiento resulta un mí-

nimo.

La interpretación estadística de ambos parámetros es la siguiente:

el parámetro “a” indica cual es la cantidad promedio de la variable Yi

para un valor igual a cero de la variable Xi, y

el parámetro “b” indica cuál es la variación promedio de la variable Yi

que corresponde a una unidad de variación para la variable Xi.

El trabajo de cálculo se organiza construyendo una tabla con el siguiente forma-

to:

Xi Yi Xi 2 Xi Yi

X 1 Y 1 X 1 2 Xi Yi

X 2 Y 2 X 2 2 X 2 Y 2

… … … …

Xn Yn Xn

2 Xn Yn

 Xi  Yi 

2

X i  XiYi

con la cual se obtienen todos los términos involucrados en el cálculo de los parámetros.

Retomando el ejemplo de la concesionaria:

Xi Yi Xi 2 Xi Yi

 

36 , 3932

  1. 072

  2. 286 , 208

2

    1. 492 308

640 , 056. 12. 492 308. 25. 360 , 368

2 2

2

1

 

 

 

i i

i i i i i

n X X

Y X X YX

33 80,620 1.089 2.660,460 a

1 2 2

i i

i i i i

n X X

n YX X Y b 35 78,752 1.225 2.756,

La ecuación de la recta hallada es i i

Yˆ^  36 , 3932  1 , 1328 X.

Precios de automóviles según la edad del

comprador y = 1,1328x + 36,

0

10

20

30

40

50

60

70

80

90

100

110

0 10 20 30 40 50 60

Edad

Precios (en miles $)

Método abreviado para el cálculo de los parámetros

Este método parte del supuesto siguiente: si en las ecuaciones normales de Gauss

se consiguiera que Xi

0 , las fórmulas para calcular los parámetros podrían reducir-

se significativamente. Para que se anule la sumatoria de la variable Xi, se la transforma

convenientemente, haciendo xiX (^) iX , con lo cual la xiX (^) iX

  

 

(^)  0 por la

segunda propiedad de la media aritmética. De esa manera, si se efectuara el desarrollo

teórico para encontrar las fórmulas de los parámetros con las variables xi e Yi en lugar

de con las variables Xi e Yi, las ecuaciones normales que se obtendrían tendrían la si-

guiente forma:

En el gráfico puede verse que se han representado los n puntos empíricos y la

recta de ajustamiento, y que se han indicado dos ejes de abscisas que deben utilizarse

alternativamente, según se trabaje con las variables Xi o xi, con lo que claramente se

descubre la correspondencia entre los valores de ambas, de modo que el valor X en el

eje Xi corresponde al valor cero en el eje xi.

También puede observarse que el eje Yi se presenta tanto en su posición original

como en una nueva posición, corrido hacia la derecha, y que en este caso su trazado

coincide con X.

Como correr los ejes hacia uno u otro lado no modifica la pendiente de la recta,

fácilmente puede comprenderse que (^) b 1  es igual a b 1 (ambos valores son la tangente del

ángulo  mientras que lo que sí se modifica con el corrimiento del eje Yi es la ordena-

da al origen de la recta de ajustamiento, por lo que a 1  es diferente a a 1 (en el gráfico se

indican las dos).

Si ampliamos un sector del gráfico y lo presentamos en forma independiente,

podemos sacar una conclusión trigonométrica de la fórmula que permite calcular (^) a 1 .

Recordando que tg.

sen.

cos.

b      

a a

X

1 a^ a^ b X^ Y^ b X

1 1 1 1 1 1

Caso inverso (con yi como variable independiente)

El caso inverso consiste en imaginar una alternativa que resulta sólo posible des-

de el punto de vista teórico: que en un problema de ajustamiento la variable inde-

pendiente sea Yi en lugar de Xi. Se reitera que esta posibilidad sólo puede presentarse

teóricamente porque en la vida real la solución de cualquier problema de ajustamiento

se encara definiendo siempre anticipadamente cuál es la variable independiente y a

ella normalmente se la simboliza con Xi. Sin embargo, una vez definida esta circunstan-

cia, puede pensarse que el conjunto particular de datos con el que se está trabajando

puede originar otro problema de ajustamiento , que llamaremos caso inverso, en el que

la variable independiente sea la simbolizada tradicionalmente con Yi. Gráficamente

esto da lugar a la aparición de una segunda recta de ajustamiento simbolizada co-

mo

Xa (^) 2  b Y 2 i la cual, en realidad, no es una segunda recta teóricamente hablan-

do, sino la misma recta Yi observada desde un ángulo completamente diferente.

Por esa circunstancia puede resultar apropiado denominar “recta reflejo” a la recta de

ajustamiento

Xa (^) 2  b Y 2 i.

En general, ocurre que a 1 (^)  a 2 , que b 1 (^)  b 2 y que el trazado de

Yi no coincide

con el de

Xi.

con lo cual se demuestra que el punto de coordenadas X Y ;  

 

(^)  satisface las dos ecua-

ciones correspondientes a las rectas de ajustamiento, por lo que ambas rectas pasan

por ese punto y por consiguiente, se cruzan en él.

Este punto por el que pasan las dos ecuaciones se llama centroide o centro de

gravedad de los datos.

PREGUNTAS TEÓRICAS SOBRE TEORÍA DEL AJUSTAMIENTO

¿Cuál de las siguientes es la condición básica que debe cumplirse en el criterio de

los mínimos cuadrados propuesto por Gauss?

a   Y  Y  0

i

b YiYiminimo

 

 

2

c

YiYminimo

 

 

2

En un problema de ajustamiento lineal se obtienen los siguientes datos:

a 1 (^)  3 X  5 Y  6

¿Cómo es la pendiente de la recta de ajustamiento?

a Positiva b Negativa c Nula