Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Ajuste de una función lineal/Regresión lineal: métodos y aplicaciones - Prof. 7894, Apuntes de Ingeniería Química

El proceso de ajuste de una función lineal a un conjunto de datos mediante el uso de excel y las funciones pendent, interseccio, estimacion.lineal y regressión. Se busca desarrollar habilidades básicas de química, matemáticas y informática para resolver problemas de ingeniería química y de materiales. Además, se fomenta la autonomía y el aprendizaje activo del alumno.

Tipo: Apuntes

2016/2017

Subido el 24/12/2017

elena_elizalde
elena_elizalde 🇪🇸

4

(1)

4 documentos

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Informàtica Aplicada Tema 3.4.1. 4.4.1
INSTRUCCIONS I GUIA DE LECTURA
“AJUST D’UNA FUNCIÓ LINEAL/REGRESSIÓ LINEAL”
El text que acompanya a aquesta activitat d’aula invertida introdueix les nocions per realitzar l’ajust
d’una funció lineal a un conjunt de dades donat mitjançant les funcions PENDENT, INTERSECCIO,
ESTIMACION.LINEAL i l’eina [Regressió] de l’Excel.
L’objectiu fonamental d’aquesta tasca és múltiple. Per una banda es busca desenvolupar la capacitat
per aplicar principis i coneixements bàsics de química/matemàtiques/informàtica per resoldre
problemes de l’Enginyeria Química i de Materials fent servir l’ajust de funcions i l’estimació de
paràmetres implementats en el full de càlcul. Alhora es pretén fomentar l’autonomia i l’aprenentatge
actiu del alumne donant-li un rol “actiu” dins el seu procés d’aprenentatge mitjançat la construcció
prèvia de coneixement.
A la fi de la sessió de classe d’estadística i regressions, l’alumnat ha de poder realitzar l’ajust d’una
funció a un conjunt de dades donat i determinar la seva significació això com trobar el millor conjunt
de paràmetres bi d’una equació que representa aquest conjunt de dades, determinar la seva significança
i els seus intervals de confiança.
Per preparar aquesta sessió, caldrà llegir el text a continuació i realitzar l’activitat d’autoaprenentatge
proposada (JITT: qüestionari i problema).
3.4. Ajust de funcions i estimació de paràmetres.
La representació de les dades experimentals mitjançant equacions és una necessitat pràctica, en
l’àmbit de l’Enginyeria, que permet treballar amb un gran conjunt de dades o descriure processos
mitjançant models matemàtics, per exemple.
El procés d'ajust d'una funció a un conjunt de dades experimentals està dividit en dues etapes:
1. Avaluació del tipus d'equació més adequat.
2. Estimació dels paràmetres del model.
Una primera representació gràfica dels punts experimentals pot donar informació sobre el tipus de
funció que cal ajustar. Sempre que sigui possible, cal representar les dades de manera que s'obtingui una
recta atès que, d’aquesta manera, el problema de l'ajust se simplifica enormement.
El mètode més àmpliament utilitzat en l'ajust de paràmetres és el de mínims quadrats. El mètode
dels mínims quadrats consisteix a determinar els valors dels paràmetres de la funció seleccionada (que pot
ser, per exemple, una recta, una paràbola o una funció de tipus exponencial) que fa que la suma del quadrat
de les diferències entre els valors de la funció i els dels punts experimentals sigui la mínima possible. Les
diferències, o desviacions, s'anomenen residus. Així doncs, la funció objectiu que cal minimitzar és la
següent:

2
2
iii
i
eyy
en què i
y
correspon als valors estimats a partir de la funció que s’ha seleccionat i i
y correspon als valors
experimentals.
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Ajuste de una función lineal/Regresión lineal: métodos y aplicaciones - Prof. 7894 y más Apuntes en PDF de Ingeniería Química solo en Docsity!

INSTRUCCIONS I GUIA DE LECTURA

“AJUST D’UNA FUNCIÓ LINEAL/REGRESSIÓ LINEAL”

El text que acompanya a aquesta activitat d’aula invertida introdueix les nocions per realitzar l’ajust d’una funció lineal a un conjunt de dades donat mitjançant les funcions PENDENT , INTERSECCIO , ESTIMACION.LINEAL i l’eina [Regressió] de l’Excel.

L’objectiu fonamental d’aquesta tasca és múltiple. Per una banda es busca desenvolupar la capacitat per aplicar principis i coneixements bàsics de química/matemàtiques/informàtica per resoldre problemes de l’Enginyeria Química i de Materials fent servir l’ajust de funcions i l’estimació de paràmetres implementats en el full de càlcul. Alhora es pretén fomentar l’autonomia i l’aprenentatge actiu del alumne donant-li un rol “actiu” dins el seu procés d’aprenentatge mitjançat la construcció prèvia de coneixement.

A la fi de la sessió de classe d’estadística i regressions, l’alumnat ha de poder realitzar l’ajust d’una funció a un conjunt de dades donat i determinar la seva significació això com trobar el millor conjunt de paràmetres bi d’una equació que representa aquest conjunt de dades, determinar la seva significança i els seus intervals de confiança.

Per preparar aquesta sessió, caldrà llegir el text a continuació i realitzar l’activitat d’autoaprenentatge proposada (JITT: qüestionari i problema).

3.4. Ajust de funcions i estimació de paràmetres.

La representació de les dades experimentals mitjançant equacions és una necessitat pràctica, en l’àmbit de l’Enginyeria, que permet treballar amb un gran conjunt de dades o descriure processos mitjançant models matemàtics, per exemple.

El procés d'ajust d'una funció a un conjunt de dades experimentals està dividit en dues etapes:

  1. Avaluació del tipus d'equació més adequat.
  2. Estimació dels paràmetres del model.

Una primera representació gràfica dels punts experimentals pot donar informació sobre el tipus de funció que cal ajustar. Sempre que sigui possible, cal representar les dades de manera que s'obtingui una recta atès que, d’aquesta manera, el problema de l'ajust se simplifica enormement.

El mètode més àmpliament utilitzat en l'ajust de paràmetres és el de mínims quadrats. El mètode dels mínims quadrats consisteix a determinar els valors dels paràmetres de la funció seleccionada (que pot ser, per exemple, una recta, una paràbola o una funció de tipus exponencial) que fa que la suma del quadrat de les diferències entre els valors de la funció i els dels punts experimentals sigui la mínima possible. Les diferències, o desviacions, s'anomenen residus. Així doncs, la funció objectiu que cal minimitzar és la següent:

2 2 i i i i

e^ ^  y^  y

en què yi

correspon als valors estimats a partir de la funció que s’ha seleccionat i yi^ correspon als valors

experimentals.

El mètode clàssic d'estimació dels paràmetres d'un model per mínims quadrats considera que una de les dues variables, x, està lliure d'error aleatori ( variable independent ) i l'altra variable, y, és la que porta associada un error aleatori ( variable dependent ). Degut a l'error aleatori que porten associades les dades experimentals, quan es realitza l'ajust d'una funció és necessari estudiar la significació de l'ajust i la dels paràmetres ajustats i determinar els seus intervals de confiança , ja que la validesa de les conclusions que s'extreuen d'una anàlisi numèrica està determinada, no només per la fiabilitat de les dades experimentals, sinó també per l'ajust.

A diferència del que s’ha explicat a l’apartat anterior, la incertesa o error experimental associat a un procediment complex no es determina pel mètode de propagació d’errors perquè és un mètode que sol sobreestimar-ne la magnitud. En canvi, el mètode que se segueix és el de la replicació del procediment o experiment. En aquest cas, no s’ajusta la funció a tots els punts sinó que s’utilitza la mitjana dels punts replicats.

3.4.1.Ajust d’una funció lineal/Regressió lineal

Considerem que tenim una col·lecció de n parelles de punts corresponents a dues variables, una d’independent ( x ) i una altra de dependent de la primera ( y ) i es vol modelitzar de forma matemàtica la variació d'una propietat respecte de l'altra. Al representar gràficament, sembla que la dependència entre les dues variables és lineal. Llavors, l’expressió que descriu aquesta dependència és

y  ax  b

on a és el pendent i b és l’ordenada a l’origen. Aquests paràmetres a i b són, en principi, desconeguts. El problema que es planteja és el de trobar el millor parell de valors per a a i b que defineixen la relació entre x i y. D’acord amb el mètode de mínims quadrats , els millors valors de a i b són aquells que fan que la diferència entre els valors de y de què disposem i els que es poden calcular per a cada x mitjançant l’equació anterior sigui mínima en conjunt. És a dir, els millors valors de a i b són els que satisfan que el següent sumatori, anomenat suma quadràtica , sigui mínim:

 ^ 

n (^2) i i i 1

y a x b

Aquest procediment, que consisteix a obtenir els valors dels paràmetres que fan que la suma quadràtica sigui mínima, s’anomena regressió lineal per mínims quadrats.

El programa Excel permet calcular els valors de a i b a través de la consola ( fx ), mitjançant dues funcions implementades:

 PENDENT(rang y;rang x): retorna el valor de a , que és el pendent de la regressió lineal.  INTERSECCIO(rang y; rang x): retorna el valor de de b , que és l’ ordenada a l’origen de la regressió lineal.

Una forma de quantificar la bondat de l’ajust, és a dir, el grau d’aproximació dels valor de y calculats amb la regressió lineal als valors de y i de què disposem, és el coeficient de correlació lineal , R , que es pot calcular mitjançant la funció COEF.CORREL(rang y;rang x). De vegades, s’utilitza el valor de R elevat al quadrat, R^2 , que correspon a la funció COEF.QUADRAT(rang y;rang x). Cal remarcar, però, que aquests no són els únics elements que cal considerar perquè, per exemple, si s’ajusten els punts que formen una circumferència a una funció lineal (és a dir, a una recta),

En clicar, el programa ens demanarà el rang de dades, el nivell de confiança pels intervals de confiança dels paràmetres i l’anàlisi de significació estadística, la ubicació i els residus.

El resultat és l’informe següent:

ESTADÍSTICAS DE LA REGRESIÓN

Coeficient de correlació múltiple (signe de b) R^2 (entre -1 i 1)

Coeficient de determinació R^2 SSR/SST (entre 0 i 1)

R^2 ajustat

Té en compte la mida del conjunt de dades, i el seu valor és lleugerament inferior al de R 2. El R^2 ajustat és el percentatge de variació a la variable de resposta que s’explica per la seva relació amb una o més variables predictores, ajustat pel número de predictors en el model. Aquest ajust és important perquè el R^2 de qualsevol model sempre augmentarà quan s’afegeixi un nou terme. Pot semblar que un model amb més termes té un millor ajust perquè inclou més termes.

Error típic Desviació estàndard de la regressió=s= SSE ( n 2)

Observacions n

És important ressaltar que el coeficient de correlació només mesura la força d’associació en una relació lineal, el coeficient de determinació es pot usar en relacions no lineals (òbviament, tenint com a equació de regressió una funció no lineal) i en relacions amb dues o més variables independents.

El coeficient de determinació/regressió permet avaluar la bondat global de la recta de regressió estimada, tant més bona quan més a prop de la unitat. Els valors grans de R^2 només impliquen que la línia de regressió dóna un bon ajust amb les dades, és a dir, que les observacions estan agrupades més estretament a prop de la recta. Però si només utilitzem el coeficient de determinació, no dilucidem si la relació és estadísticament significativa. Per això, cal basar-se en consideracions on hi intervinguin la mida de la mostra i les propietats de les distribucions mostrals adequades dels estimadors dels mínims quadrats.

ANÁLISIS DE VARIANCIA

Graus de llibertat Suma de quadrats

Promig de los quadrats (Variància s^2 )

F

Valor crític de F

Regressió 1 SSR=^ ^ 

2 i i

 y^  y

SSR/1 SSR/(SSE/n-2) Probabili- tat de F

Residus n-2 SSE=^ ^ 

2 i i i

 y^  y

SSE/n-

Total n-

SST=SSR+SSE=

2 i i

 y^  y

Coefi- cients

Error típic (Desviació estàndard del paràmetre) Estadístic t Probabi- litat

Inferior 95%

Superior 95%

Inter- cepció a

s (^) a=s

i i i i

x
n x y
x y
n

(a-α=0)/ s (^) a

el p- valor o probabi- litat de cada paràme- tre

-tα s (^) a + tα s (^) a

Variable X 1 b

s (^) b =s/

 i  i 

i i

x y x y n

(b-=0)/ sb - tα s^ b tα s^ b

L’estadistic t és la t avaluada de cada paràmetre. D’acord al criteri t, un paràmetre és significatiu si la t avaluada és superior a la t de Student tabulada. Un paràmetre és significatiu si el p-valor és menor que el nivell de significació establert, convencionalment 0,05 o 0,0. Els intervals de confiança dels paràmetres es calculen amb tα(α=0.05,n-2). En el cas de disposar de replicats, l’anàlisi de significació de la funció ajustada es fa comparant la variància de l’ajust (SSE) amb la variància de l’error experimental (

2 i replicats

 y^  y , on els graus de llibertat són el número de replicats menys el número de

mitjanes) mitjançant un test de F (Fexperimental = s r^2 /s e^2 < Ftabulada ).