



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
El proceso de ajuste de una función lineal a un conjunto de datos mediante el uso de excel y las funciones pendent, interseccio, estimacion.lineal y regressión. Se busca desarrollar habilidades básicas de química, matemáticas y informática para resolver problemas de ingeniería química y de materiales. Además, se fomenta la autonomía y el aprendizaje activo del alumno.
Tipo: Apuntes
1 / 6
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




El text que acompanya a aquesta activitat d’aula invertida introdueix les nocions per realitzar l’ajust d’una funció lineal a un conjunt de dades donat mitjançant les funcions PENDENT , INTERSECCIO , ESTIMACION.LINEAL i l’eina [Regressió] de l’Excel.
L’objectiu fonamental d’aquesta tasca és múltiple. Per una banda es busca desenvolupar la capacitat per aplicar principis i coneixements bàsics de química/matemàtiques/informàtica per resoldre problemes de l’Enginyeria Química i de Materials fent servir l’ajust de funcions i l’estimació de paràmetres implementats en el full de càlcul. Alhora es pretén fomentar l’autonomia i l’aprenentatge actiu del alumne donant-li un rol “actiu” dins el seu procés d’aprenentatge mitjançat la construcció prèvia de coneixement.
A la fi de la sessió de classe d’estadística i regressions, l’alumnat ha de poder realitzar l’ajust d’una funció a un conjunt de dades donat i determinar la seva significació això com trobar el millor conjunt de paràmetres bi d’una equació que representa aquest conjunt de dades, determinar la seva significança i els seus intervals de confiança.
Per preparar aquesta sessió, caldrà llegir el text a continuació i realitzar l’activitat d’autoaprenentatge proposada (JITT: qüestionari i problema).
La representació de les dades experimentals mitjançant equacions és una necessitat pràctica, en l’àmbit de l’Enginyeria, que permet treballar amb un gran conjunt de dades o descriure processos mitjançant models matemàtics, per exemple.
El procés d'ajust d'una funció a un conjunt de dades experimentals està dividit en dues etapes:
Una primera representació gràfica dels punts experimentals pot donar informació sobre el tipus de funció que cal ajustar. Sempre que sigui possible, cal representar les dades de manera que s'obtingui una recta atès que, d’aquesta manera, el problema de l'ajust se simplifica enormement.
El mètode més àmpliament utilitzat en l'ajust de paràmetres és el de mínims quadrats. El mètode dels mínims quadrats consisteix a determinar els valors dels paràmetres de la funció seleccionada (que pot ser, per exemple, una recta, una paràbola o una funció de tipus exponencial) que fa que la suma del quadrat de les diferències entre els valors de la funció i els dels punts experimentals sigui la mínima possible. Les diferències, o desviacions, s'anomenen residus. Així doncs, la funció objectiu que cal minimitzar és la següent:
2 2 i i i i
e^ ^ y^ y
experimentals.
El mètode clàssic d'estimació dels paràmetres d'un model per mínims quadrats considera que una de les dues variables, x, està lliure d'error aleatori ( variable independent ) i l'altra variable, y, és la que porta associada un error aleatori ( variable dependent ). Degut a l'error aleatori que porten associades les dades experimentals, quan es realitza l'ajust d'una funció és necessari estudiar la significació de l'ajust i la dels paràmetres ajustats i determinar els seus intervals de confiança , ja que la validesa de les conclusions que s'extreuen d'una anàlisi numèrica està determinada, no només per la fiabilitat de les dades experimentals, sinó també per l'ajust.
A diferència del que s’ha explicat a l’apartat anterior, la incertesa o error experimental associat a un procediment complex no es determina pel mètode de propagació d’errors perquè és un mètode que sol sobreestimar-ne la magnitud. En canvi, el mètode que se segueix és el de la replicació del procediment o experiment. En aquest cas, no s’ajusta la funció a tots els punts sinó que s’utilitza la mitjana dels punts replicats.
Considerem que tenim una col·lecció de n parelles de punts corresponents a dues variables, una d’independent ( x ) i una altra de dependent de la primera ( y ) i es vol modelitzar de forma matemàtica la variació d'una propietat respecte de l'altra. Al representar gràficament, sembla que la dependència entre les dues variables és lineal. Llavors, l’expressió que descriu aquesta dependència és
on a és el pendent i b és l’ordenada a l’origen. Aquests paràmetres a i b són, en principi, desconeguts. El problema que es planteja és el de trobar el millor parell de valors per a a i b que defineixen la relació entre x i y. D’acord amb el mètode de mínims quadrats , els millors valors de a i b són aquells que fan que la diferència entre els valors de y de què disposem i els que es poden calcular per a cada x mitjançant l’equació anterior sigui mínima en conjunt. És a dir, els millors valors de a i b són els que satisfan que el següent sumatori, anomenat suma quadràtica , sigui mínim:
n (^2) i i i 1
Aquest procediment, que consisteix a obtenir els valors dels paràmetres que fan que la suma quadràtica sigui mínima, s’anomena regressió lineal per mínims quadrats.
El programa Excel permet calcular els valors de a i b a través de la consola ( fx ), mitjançant dues funcions implementades:
PENDENT(rang y;rang x): retorna el valor de a , que és el pendent de la regressió lineal. INTERSECCIO(rang y; rang x): retorna el valor de de b , que és l’ ordenada a l’origen de la regressió lineal.
Una forma de quantificar la bondat de l’ajust, és a dir, el grau d’aproximació dels valor de y calculats amb la regressió lineal als valors de y i de què disposem, és el coeficient de correlació lineal , R , que es pot calcular mitjançant la funció COEF.CORREL(rang y;rang x). De vegades, s’utilitza el valor de R elevat al quadrat, R^2 , que correspon a la funció COEF.QUADRAT(rang y;rang x). Cal remarcar, però, que aquests no són els únics elements que cal considerar perquè, per exemple, si s’ajusten els punts que formen una circumferència a una funció lineal (és a dir, a una recta),
En clicar, el programa ens demanarà el rang de dades, el nivell de confiança pels intervals de confiança dels paràmetres i l’anàlisi de significació estadística, la ubicació i els residus.
El resultat és l’informe següent:
Coeficient de determinació R^2 SSR/SST (entre 0 i 1)
R^2 ajustat
Té en compte la mida del conjunt de dades, i el seu valor és lleugerament inferior al de R 2. El R^2 ajustat és el percentatge de variació a la variable de resposta que s’explica per la seva relació amb una o més variables predictores, ajustat pel número de predictors en el model. Aquest ajust és important perquè el R^2 de qualsevol model sempre augmentarà quan s’afegeixi un nou terme. Pot semblar que un model amb més termes té un millor ajust perquè inclou més termes.
Observacions n
És important ressaltar que el coeficient de correlació només mesura la força d’associació en una relació lineal, el coeficient de determinació es pot usar en relacions no lineals (òbviament, tenint com a equació de regressió una funció no lineal) i en relacions amb dues o més variables independents.
El coeficient de determinació/regressió permet avaluar la bondat global de la recta de regressió estimada, tant més bona quan més a prop de la unitat. Els valors grans de R^2 només impliquen que la línia de regressió dóna un bon ajust amb les dades, és a dir, que les observacions estan agrupades més estretament a prop de la recta. Però si només utilitzem el coeficient de determinació, no dilucidem si la relació és estadísticament significativa. Per això, cal basar-se en consideracions on hi intervinguin la mida de la mostra i les propietats de les distribucions mostrals adequades dels estimadors dels mínims quadrats.
Graus de llibertat Suma de quadrats
Promig de los quadrats (Variància s^2 )
Valor crític de F
2 i i
SSR/1 SSR/(SSE/n-2) Probabili- tat de F
2 i i i
SSE/n-
Total n-
2 i i
Coefi- cients
Error típic (Desviació estàndard del paràmetre) Estadístic t Probabi- litat
Inferior 95%
Superior 95%
Inter- cepció a
s (^) a=s
i i i i
(a-α=0)/ s (^) a
el p- valor o probabi- litat de cada paràme- tre
-tα s (^) a + tα s (^) a
Variable X 1 b
s (^) b =s/
i i
x y x y n
(b-=0)/ sb - tα s^ b tα s^ b
L’estadistic t és la t avaluada de cada paràmetre. D’acord al criteri t, un paràmetre és significatiu si la t avaluada és superior a la t de Student tabulada. Un paràmetre és significatiu si el p-valor és menor que el nivell de significació establert, convencionalment 0,05 o 0,0. Els intervals de confiança dels paràmetres es calculen amb tα(α=0.05,n-2). En el cas de disposar de replicats, l’anàlisi de significació de la funció ajustada es fa comparant la variància de l’ajust (SSE) amb la variància de l’error experimental (
2 i replicats
mitjanes) mitjançant un test de F (Fexperimental = s r^2 /s e^2 < Ftabulada ).