Lezione del 3 giugno

I risultati di un'analisi derivano da analisi fatte in laboratorio che possono essere fatte con metodi

volumetrici, gravimetrici o con metodi strumentali, in tutti i casi quello che voi avete e un valore di

concentrazione. più in generale un dato analitico si ha tutte le volte che si fa una misura.

tutte le volte che voi fate una misura sperimentale bisogna tenere a mente che si hanno gli errori. Noi

dobbiamo, quando si ha il risultato di un'analisi, tenere conto e rendere conto a chi legge il risultato di

quale errore abbiamo commesso quindi non è possibile fermarsi a dire la concentrazione è questa, ma

onestamente noi dobbiamo dire anche qual è l'errore associato a quel valore che noi stiamo dando a chi

legge quella analisi.

distinguiamo gli errori che possiamo commettere:

1. l'errore che è sempre comunque presente e che non è mai possibile eliminare ma solo al massimo

ridurre è quello che si chiama errore casuale, la caratteristica dell'errore casuale e di essere

casualmente distribuito attorno al valore vero

2. gli errori sistematici: sistematicamente io faccio sempre ripetutamente lo stesso errore

esempio la bilancia tarata che mi da sempre lo stesso errore, il vantaggio dell’ errore sistematico è

che l'errore sistematico è che può essere individuato ed eliminato. Sono facilmente individuati

Se io sto applicando un metodo per la determinazione dei cloruri, uso una titolazione argentometrica, come

faccio a sapere che non sto commettendo errore? perché vado a prendere uno standard certificato a

concentrazione di cloruri noto e vado a vedere se il valore che io ottengo dalla mia misura non è

significativamente diverso da quello definito dallo standard.

3. Errore grossolano: quando esempio parte del campione viene perso perché cade o perché mi esce

dalla confezione, sono tutti quegli errori che mi costringono a ripartire con la misura da capo ma

che posto tranquillamente individuare e eliminare.

Gli errori sistematici definiscono l'accuratezza del metodo (anche chiamata bias (si legge baias) quindi

quando una misura non è affetta da errori sistematici si dice che la misura è accurata. Cioè restituisce la

concentrazione di analita non significativamente diversa dal valore corretto.

gli errori casuali invece determinano quella che è la precisione del metodo analitico cioè quanto misure

ripetute danno valori vicini tra di loro distribuendosi attorno al valore vero. Quindi noi parliamo di una

misura precisa quando ripeto la misura più volte e il risultato che ottengo non è troppo diverso. quindi la

precisione è legata alla presenza di errori casuali.

la precisione a sua volta può essere distinta in due diversi contesti: se io vado a fare misure ripetute in un

intervallo di tempo piccolo, con la stessa strumentazione cioè senza cambiare nulla della mia misura parlo

di ripetibilità. se invece vado a cambiare anche solo uno di questi parametri per esempio vado a vedere

quali valori ottengo cambiando buretta, vado a definire la riproducibilità.

Facciamo finta che 4 studenti entrino il laboratorio e fanno un a titolazione, determinano l’acidità

dell’aceto. ogni studente ripete la misura 5 volte, il val,ore corretto sarebbe 6,00%

i quattro studenti vanno in laboratorio usano una titolazione acido base e quello che ottengono sono questi

valori:

Anteprima parziale del testo

Scarica 7. errori e trattazione dei dati e più Sbobinature in PDF di Chimica analitica solo su Docsity!

Lezione del 3 giugno I risultati di un'analisi derivano da analisi fatte in laboratorio che possono essere fatte con metodi volumetrici, gravimetrici o con metodi strumentali, in tutti i casi quello che voi avete e un valore di concentrazione. più in generale un dato analitico si ha tutte le volte che si fa una misura. tutte le volte che voi fate una misura sperimentale bisogna tenere a mente che si hanno gli errori. Noi dobbiamo, quando si ha il risultato di un'analisi, tenere conto e rendere conto a chi legge il risultato di quale errore abbiamo commesso quindi non è possibile fermarsi a dire la concentrazione è questa, ma onestamente noi dobbiamo dire anche qual è l'errore associato a quel valore che noi stiamo dando a chi legge quella analisi. distinguiamo gli errori che possiamo commettere:

l'errore che è sempre comunque presente e che non è mai possibile eliminare ma solo al massimo ridurre è quello che si chiama errore casuale, la caratteristica dell'errore casuale e di essere casualmente distribuito attorno al valore vero
gli errori sistematici: sistematicamente io faccio sempre ripetutamente lo stesso errore esempio la bilancia tarata che mi da sempre lo stesso errore, il vantaggio dell’ errore sistematico è che l'errore sistematico è che può essere individuato ed eliminato. Sono facilmente individuati Se io sto applicando un metodo per la determinazione dei cloruri, uso una titolazione argentometrica, come faccio a sapere che non sto commettendo errore? perché vado a prendere uno standard certificato a concentrazione di cloruri noto e vado a vedere se il valore che io ottengo dalla mia misura non è significativamente diverso da quello definito dallo standard.
Errore grossolano: quando esempio parte del campione viene perso perché cade o perché mi esce dalla confezione, sono tutti quegli errori che mi costringono a ripartire con la misura da capo ma che posto tranquillamente individuare e eliminare. Gli errori sistematici definiscono l'accuratezza del metodo (anche chiamata bias (si legge baias) quindi quando una misura non è affetta da errori sistematici si dice che la misura è accurata. Cioè restituisce la concentrazione di analita non significativamente diversa dal valore corretto. gli errori casuali invece determinano quella che è la precisione del metodo analitico cioè quanto misure ripetute danno valori vicini tra di loro distribuendosi attorno al valore vero. Quindi noi parliamo di una misura precisa quando ripeto la misura più volte e il risultato che ottengo non è troppo diverso. quindi la precisione è legata alla presenza di errori casuali. la precisione a sua volta può essere distinta in due diversi contesti: se io vado a fare misure ripetute in un intervallo di tempo piccolo, con la stessa strumentazione cioè senza cambiare nulla della mia misura parlo di ripetibilità. se invece vado a cambiare anche solo uno di questi parametri per esempio vado a vedere quali valori ottengo cambiando buretta, vado a definire la riproducibilità. Facciamo finta che 4 studenti entrino il laboratorio e fanno un a titolazione, determinano l’acidità dell’aceto. ogni studente ripete la misura 5 volte, il val,ore corretto sarebbe 6,00% i quattro studenti vanno in laboratorio usano una titolazione acido base e quello che ottengono sono questi valori:

Riportiamo i dati su un grafico Su un grafico che riporta la concentrazione stimata dai dai quattro studenti, i pallini identificano le quattro misure, il primo studente ha ottenuto 5 misure molto vicine tra di loro ma sono distante dal valore vero, quindi lo studente è stato molto preciso, la sua ripetibilità molto buona ma misure non accurate , lo studente B ha ottenuto misure molto diverse tra loro, precisone scarsa ma se io vado a mediare i valori otteniamo un valore medio che è abbastanza prossimo al valore vero quindi è stato poco preciso ma accurato. C poco preciso e poco accurato, D invece molto preciso e anche accurato. Per valutare se un metodo è preciso occorre fare replicati della stessa misura e verificarne ripetibilità e producibilità, per valutare se un metodo è accurato occorre fare un confronto tra il valore ottenuto e il valore noto che si chiama standard analitico. Come quantificare i risultati di una serie di misure? Per esprimere il loro valore medio uso la media ritmica, o semplicemente media: somma di tutte le misure divise per il loro numero, visto che gli errori casuali si distribuiscono casualmente a destra e sinistra del valore vero, la media mi serve per elidere gli errori casuali. Per esprimere la loro dispersione intorno al valore medio uso la deviazione standard. Si indica con la lettera minuscola S, la differenza tra il valore vero e il valore misurato si chiama scarto, gli scarti sono sia positivi che negativi, per far pesare lo stesso modo le scarti positivi e negativi si elevano al quadrato così diventano tutti positivi poi si fa la radice. Poi gli scarti devono essere divisi per il numero delle misure. I chimici dividono per il numero delle misure meno 1 in questo modo il denominatore è più piccolo e la deviazione standard diventa più grande n - 1 si chiama gradi di libertà cioè sono il numero di equazioni indipendenti che posso scrivere per una determinata relazione matematica. quindi deviazione standard è una misura della precisione perché mi dice quanto le varie misure determinate (xi) si si discostano dal valore medio (x con cappello). e la definizione di deviazione standard che si usa nelle analisi è la sommatoria degli scarti quadratici diviso i gradi di libertà.

i dati si distribuiscono secondo una distribuzione gaussiana questa equazione fondamentalmente mi dice che il valore medio è questa grandezza che io chiamo mi ed è il valore vero. la probabilità di ottenere un valore inferiore è esattamente uguale alla probabilità di ottenere un valore superiore perché questa curva è assolutamente simmetrica, la larghezza di questa curva dipende dalla precisione della misura e quindi dipende dalla deviazione standard della popolazione che chiamo con la lettera sigma il valore medio che io determino è il valore esatto non affetto da errore perché gli errori casuali si sono eliminati completamente. Quello che noi facciamo in un campione di analisi è determinare il valore medio che è una stima della media della popolazione e determinare la deviazione standard che è una stima della deviazione standard della popolazione che è sigma

Se io vado a partizionare la curva gaussiana e vado a vedere quanti dati sono compresi nell'intervallo tra mi più sigma e mi meno sigma vedo che sono compresi il 68% dei dati

ma se io il numero delle misure che ho fatto non è infinito ma è finito e quindi non sono sicura di avere eliso completamente gli errori casuali allora devo allargare l’intervallo di fiducia per rendere conto della probabilità di non avere eliminando completamente gli errori casuali, al posto di 1,96 devo inserire un valore t stabilito rispetto a una distribuzione di dati che prende il nome di distribuzione di Student. t dipende dal numero dei gradi di libertà (n-1) quindi il modo più onesto di dare un risultato di un'analisi è dare il valore medio più t volte definito da noi sulla base di quale livello di confidenza vogliamo, quante misure abbiamo fatto per la deviazione standard della media. Quindi l’intervallo di fiducia è l'intervallo di dati in cui con una definita probabilità e per un numero di misure fatte si definisce dove cade il valore vero.

Gli intervalli di fiducia possono essere usati per:

Uno stabilire il range di una misura
Controllare se ci sono errori sistematici i valori sono diversi tra errore perché c'è un errore casuale, ma mi accorgo che il penultimo valore è più alto degli altri, mi chiedo se è un outlier significa cioè che il valore non appartiene a una popolazione dei dati, quindi non cadrebbe nella curva gaussiana e deve essere eliminato. per rispondere a questa domanda bisogna rifarsi a criteri oggettivi come ad esempio il test di significatività. Ovvero strumenti statistici usati nelle analisi per dare risposte oggettive. si basano sulla formulazione di un'ipotesi nulla che chiamo H0, si calcola un parametro numerico e lo si confronta con un parametro tabulato. Se il valore di calcolo è maggiore di quello tabulato respingiamo l'ipotesi nulla quindi diciamo che non è vero che i due valori sono diversi solo per effetto del caso ma c'è un fattore significativo, se invece il valore calcolato è minore quello tabulato allora evidenziamo che non c'è evidenza di errori sistematici (ma non è detto che non ci siano) Il valore tabulato dipende dalla probabilità che voglio e dal numero di misure eseguite. i test di significatività più usati sono tre e sono il test q chiamato anche test degli outliers, il test ti detto test di accuratezza e il test F detto test di precisione

Quindi ora posso togliere il dato, e calcolo il valore medio x e la deviazione standard Visto che i due valori sono diversi posso venderlo? Devo associare l’intervallo di fiducia. Devo confrontare un valore medio stimato quindi affetto da errore con un valore definito non affetto da errore, devo fare un test accuratezza detto test t di student. H con zero dice che il valore medio calcolato differisce da quello tabulato, fisso, solo per errori casuali. Quindi devo confrontare il valore medio stimato di un campione col valore vero, se il valore calcolato è minore di quello vero allora non si respinge l'ipotesi e i due valori differiscono solo per errore casuale. Se invece il valore calcolato e maggiore del valore vero allora si respinge l'ipotesi nulla. Nel testo si parla genericamente di errori sistematici, ma può essere utilizzato per evidenziare fattori sistematici. Ad esempio un processo di produzione che va fuori controllo, in questo caso il valore vero è un valore di riferimento, Ma tante volte succede che io invece devo fare il confronto tra due medie di dati. Esempio: produco un farmaco, definisco una concentrazione di principio attivo oggi, poi la vado a definire tra un mese, tra un anno, tutte le volte faccio una misura e ottengo un valore medio e una deviazione standard, faccio il confronto tra il farmaco prodotto dall’azienda A e il farmaco prodotto dall’azienda B.

Sto facendo il confronto tra due campioni di dati, confronto due valori medi con due deviazioni standard, se le due deviazioni standard non sono significativamente diverse, calcolo i gradi di libertà come la somma dei gradi di libertà del campione 1 e del campione 2. Lezione del 4 giugno Tutte le volte che facciamo una misura possono sorgere tre tipi di errori, a parte per i grossolani che possiamo individuare ed eliminare subito, abbiamo gli errori casuali ed gli errori sistematici, gli errori casuali sono in ogni misura e non possiamo eliminarli, ma al massimo ridurre e fanno sì che se noi potessimo ripetere la misura un infinito numero di volte non otterremo lo stesso valore ma otterremo una distribuzione di valori detta distribuzione gaussiana con un valore medio pari al valore esatto che stiamo cercando, la larghezza cioè la distribuzione dei dati attorno al valore vero si chiama sigma, “deviazione standard della popolazione”. In realtà quello che noi facciamo in laboratorio è prendere un campione di misure ed estrarre casualmente 3, 4 , 5 valori tra gli infiniti possibili e quindi determinare un valore x medio che è una stima di mi e una deviazione standard s che è una stima di sigma. Quindi la cosa più onesta che noi dobbiamo fare quando conferiamo la misura è dare un valore x medio che è un valore sperimentale affetto da errore che non si è annullato completamente e dare una stima dell'incertezza legato a questo valore medio definito intervallo di fiducia dove si prende un parametro t ad un certo valore di probabilità per un numero di gradi di libertà n - 1 per s che è la deviazione standard della misura diviso la radice di n dove s diviso radice di n è la deviazione standard della media Si usano i test di significatività per rispondere alle domande in modo oggettivo (per descrizione dei test leggi prima) (la prof dice che non chiede le formule di questa parte) Nel test t posso anche confrontare due popolazioni di dati, cioè un valore sperimentale X1 medio e un secondo valore sperimentale X2 medio, mi chiedo se X1 medio è significativamente diverso da X2 medio o se le due curve sono sovrapposte, X1 e X2 sono solo una stima di μ1 (mi) e μ2 (mi) ma non è detto che siano esattamente lo stesso valore. Quindi devo confrontare ciascuna media con il proprio intervallo di fiducia e vedere se i due intervalli convergono, in quel caso i due valori sono non significativamente diversi. Un’altra domanda che ci facciamo è sulla larghezza della curva quindi sigma1 e sigma2, esempio ho due metodi per analizzare un analita. Voglio vedere se hanno la stessa precisione. Se potessi misurare sigma sarei apposto perché sigma è la misura esatta della precisione del metodo ma io sigma non posso misurarla perché dovrei fare un infinito numero di misure, io posso stimare sigma misurando s, s1 potrebbe essere diverso da s2 per effetto del caso oppure dovuto a fattori sistematici. Per scoprirlo uso il test f che mette in rapporto le due varianze, la varianza è la deviazione standard al quadrato quindi

La funzione sarà 𝑦 = 𝑎 0 + 𝑎 1 𝑥 Dove l’intercetta cioè 𝑎 0 è affetta da errore quindi Il metodo dei minimi quadrati prende le differenze negative quindi i punti che stanno sotto e le differenze positive quindi i punti che stanno sopra e cerca di fare in modo che la somma faccia zero. Quindi la regressione lineare sfrutta il metodo dei minimi quadrati perciò va a misurare le differenze tra il valore sperimentale y e un ipotetico 𝑦̂ definito dal modello, porta queste differenze al quadrato, le sdomma e le minimizza facendo cioè la derivata e porta uguale a zero

Quando posso usare questo modello?

I valori della variabile indipendente x non sono affetti da errore
I residui cioè la differenza tra il valore misurato e quello vero sono distribuiti secondo la curva gaussiana cioè affetti solo da errori casuali
I residui sono indipendenti
I residui hanno la stessa varianza cioè la deviazione standard è costante , ovvero hanno la condizione detta omoschedasticità Io posso usare il metodo dei minimi quadrati per determinare la funzione di regressione solo quando:
Uso soluzione standard
Le misure sono affette solo da errore causale che è costante a tutti i punti

identifico una regione di spazio dove risiedono le rette che hanno intercetta e pendenza variabile, questo spazio è definito intervallo di fiducia della calibrazione e rappresenta l’incertezza L’intervallo di fiducia è l’errore, esso è più stretto in mezzo, la calibrazione ha errore più basso vicino al centroide, li la precisone della mia misura è più alta. Quindi determiniamo l’intervallo di fiducia della pendenza e quello dell’intercetta, al centro è situato l’intervallo di fiducia della regressione, ai lati l’intervallo di fiducia della predizione come la deviazione standard era una misura della precisione del mio metodo analitico, abbiamo anche la deviazione standard della regressione,

i gradi di libertà sono n-2 perché la retta passa per due punti. (questa la possiamo imparare) La deviazione standard di pendenza e intercetta è tanto più alta quanto è più alta l’incertezza della calibrazione R è il coefficiente di correlazione che indica il grado di correlazione tra la y e la x, va da - 1 a 1, tanto più ci avviciniamo a 1 tanto più il modello di regressione è buono, cioè i valori di y sono bene correlati ai valori di x. Quando facciamo le calibrazioni dobbiamo sempre distribuire le concentrazioni misurate in tutto l’intervallo delle concentrazioni

7. errori e trattazione dei dati, Sbobinature di Chimica analitica

Documenti correlati

Anteprima parziale del testo

Scarica 7. errori e trattazione dei dati e più Sbobinature in PDF di Chimica analitica solo su Docsity!