










Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
parte 7. errori e trattazione dei dati
Tipologia: Sbobinature
1 / 18
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!











Lezione del 3 giugno I risultati di un'analisi derivano da analisi fatte in laboratorio che possono essere fatte con metodi volumetrici, gravimetrici o con metodi strumentali, in tutti i casi quello che voi avete e un valore di concentrazione. più in generale un dato analitico si ha tutte le volte che si fa una misura. tutte le volte che voi fate una misura sperimentale bisogna tenere a mente che si hanno gli errori. Noi dobbiamo, quando si ha il risultato di un'analisi, tenere conto e rendere conto a chi legge il risultato di quale errore abbiamo commesso quindi non è possibile fermarsi a dire la concentrazione è questa, ma onestamente noi dobbiamo dire anche qual è l'errore associato a quel valore che noi stiamo dando a chi legge quella analisi. distinguiamo gli errori che possiamo commettere:
Riportiamo i dati su un grafico Su un grafico che riporta la concentrazione stimata dai dai quattro studenti, i pallini identificano le quattro misure, il primo studente ha ottenuto 5 misure molto vicine tra di loro ma sono distante dal valore vero, quindi lo studente è stato molto preciso, la sua ripetibilità molto buona ma misure non accurate , lo studente B ha ottenuto misure molto diverse tra loro, precisone scarsa ma se io vado a mediare i valori otteniamo un valore medio che è abbastanza prossimo al valore vero quindi è stato poco preciso ma accurato. C poco preciso e poco accurato, D invece molto preciso e anche accurato. Per valutare se un metodo è preciso occorre fare replicati della stessa misura e verificarne ripetibilità e producibilità, per valutare se un metodo è accurato occorre fare un confronto tra il valore ottenuto e il valore noto che si chiama standard analitico. Come quantificare i risultati di una serie di misure? Per esprimere il loro valore medio uso la media ritmica, o semplicemente media: somma di tutte le misure divise per il loro numero, visto che gli errori casuali si distribuiscono casualmente a destra e sinistra del valore vero, la media mi serve per elidere gli errori casuali. Per esprimere la loro dispersione intorno al valore medio uso la deviazione standard. Si indica con la lettera minuscola S, la differenza tra il valore vero e il valore misurato si chiama scarto, gli scarti sono sia positivi che negativi, per far pesare lo stesso modo le scarti positivi e negativi si elevano al quadrato così diventano tutti positivi poi si fa la radice. Poi gli scarti devono essere divisi per il numero delle misure. I chimici dividono per il numero delle misure meno 1 in questo modo il denominatore è più piccolo e la deviazione standard diventa più grande n - 1 si chiama gradi di libertà cioè sono il numero di equazioni indipendenti che posso scrivere per una determinata relazione matematica. quindi deviazione standard è una misura della precisione perché mi dice quanto le varie misure determinate (xi) si si discostano dal valore medio (x con cappello). e la definizione di deviazione standard che si usa nelle analisi è la sommatoria degli scarti quadratici diviso i gradi di libertà.
i dati si distribuiscono secondo una distribuzione gaussiana questa equazione fondamentalmente mi dice che il valore medio è questa grandezza che io chiamo mi ed è il valore vero. la probabilità di ottenere un valore inferiore è esattamente uguale alla probabilità di ottenere un valore superiore perché questa curva è assolutamente simmetrica, la larghezza di questa curva dipende dalla precisione della misura e quindi dipende dalla deviazione standard della popolazione che chiamo con la lettera sigma il valore medio che io determino è il valore esatto non affetto da errore perché gli errori casuali si sono eliminati completamente. Quello che noi facciamo in un campione di analisi è determinare il valore medio che è una stima della media della popolazione e determinare la deviazione standard che è una stima della deviazione standard della popolazione che è sigma
Se io vado a partizionare la curva gaussiana e vado a vedere quanti dati sono compresi nell'intervallo tra mi più sigma e mi meno sigma vedo che sono compresi il 68% dei dati
ma se io il numero delle misure che ho fatto non è infinito ma è finito e quindi non sono sicura di avere eliso completamente gli errori casuali allora devo allargare l’intervallo di fiducia per rendere conto della probabilità di non avere eliminando completamente gli errori casuali, al posto di 1,96 devo inserire un valore t stabilito rispetto a una distribuzione di dati che prende il nome di distribuzione di Student. t dipende dal numero dei gradi di libertà (n-1) quindi il modo più onesto di dare un risultato di un'analisi è dare il valore medio più t volte definito da noi sulla base di quale livello di confidenza vogliamo, quante misure abbiamo fatto per la deviazione standard della media. Quindi l’intervallo di fiducia è l'intervallo di dati in cui con una definita probabilità e per un numero di misure fatte si definisce dove cade il valore vero.
Gli intervalli di fiducia possono essere usati per:
Quindi ora posso togliere il dato, e calcolo il valore medio x e la deviazione standard Visto che i due valori sono diversi posso venderlo? Devo associare l’intervallo di fiducia. Devo confrontare un valore medio stimato quindi affetto da errore con un valore definito non affetto da errore, devo fare un test accuratezza detto test t di student. H con zero dice che il valore medio calcolato differisce da quello tabulato, fisso, solo per errori casuali. Quindi devo confrontare il valore medio stimato di un campione col valore vero, se il valore calcolato è minore di quello vero allora non si respinge l'ipotesi e i due valori differiscono solo per errore casuale. Se invece il valore calcolato e maggiore del valore vero allora si respinge l'ipotesi nulla. Nel testo si parla genericamente di errori sistematici, ma può essere utilizzato per evidenziare fattori sistematici. Ad esempio un processo di produzione che va fuori controllo, in questo caso il valore vero è un valore di riferimento, Ma tante volte succede che io invece devo fare il confronto tra due medie di dati. Esempio: produco un farmaco, definisco una concentrazione di principio attivo oggi, poi la vado a definire tra un mese, tra un anno, tutte le volte faccio una misura e ottengo un valore medio e una deviazione standard, faccio il confronto tra il farmaco prodotto dall’azienda A e il farmaco prodotto dall’azienda B.
Sto facendo il confronto tra due campioni di dati, confronto due valori medi con due deviazioni standard, se le due deviazioni standard non sono significativamente diverse, calcolo i gradi di libertà come la somma dei gradi di libertà del campione 1 e del campione 2. Lezione del 4 giugno Tutte le volte che facciamo una misura possono sorgere tre tipi di errori, a parte per i grossolani che possiamo individuare ed eliminare subito, abbiamo gli errori casuali ed gli errori sistematici, gli errori casuali sono in ogni misura e non possiamo eliminarli, ma al massimo ridurre e fanno sì che se noi potessimo ripetere la misura un infinito numero di volte non otterremo lo stesso valore ma otterremo una distribuzione di valori detta distribuzione gaussiana con un valore medio pari al valore esatto che stiamo cercando, la larghezza cioè la distribuzione dei dati attorno al valore vero si chiama sigma, “deviazione standard della popolazione”. In realtà quello che noi facciamo in laboratorio è prendere un campione di misure ed estrarre casualmente 3, 4 , 5 valori tra gli infiniti possibili e quindi determinare un valore x medio che è una stima di mi e una deviazione standard s che è una stima di sigma. Quindi la cosa più onesta che noi dobbiamo fare quando conferiamo la misura è dare un valore x medio che è un valore sperimentale affetto da errore che non si è annullato completamente e dare una stima dell'incertezza legato a questo valore medio definito intervallo di fiducia dove si prende un parametro t ad un certo valore di probabilità per un numero di gradi di libertà n - 1 per s che è la deviazione standard della misura diviso la radice di n dove s diviso radice di n è la deviazione standard della media Si usano i test di significatività per rispondere alle domande in modo oggettivo (per descrizione dei test leggi prima) (la prof dice che non chiede le formule di questa parte) Nel test t posso anche confrontare due popolazioni di dati, cioè un valore sperimentale X1 medio e un secondo valore sperimentale X2 medio, mi chiedo se X1 medio è significativamente diverso da X2 medio o se le due curve sono sovrapposte, X1 e X2 sono solo una stima di μ1 (mi) e μ2 (mi) ma non è detto che siano esattamente lo stesso valore. Quindi devo confrontare ciascuna media con il proprio intervallo di fiducia e vedere se i due intervalli convergono, in quel caso i due valori sono non significativamente diversi. Un’altra domanda che ci facciamo è sulla larghezza della curva quindi sigma1 e sigma2, esempio ho due metodi per analizzare un analita. Voglio vedere se hanno la stessa precisione. Se potessi misurare sigma sarei apposto perché sigma è la misura esatta della precisione del metodo ma io sigma non posso misurarla perché dovrei fare un infinito numero di misure, io posso stimare sigma misurando s, s1 potrebbe essere diverso da s2 per effetto del caso oppure dovuto a fattori sistematici. Per scoprirlo uso il test f che mette in rapporto le due varianze, la varianza è la deviazione standard al quadrato quindi
La funzione sarà 𝑦 = 𝑎 0 + 𝑎 1 𝑥 Dove l’intercetta cioè 𝑎 0 è affetta da errore quindi Il metodo dei minimi quadrati prende le differenze negative quindi i punti che stanno sotto e le differenze positive quindi i punti che stanno sopra e cerca di fare in modo che la somma faccia zero. Quindi la regressione lineare sfrutta il metodo dei minimi quadrati perciò va a misurare le differenze tra il valore sperimentale y e un ipotetico 𝑦̂ definito dal modello, porta queste differenze al quadrato, le sdomma e le minimizza facendo cioè la derivata e porta uguale a zero
Quando posso usare questo modello?
identifico una regione di spazio dove risiedono le rette che hanno intercetta e pendenza variabile, questo spazio è definito intervallo di fiducia della calibrazione e rappresenta l’incertezza L’intervallo di fiducia è l’errore, esso è più stretto in mezzo, la calibrazione ha errore più basso vicino al centroide, li la precisone della mia misura è più alta. Quindi determiniamo l’intervallo di fiducia della pendenza e quello dell’intercetta, al centro è situato l’intervallo di fiducia della regressione, ai lati l’intervallo di fiducia della predizione come la deviazione standard era una misura della precisione del mio metodo analitico, abbiamo anche la deviazione standard della regressione,
i gradi di libertà sono n-2 perché la retta passa per due punti. (questa la possiamo imparare) La deviazione standard di pendenza e intercetta è tanto più alta quanto è più alta l’incertezza della calibrazione R è il coefficiente di correlazione che indica il grado di correlazione tra la y e la x, va da - 1 a 1, tanto più ci avviciniamo a 1 tanto più il modello di regressione è buono, cioè i valori di y sono bene correlati ai valori di x. Quando facciamo le calibrazioni dobbiamo sempre distribuire le concentrazioni misurate in tutto l’intervallo delle concentrazioni