

















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Come valutare la qualità dei dati attraverso il controllo dei bias, l'errore di campionamento e la statistica descrittiva. Vengono presentati concetti come variabile, modalità, raggruppamento dei dati in classe, media campionaria, mediana, moda, centili e asimmetria. Il documento illustra come calcolare queste misure utilizzando esempi pratici.
Tipologia: Appunti
1 / 25
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


















La statistica è l’arte e la scienza del disegno degli studi e dell’analisi dei dati che tali studi producono; la statistica è l’arte di imparare dai dati. Esistono due tipi di statistica:
Unità Statistiche → insieme degli elementi che costituiscono la popolazione.
Per cui si può dire che: vengono usati dei metodi per condurre degli studi di ricerca per analizzare e interpretare i prodotti ottenuti dagli studi. Si parte da un disegno di studio per ottenere dei dati rilevanti e dopo averli raccolti avviene un’ analisi statistica in cui i dati sono semplificati in tabelle e grafici. Si procede secondo inferenza , ossia arrivare ad una decisione o previsione che riguarda l’intera popolazione sulla basa di dati campionari. Per svolgere i calcoli, successivamente, verranno utilizzati dei datafile appositi.
Il disegno di studio è uno dei metodi statistici che caratterizzano la ricerca scientifica e i metodi principali della statistica sono:
Il quesito si formula conoscendo bene l’argomento che può derivare da oggetti per la ricerca e deriva anche da curiosità che il ricercatore stesso si pone. Da esso poi ne deriverebbero delle idee tuttavia bisogna rispettare 5 criteri che sono rappresentati da una sigla F.I.N.E.R, ognuno dei quali ha un significato:
Le fasi della ricerca sono diversi e sono: 1 - Definizione del quesito statico Definizione dell’obiettivo della ricerca 2 - Raccolta dei dati Valutazione della qualità del dato 3 - Analisi statistica 4 - Interpretazione dei risultati 5 - Comunicazione e trasferimento dei risultati della ricerca
Più i dati presentano un errore in piccole percentuali, più è attendibile uno studio per cui scriveremo che la probabilità statistica sarà minore ad un numero α: p < α p < 0.05 5% p < 0.001 1* In tal caso avremo una probabilità che mostra un margine di errore del 5%, per cui le occasioni in cui la dimostrazione dei dati è dimostrabile è molto bassa, ma lo è ancora di più nel caso dell’ 1*1000. Il margine di errore deve essere sempre minore della probabilità statistica, oppure non è sarà attendibile l’intero studio; tuttavia α tiene conto dell’errore casuale. La raccolta degli studi può essere:
Valutazione della qualità del dato Il controllo dei dati viene eseguito per eliminare eventuali bias , ossia gli errori che possono essere presenti, per diversi motivi all’interno di uno studio:
ad un criterio di convenienza di conseguenza i risultati possono essere rappresentativi della popolazione. Il campione deve essere rappresentativo della popolazione e quindi rappresentare la popolazione e non la convenienza, per questo viene inoltre scelto casualmente e non per convenienza.
Tipi di campionamento Esistono vari tipi di campionamento e sono:
Modalità di campionamento Non è arbitrario e può essere con:
Per ottenere un campionamento bisogna seguire 3 step:
Ho una popolazione che comunque presenta 17 unità e prendo le prime 5 stringhe, controllo quale di queste stringhe presenta delle unità che fanno parte della popolazione e li prendo in considerazione. La crescente diffusione dei computer che si ebbe a partire dai primi anni ‘40 fece nascere il desiderio di poter eseguire efficientemente la generazione dei numeri “casuali” impiegando i computer, giungendo alla formulazione di un algoritmo o si una serie di operazioni aritmetiche inserite in un processo interattivo che ha portato alla generazione di numeri pseudo-casuali. L’utilizzo di computer ha facilitato, quindi lo svolgimento e la ricerca delle tavole numeriche permette di trovare con più facilità le unità a noi utili. Nel caso di Excel si usa “=CASUALE()” per cui scriverò: =INT(CASUALE()100)+ da ciò otterremo un numero casuale da 1 a 100. Per ottenere un numero si può scrivere anche più generalmente come: =INT(CASUALE()N)+ e ciò perché N è la base che io ho. Tale funzione è una funzione matematica e non statistica, per cui, se non è selezionato, bisogna selezionarlo manualmente. Posso mettere qualsiasi numero al posto di N tuttavia esso deve rispettare la base che io prendo in considerazione. Se la popolazione è infinita usiamo: E: TRA (1) Su ogni campione estratto possiamo attribuire delle caratteristiche, le quali saranno diverse dalle unità che andranno a comporre il campionamento. Per condurre un'indagine campionaria, il campione deve rappresentare la popolazione e affinché ciò avviene un’estrazione casuale in modi diversi, o tramite la tavola dei numeri casuali, oltre ai vari metodi scritti sopra.
Errore di campionamento Il campione è un’imperfetta fotografia della popolazione per cui scrivere:
I fattori che influiscono sull’errore di campionamento sono le dimensioni del campione stesso e della variabilità, per cui disponendo di un campione (n) su ciascuna unità statistica abbiamo la possibilità di raccogliere i dati in modi diversi. Nella tabella sono sintetizzati alcuni esempi di campioni in cui, su ogni unità è stata misurata una caratteristica definita variabile che può differire da individuo ad individuo.
Variabile Come già detto precedentemente essa può essere qualitativa o categorica e rappresenta una caratteristica di un’unità statistica, ma non misurabile; i valori che vengono assunti vengono chiamate modalità. Un esempio di modalità sono: adenina, guanina, citosina e timina le quali sono 4 modalità della variabile del DNA. Nel caso della variabile quantitativa la caratteristica di un’unità statistica è espressa da un numero derivante da un conteggio o una misura e si possono riconoscere due tipi di variabili:
La frequenza cumulata viene calcolata per ottenere informazioni sulle osservazioni che assumono valori inferiori o superiori alla modalità di interesse. Fi si ottiene sommando la frequenza assoluta della modalità considerata e la frequenza assoluta della modalità precedente; l’ultima frequenza cumulata sarà uguale al totale del campione (n). Per ottenere la frequenza cumulata relativa verrà svolto il rapporto tra la frequenza cumulata di una modalità ed il totale delle frequenze assolute (o n): (Fi /n) Un esempio di tabella di frequenza relativa di una variabile qualitativa è la tabella che riporta le frequenze relative delle 10 cause di morte più comuni degli adolescenti statunitensi di età compresa tra 15 e 19 anni nel 1999. Può essere sviluppata anche una tabella di frequenza cumulata, in cui vengono riportate le frequenze cumulate delle stesse variabili prese in considerazione prima.
Raggruppamento dei dati in classe Avendo misurato una variabile quantitativa, la costruzione della tabella di frequenza da poche informazioni e questo perché le variabili quantitative mostrano valori contenuti in un mezzo di misura. Si esegue un raggruppamento di dati in classi e serve per trarre informazioni da essi oltre a evidenziare l’intervallo dei valori che risultano più frequenti per la caratteristica considerata. Quindi la tabella mette in evidenza il 50% percento dei del campione con un dato medio. Un intervallo è costituito da un limite o superiore o inferiore, facenti parte di una classe aperta {160-165} o chiusa [160-165]. La classe aperta ha un limite superiore che equivale ai valori racchiusi in una parentesi graffa. Quando si viene a raggruppare una serie di dati, essi devono appartenere ad una classe che rispecchia gli stessi limiti, e questo perché le classi sono aperte. Le parentesi graffe indicano che anche il limite inferiore appartiene al limite (aperta), la classe non sarebbe stata esclusiva perché i limiti massimi e minimi fanno parte dell’intervallo; nel caso delle parentesi quadre, il limite minimo esso non apparterrà al tale limite (intervallo chiuso). Per raggruppare i dati in casi bisogna:
Rappresentazione grafica dei dati Sono essenziali sia nella presentazione dei risultati, in cui si cerca di comunicare cosa dicono i dati, sia per la presentazione dei dati rilevati, attraverso i quali cerchiamo di capire cosa dicono i dati stessi. Nel caso del grafico dot-plot rappresenta il grafico più semplice perché evidenzia dati anomali e ogni valore è rappresentato da un punto, consentendo di individuare valori anomali o valori che si ripetono. I vantaggi della rappresentazione grafica è la messa in evidenza le caratteristiche principali di un fenomeno in una forma immediatamente percepibili e oltre a suggerire al lettore nuove ipotesi per ulteriori studi ed approfondimenti. Le caratteristiche principali per costruire un grafico deve essere accurato, chiaro e semplice e per ottenere tali elementi bisogna:
Per le variabili quantitative le misure di posizione più importanti sono: la media,mediana e moda. Esistono vari tipi di media , ossia:
𝑥 = 𝑖 = 1
𝑛 ∑ 𝑥𝑖
𝑛
μ =
𝑖 = 1
𝑛 ∑ 𝑥𝑖
𝑁 Per cui graficamente la media può essere vista come il baricentro di una distribuzione, se ogni singola osservazione fosse rappresentata da un peso convenzionale, identico per tutte, lungo l’asse che riporta i valori su una scala di intervalli o di rapporti. Su excel la si calcola come, avendo i dati all’interno di una tabella di frequenza, moltiplicando il valore per xi per ogni singola osservazione, fratto per i valori totali presenti all’interno della tabella. Se i dati sono riportati in una tabella di frequenza, si calcolano le misure descrittive ponderate.
𝑥 =
Tuttavia xi sono le medie degli intervalli di classe cioè il valore centrale di ogni intervallo:
𝑥 𝑖 =
Se si hanno dei vettori viene calcolata una media definita semplice.
Se i dati sono rappresentati in classi si parla di classe mediana. Si tiene conto delle osservazioni della distribuzione, contiene esattamente il valore della mediana. Per avere l’esatto valore della mediana bisogna applicare:
𝑀𝑒 = 𝐿𝑖 +
𝑛 2 − 𝐹 𝑓𝑚^ λ
dove: Li = limite inferiore della classe mediana (classe che contiene la mediana) F = somma delle frequenze di tutte le classi inferiore alla classe mediana fm = frequenza della classe mediana A = ampiezza della classe mediana n = numero delle osservazioni Per individuare la classe mediana si segue la regola:
La moda è un valore con la frequenza più alta in un insieme di dati e appartiene alla modalità della distribuzione; se i dati sono ben rappresentati, la moda sarà il punto massimo di una curva ed è un indice per i dati normali. Non è quindi rappresentata da valori esterni. Per cui si può dire che la classe della moda e quella modale sono contenute una all’interno dell’altra. La distribuzione unimodale se è presente una sola moda; bimodale se ci sono diversi valori della variabile con la stessa frequenza massima; distribuzione multimodale se vi son più di due differenti valori della variabile con la stessa frequenza massima; se nessun valore viene ripetuto non c’è la moda. Su Excel si usa la funzione: =MODA(intervallo di valori) I centili appartengono i percentili, quartili, e così via in base alla divisione della distribuzione. I quartili sono degli indici di posizione che dividono l’intera distribuzione ordinata dei dati in 4 parti uguali. Il primo quartile, Q1, è il valore tale che il 25% delle osservazioni è più piccolo di Q1 e il 75% è più grande di Q1:
posizione Q1 =
Il terzo quartile, Q3, è il valore tale che il 75% delle osservazioni è più piccolo di Q3 e il 25% è più grande di Q3:
posizione Q3 =
Il secondo quartile, Q2, è il valore tale che il 50% delle osservazioni è più piccolo di Q2 e il 50% è più grande di Q2 (coincide con la MEDIANA):
posizione Q2 =
in Excel i quartili si determinano secondo la funzione: =QUARTILE(intervallo di valori) Tali misure sono importanti per quantificare la variabilità di una distribuzione di frequenza. Graficamente possono venirsi a formare diversi tipi di curve:
codevianza divide il numero delle osservazioni (guarda le slide sulla covarianza compresa interpretazione geometrica). Nella rappresentazione grafica verranno rappresentati gli scarti, però saranno concordi solo quando tali scarti saranno nel primo e nel terzo quadrante. La covarianza è > 0 se gli scarti sono nel primo e nel secondo quadrante portando ad una relazione positiva; se fosse < 0 allora la variabilità è negativa e l’indice è negativo, per cui l’andamento della relazione è decrescente, per cui negativa. Svolgendo la relazione, per la covarianza si otterrà sempre un valore molto vicino a 0. Nel caso di Excel useremo: =COVARIANZA.C(A2:A4).
Probabilità La probabilità è importante per i processi biologici i quali sono influenzati dal caso.. Su cosa si basa la probabilità?
Dato che la probabilità si basa su esperimenti aleatori o casuali ha diversi esiti che può produrre; un esempio è il lancio della moneta in cui non possiamo sapere quale sia il risultato, se non dopo l’esecuzione dell’esperimento. La moneta è composta da testa e croce, per cui ci sono due possibilità ma un solo esito in cui si potrà ottenere o testa o croce. Un altro esperimento aleatorio può essere visto anche durante una sequenza di una stringa di DNA in cui vi è la sequenza di basi azotate però si conosce solo dopo il sequenziamento. Prima di procedere con la probabilità bisogna:
La probabilità la si può classificare come:
0<P<1 in cui ci sono varie possibilità:
Un evento composto è un evento formato da uno o più elementi semplici e possono essere legati dall’unione (somma) dei due insiemi semplici, oppure l'intersezione (sottrazione) di essi; per cui viene svolta la probabilità dei singoli eventi.
Dati due eventi si vuole una regola per p(A e B) ossia per la probabilità che l'evento A si verifichi in un primo esperimento e che l'evento B si verifichi in un secondo esperimento, per cui la regola formale del prodotto viene scritta come: P (A∩B) = P (A) * P (B|A) In cui B si realizza se A si è già realizzato per cui p (B|A) si può scrivere e ne deriva la probabilità condizionale: P (B|A) = P (A∩B)/P (A) Nel caso in cui si realizzasse prima B allora scriveremo che: P (A|B) = P (A∩B)/ P (B) Devo però verificare la condizione secondo cui se i due eventi sono dipendenti, la probabilità del secondo evento si è realizzato, quella del primo elemento diventa condizionale; due eventi sono indipendenti se il verificarsi di uno dei due eventi non ha alcun effetto sull verificarsi dell’altro evento in cui P (B|A) coincide con P(B). Esistono tuttavia sia falsi positivi sia falsi negativi in cui il risultato ottenuto è l’opposto. Per definire due eventi indipendenti bisogna soddisfare la condizione in cui la probabilità del secondo evento coincida con la probabilità di B, dato che il primo si è realizzato; se la probabilità condizionale è diversa dal secondo evento, allora essi si definiscono dipendenti. Definizione di tabella di contingenza e tabella di congiunzione. Valore predittivo positivo del test (VPP), invece nel caso di quello negativo esso sarà detto dall’evento complementare di tutti i risultati dei test in cui con l’acronimo viene scritto come VPN; attraverso ciò è in grado di considerare gli eventi positivi e negativi, differenziandoli dai falsi positivi e negativi. Si può anche definire la probabilità a priori, in cui un soggetto presenti una data condizione; nel caso di una probabilità a posteriori, viene considerata la probabilità condizionale applicando la regola di Weiss in cui viene applicata la filosofia bayesiana da cui deriva il calcolo della probabilità a posteriori, tenendo conto dell’evento che si è realizzato e qual è la causa che influisce con maggior probabilità l’esito finale. Vengono tenute in conto tutte le case all’interno di uno spazio campionario all’interno del quale però uno può determinare un determinato fattore. Per questo devi applicare la regola formale del prodotto rispettando però sempre l’indipendenza degli eventi. Per risolvere i problemi di probabilità si possono usare i diagrammi ad albero affinché si abbia un’elencazione grafica di tutti gli elementi dello stato campione; sui rami poniamo i valori di probabilità associati all’esito successo. Dalla radice si dipartono dei rami tanti quanti sono gli esiti che avvengono. E’ un grafico direzionale che mostra gli esiti di un esperimento che si dipartono da uno stesso punto, ossia la radice, generalmente posto in alto a sinistra rappresentando la “situazione iniziale”; si procede poi a costruire i cammini, indicati con le frecce, che tengono conto dei diversi risultati possibili e delle rispettive probabilità che vengono riportate su ogni freccia (o arco del grafo). Lungo i rami si moltiplica attraverso la “e” logica, mentre in orizzontale si addiziona attraverso la “o” logica affinché o uno o l’altro evento si manifestino.
DISTRIB.BINOM (num_successi; prove; probabilità_s; cumulativo) Dove:
𝑃(𝑋) = λ𝑥 𝑥! * 𝑒
−λ
Dove:
μ = 𝑛 * 𝑝 = λ σ
2 = λ → σ = λ
La distribuzione normale è spesso chiamata gaussiana ed è la distribuzione più usata nell’analisi statistica perché descrive bene la maggior parte dei fenomeni naturali e biologici E’ una distribuzione tipica di molti procedimenti di misura in fisica, biologia. La funzione di densità è la rappresentazione dei dati di una variabile continua mediante istogrammi con dati raggruppati in classi, possiamo osservare come facendo crescere indefinitamente il numero delle classi si arriva alla curva che viene chiamata funzione di densità. Per cui essa è data da:
𝑓(𝑥) = con
1 σ 2π
(𝑥−μ)^2 2σ^2
− ∞ < 𝑥 <+ ∞
Dove: π= 3,14; e= 2, Caratteristiche di una distribuzione normale è la simmetria intorno alla sua media μ in cui essa, la mediana e la moda coincidono; l’area sotto la curva vale 1, poiché la distribuzione normale è una distribuzione di probabilità. A causa della simmetria a destra e a sinistra dell’asse di simmetria si trova il 50% dell’area. E la distribuzione normale è specificata da due parametri: μ e σ. Effetti sul grafico di una modifica apportata alla media μ o alla varianza σ^2 :
La standardizzazione avviene se x è un’osservazione da una distribuzione che ha media μ e deviazione standard σ, il valore standardizzato di x (chiamato valore z) è:
𝑧 =
𝑥−μ σ Mentre la trasformazione inversa sarà:
𝑥 = μ 𝑥
In Excel la funzione si scrive come: NORMALIZZA(x;media;deviazione standard) restituendo il valore standardizzato (z).
Qual è la probabilità per un paziente affetto da cirrosi biliare primitiva di avere un valore di albumina ≥ 42.0g/l? Cioè, qual’ è la P(X≥42.0) Si trasforma quindi il valore di 42.0 g/l in valori Z: (42.0 - 34.21)/ 5.39 = 1. Qual’ è la P(X≥42.0) oppure, P(Z≥1,445)? Possiamo usare le tavole Z oppure in Excel la funzione = DISTRIB.NORM.ST.N(z;VERO). Dalla distibuzione di otterrà la probabilità cumulata del’area poichè l’area di probabilità di interesse si riferisce all’area della curva in nero (ovvero della coda destra della distribuzione), all’area di probabilità dell’intera curva, 1, sottraiamo il valore di probabilità dell’area cumulata: p (Z≥1,445) = 1 - 0.926 = 0.0742. Per cui un paziente con albumina ≥42g/l ha il 7.4% di probabilità di essere affetto da cirrosi; dalla curva normale standardizzata possiamo risalire al valore di z noto il valore di probabilità. Qual è il valore di z che stacca il 25,14% dei valori nella coda di sx? In Excel si scrive come: INV.NORM.S(.2514) restituendo il valore di z. Una variabile casuale si definisce continua quando i possibili valori costituiscono un intervallo a cui i possibili valori vengono assegnati dei valori di probabilità e al crescere degli intervallo l’ampiezza di essi si riduce e la forma dell’istogramma tende ad approssimare una curva Si applica la distribuzione binomiale prendendo elementi presi x volte. Si può anche costruire l’intera distribuzione, per cui si può calcolare quanti test siano positivi e/o negativi, affinché si arrivi al numero totale delle osservazioni prese in considerazione; si può calcolare anche la varianza e in tal caso svolgendo la radice quadrata della quantità permetterà di ottenere l'indice di variabilità rispetto al valore atteso. Nel caso in cui i fenomeni, in cui la variabile aleatoria si sviluppi in un tempo in cui essa si può avverare è definita distribuzione di Poisson; qualora si fosse interessati a calcolare la probabilità in cui il numero medio di morti di una cittadina è di 7 su 760 (numero totali di abitanti) e per calcolare il uero medio di morti, si dividerà per 365, affinché si ottenga il valore dei morti per giorni.
Quando vengono raccolti dei campioni biologici è perchè si cerca di conoscere le popolazioni sottostanti di interesse e per popolazione si può riferire anche a:
frequenza campionaria. Per cui la variabilità della distribuzione delle medie con la distribuzione della popolazione della variabile presenta una variabilità minore della distribuzione della popolazione. Risulta essere minore perché il valore ottenuto è il valore delle medie campionarie estratte dalla popolazione, per cui quella misura risente della quantità che coincide con l’errore di campionamento. Pensando in un campo biologico, la statistica può coincidere con la vera media, quantificando l’errore in termini di probabilità per generalizzare le informazioni che ho
ottenuto. Se la quantità è nota allora: (condizione in cui conduciamo degli studi e σ 𝑛 consideriamo un’intera casistica, per cui si può calcolare la vera deviazione standard) per cui se dividiamo per la radice di n otterremo una quantità definita errore standard (indice di variabilità riferito alla distribuzione delle medie campionarie - alla media delle statistiche
campionarie): → varianza → *
σ 𝑛
σ^2 𝑛
Le distribuzioni campionarie della media per campioni di dimensioni sono la varianza e la deviazione standard. In cui, se la dimensione del campione aumenta, la distribuzione campionaria della media diventa più stretta attorno alla media reale, μ. Ciò significa che all’aumentare della dimensione del campione, l’incertezza associata alle nostre stime della media diminuisce, per cui la varianza e la deviazione standard delle medie diminuiscono all’aumentare della numerosità tramite le formule scritte prima *.
Proprietà della distribuzione campionaria delle medie è data da:
Le distribuzioni teoriche che vengono utilizzate per determinare le probabilità delle statistiche campionarie o modifiche delle stesse che ci aspetteremo da ripetuti campionamenti da una o più popolazioni. Queste distribuzioni sono ampiamente utilizzate per la stima e il test di ipotesi. Le tre distribuzioni teoriche per la statistica sono:
Per la distribuzione t di student e x^2 parliamo di famiglie di distribuzione di probabilità che dipendono dal numero dei gradi di libertà (g.l). Se è nota σ, allora è possibile calcolare la vera deviazione standard delle medie campionarie, ottenendo lo standard error; la distribuzione delle medie campionarie. Nota la varianza allora è noto anche l’errore standard (formule inverse). *un piccolo campione è piccolo quando la numerosità del campione è minore di 30; se aumenta la quantità del campione non si potrà utilizzare la distribuzione t di studenti.
In una popolazione la lunghezza del creazioni è approssimativamente distribuita come una normale con una media di 185.6 mm e una deviazione standard di 12.7 mm (sigma). Se si estraggono n = 10 crani, qual è la probabilità che la media della lunghezza del cranio sia ≥190?! SVOLGIMENTO P(X ≥ 190)= ?!
Si standardizza la variabile, chiedendoci qual è il valore z delle medie. Per cui si scrivere: z = x - mi / 12.7/ radice di n. Il valore di z è = 1.09 e p(z ≥ 1.09) = 0.137. In cui: p(X ≥ 190) = 0.
Per cui la distribuzione campionaria individua i possibili valori che una statistica (come la media campionaria) e con quale probabilità in cui data una distribuzione campionaria della
media per una popolazione nota (con sigma noto) è data da: 𝑍 =. 𝑥 − μ σ 𝑛 La distribuzione campionaria di una media se n è piccolo e sigma non è nota in cui coincide
con la distribuzione campionaria teorica: 𝑡 = 𝑥 − μ 𝑠 𝑛
La distribuzione t student è una famiglia di distribuzioni la cui forma cambia di funzione di n-1 che sono definiti in gradi di libertà della distribuzione t e al crescere dei gradi di libertà, la sua forma si avvicina sempre di più a quella delle domande standard; quando la df è 30 o più, le distribuzioni sono quasi identiche.
Gli argomenti finora svolti sono i mattoni della pratica statistica considerando:
Viene definita l’inferenza statistica l’insieme dei metodi che ci consentono di predire i risultati ottenuti dal campione a tutta la popolazione oggetto dello studio. Le tecniche dell’inferenza sono: