Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Densità di Frequenza e Correlazione Statistica, Appunti di Statistica

Libera Università Mediterranea (LUM Jean Monnet)Statistica

La densità di frequenza e le proprietà associate, inclusa la correlazione lineare tra due caratteri. Viene introdotto l'indice di correlazione lineare e la regressione. Il documento include anche osservazioni sulla correlazione inversa e la regressione lineare dei minimi quadrati.

Tipologia: Appunti

2020/2021

Caricato il 16/02/2021

davide-laneve 🇮🇹

6 documenti

1 / 13

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

Scopri Appunti di Statistica Libera Università Mediterranea (LUM Jean Monnet)

Documenti correlati

Analisi della Varianza e Correlazione: Esercizi e Spiegazione

Correlazione regressione lineare

correlazione lineare linea di regressione

Appunti Statistica Medica su Correlazione e Regressione Lineare, Covarianza.

Distribuzioni Doppie: Regressione Lineare e Correlazione

Esercitazione Statistica: Correlazione, Regressione e Distribuzioni

Calcoli statistici: correlazione lineare e regressione

Correlazione e interpolazione

Lezione 5: Statistica bivariata - Indice di correlazione lineare e regressione lineare

Correlazione Lineare e Regressione Lineare Semplice in Statistica Bivariata - Prof. Forcin

Analisi della Correlazione: Misurare la Relazione Lineare tra Due Variabili

Correlazione Lineare: Analisi e Interpretazione

(1)

Anteprima parziale del testo

Scarica Densità di Frequenza e Correlazione Statistica e più Appunti in PDF di Statistica solo su Docsity!

FUNZIONE DI DENSITA’ DELLE FREQUENZE

Data una distribuzione continua per intervalli Xi-Xi+1 con frequenza relativa Pi, si definisce densità delle frequenze la quantità Fi come= Pi/Xi+1-Xi. La densità di frequenza consente di determinare la funzione di densità delle frequenze f(x) che gode delle seguenti proprietà: 1)Fx: appartenente ad R ; 2)Fx >= 0 ; 3)Pi rappresenta l’area del rettangolo, Fx l’altezza ed Xi+1-Xi la base. FUNZIONE DI RIPARTIZIONE O CUMULATIVA DELLE FREQUENZE Si definisce funzione di ripartizione l’insieme delle coppie ordinate [Xi,ed F(Xi)] dove Xi rappresenta un valore reale ed F(Xi) rappresenta la frequenza cumulata con cui si rilevano i valori inferiori o uguali ad Xi. Si ha dunque F(Xi)= Fr (X<=Xi) dove Fr rappresenta la frequenza relativa. -CASO DISCRETO PROPRIETA’

Limite di X che va a -infinito di F(Xi)= 2)Limite di X che va a +infinito di F(Xi)= 3)Limite di H che va a +0positivo di F(Xi+H)= F(Xi) 4)Limite di H che va a +0negativo di F(Xi)= F(Xi-1) -CASO CONTINUO PROPRIETA’ 1)F(X): R (0,1)
Limite di X che va a -infinito di F(Xi)= 3)Limite di X che va a +infinito di F(Xi)= 4)F(x) è continua in R Fx è derivabile in tutto R ad eccezione dei punti estremi delle classi. STUDIO DELLA CONCENTRAZIONE Riguarda caratteri di tipo trasferibile: un carattere quantitativo si definisce di tipo trasferibile quando ha senso ipotizzare che l’intero ammontare del carattere sia detenuto da un solo soggetto (es: il patrimonio) dove si analizzeranno in ordine : (Fi-Qi)*** -INDICE CONCENTRAZIONE DI GINI Se R=0 parleremo di EQUIDISTRIBUZIONE Se =1, MAX CONCENTRAZIONE DA 0 a 1 invece ALTA CONCENTRAZIONE -SPEZZATA DI LORENTZ Che si determina riportando su un sistema di assi cartesiani ortogonali i valori di Fi (sull’asse delle ascisse) e Qi (sull’asse delle ordinate) precedentemente calcolati e collegando i punti ottenuti. -AREA DI CONCENTRAZIONE :Viene definita come l’area compresa tra la retta di equidistribuzione e la spezzata di Lorentz dove per facilitare i calcoli di tale area basta suddividere l’area sottesa alla spezzata di Lorentz in triangoli e trapezi di cui sono noti le basi e le altezze. Facendo riferimento ad esempio al calcolo di una popolazione ed alla spezzata di Lorentz rappresentata si avranno valori:-Pop.1 :Area=0,…...Pop.2 :Area Area ABC –(A1+A2+A3) …...Pop.3 :Area Area ABC –A

STUDIO DELLA CONNESSIONE

Lo studio della connessione riguarda lo studio del legame tra due caratteri indicati rispettivamente con X ed Y. I due caratteri si rappresentano mediante una tabella a doppia entrata con frequenze relative o assolute dove lo schema di tabella riferito alle frequenze relative è il seguente: dove le 𝑥1,......., h indicano le modalità del carattere X; 𝑥 le y1,……y k indicano le modalità del carattere Y; le p1,……phk indicano le frequenze congiunte dei due caratteri. Definizione : date due variabili statistiche X ed Y esse si definiscono tra loro statisticamente indipendenti se pij = pi. · p.j appartenente i = 1…h & appartenente a j= 1…k e sappiamo che se i due caratteri non sono statisticamente indipendenti sono definiti connessi. Per lo studio della connessione viene introdotto un ulteriore indice definito indice quadratico medio di contingenza dato da Fi^2 (x,y)= ∑ di H con i=1 e ∑ di K con j=1 [Pij-pi. X P.j]^2 / Pi. X P.j La bontà della connessione è stabilita dall’indice quadratico medio di contingenza relativo dato da: fi^2(x,y)= fi^2(x,y) / min (h-1,k-1) Se fi^2 (x,y)=0 avremo indipendenza statistica Da 0 ad 1 avremo bassa connessione Se fi^2 (x,y)=1 invece massima connessione

CORRELAZIONE LINEARE

La correlazione lineare ci fornisce informazioni per verificare se il legame, già stabilito con la Connessione Fi^2(X,Y)tra due caratteri è di tipo lineare. Per lo studio della correlazione lineare è stato introdotto un indice definito appunto indice di correlazione lineare dato da Ro(X, Y) =cov (X, Y) / σ(X) · σ(Y) dove la quantità cov (X, Y) è data per definizione da cov= Mi(X, Y) − Mi(X) · Mi(Y) Con Mi(x,y)= ∑ di H con i=1 e ∑ di K con j=1 Xi* x Yj* x Pij ovvero la media congiunta dei caratteri X ed Y. Mi(x) rappresenta la media del carattere X e Mi(y) rappresenta la media del carattere Y Osservazioni: p(X, Y) esistente [−1,1] Se p(X, Y) = −1 avremo massima correlazione lineare inversa e la retta che rappresenta il legame tra i due caratteri avrà inclinazione negativa. Se p(X, Y) = 1 avremo massima correlazione lineare diretta e la retta che rappresenta il legame tra i due caratteri avrà inclinazione positiva. Se p(X, Y) = 0 non avremo correlazione lineare. Il segno p(X, Y) è determinato dal segno di cov (X, Y), essendo σ(X) e σ(Y) quantità non negative. In particolare se cov (X, Y) > 0 avremo caratteri concordanti, se invece sarà < 0 avremo caratteri discordanti.

μ (X, Y)– [μ (Y) - bμ2 (X)] mi(x) − bμ (X2) = 0 ⇒ μ (X, Y)– μ (X) μ (Y) + bμ2 (X) − bμ (X2) = 0 ⇒ (ricordando la definizione di covarianza e raccogliendo la b) cov (X, Y) − b[μ (X2) − μ2 (X)] = 0 ⇒ cov (X, Y) − bsigma^2(X)= 0 ⇒b= cov (X,Y)/sigma^2 (x). INDICE DI DETERMINAZIONE R^2 corrisponde (=) a Ro^2(X,Y), con R^2 che esiste tra 0 e 1; Se R^2=0 avremo caratteri indipendenti, se uguale a 1 avremo massima efficienza della retta, se tra 0 e 1 invece retta scarsamente efficace.

NOZIONI DI CALCOLO COMBINATORIO

Dati S1 , S2 , …Sr insiemi, ciascuno costituito da n1 , n2…nr oggetti diversi è possibile considerare il PRODOTTO CARTESIANO:ossia il prodotto dei vari sistemi s1,s2… ∈Sr. Dove sappiamo che gli elementi del prodotto cartesiano vengono definiti allineamenti ed in relazione al modo di considerare tali allineamenti si possono stabilire le seguenti definizioni. Dato un insieme S = {a1 , a2 …, an} di n oggetti diversi e dato un numero naturale r si indica con Dn,r il numero di tutti gli allineamenti che si possono formare con r oggetti scelti tra gli n e considerando diversi due allineamenti se si verifica una delle seguenti condizioni: 1)gli allineamenti sono composti da elementi diversi, 2)gli allineamenti sono composti dagli stessi elementi disposti in modo diverso, 3)gli allineamenti sono composti dagli stessi elementi ripetuti un numero diverso di volte. Il numero di Dn,r è dato da n^r e ciascun allineamento è definito DISPOSIZIONE CON RESTITUZIONE (O RIPETIZIONE). Dato un insieme S di n oggetti diversi e dato un numero naturale r ≤ n si indica con D*n,r il numero di tutti gli allineamenti che si possono formare con r oggetti scelti tra gli n tali per cui due allineamenti si dicono diversi se si verifica una delle seguenti condizioni: 1)gli allineamenti sono composti da elementi diversi; 2)gli allineamenti sono composti dagli stessi elementi disposti in modo diverso. Il numero di Dn,r è dato da n^r con n^(r) = n · (n − 1) · (n − 2) · … .· (n − r + 1) e ciascun allineamento è definito DISPOSIZIONE SENZA RESTITUZIONE (O RIPETIZIONE). CASO PARTICOLARE: Se n = r: Dn,n si indica con Pn Il numero di Pn è dato da n! e ciascun allineamento è definito PERMUTAZIONE. Dato un insieme S = {a1 , a2 … an} di n oggetti diversi e dato un numero naturale r ≤ n si indica con Cn,r il numero di tutti gli allineamenti che si possono formare con r oggetti scelti tra gli n e considerando diversi due allineamenti se si verifica la seguente condizione: -gli allineamenti sono composti da elementi diversi. Il numero di Cn,r è dato dal coefficiente binomiale di N Su R= n! / r!(n-r)! e ciascun allineamento è definito COMBINAZIONE SENZA RESTITUZIONE (O RIPETIZIONE).

INTRODUZIONE ALLO STUDIO DELLA PROBABILITA’

Per intraprendere lo studio della probabilità risultano di fondamentale importanza le definizioni di: 1)EVENTO= Dato un esperimento dicesi evento un fatto fisico o concettuale espresso a parole per mezzo di un enunciato che ammette due soli risultati logici: vero (V) o falso (F). Dove gli eventi saranno indicati con lettere maiuscole dell’alfabeto latino. 2)INSIEME DEI RISULTATI ELEMENTARI= Dato un esperimento dicesi insieme dei risultati o insieme degli eventi elementari e si indica con omega(Ω) l’insieme di tutti i possibili risultati dell’esperimento incompatibili tra loro. Ω = {ω1, ω2, … ωn} 3)CLASSE DEGLI EVENTI= Dato un esperimento e fissato l’insieme dei risultati Ω dicesi classe degli eventi e si indica con F l’insieme di tutti i sottoinsiemi di Ω che gode delle seguenti proprietà: a) ф ∈ F ; b) Ω ∈ F c) Se A ∈ F ⇒ A^C ∈F, dove A^C indica il complementare dell’insieme A rispetto ad Ω

d)Dati n eventi A1, A2,… An ∈ F⇒ n ⋃ Ai ∈F , dove la numerosità di F è data da 2^n i= 4) PROBABILITA’= 3 tipologie di interpretazione.

INTERPRETAZIONE CLASSICA (O OGGETTIVA) Fissato un esperimento, determinato Ω, dato un evento A sotto Ω si definisce PROBABILITÀ DI A e si indica con P(A) la quantità: P(A) =numero casi favorevoli di A / numero casi possibili
INTERPRETAZIONE FREQUENTISTA Fissato un esperimento, determinato Ω, dato un evento A si definisce PROBABILITÀ DI A e si indica con P(A) la “FREQUENZA RELATIVA A LUNGO ANDARE DELL’EVENTO A ”.
INTERPRETAZIONE SOGGETTIVA Fissato un esperimento, determinato Ω, dato un evento A si definisce PROBABILITÀ DI A e si indica con P(A) il prezzo che si è disposti a pagare puntando sull’evento A in modo che si ottenga un importo monetario pari a 1 se A si verifica e pari a 0 se A non si verifica. (esempio: le scommesse sportive). Oggetto di studio sarà solo il caso dell’interpretazione oggettiva (classica). 5)definizione formale di PROBABILITA’ OGGETTIVA= Fissato un esperimento, determinati Ω e F e dato un evento A, si definisce misura di probabilità (in breve probabilità) una qualunque funzione P definita su Ω tale che: 1)se A ∈ Ω ⇒P (A) ≥ 0 2)P(Ω) = 1 ∞ ∞ 3)Se A1, A2, ….. An ∈ Ç con Ai ∩ AJ = ф allora P( U Ai) = ∑ P(Ai) i=1 i= Osservazioni: se P( ф insieme vuoto)=0 evento impossibile; se P(Ω omega)=1 evento certo e inoltre P(A) esiste tra 0 e 1 P(A)= #a / #omega dove # indica la numerosità dell’insieme considerato.

DISTRIBUZIONE IPERGEOMETRICA E DISTRIBUZIONE BINOMIALE

Esempio E’ data un’urna con 100 palline. 30 palline sono bianche e 70 rosse. Si estraggono 10 palline. Qual è la probabilità di ottenere 5 palline bianche? CASO 1 :Richiesta con ordine di estrazione NON IMPORTANTE ed estrazione SENZA restituzione tutte le combinazioni possibili di 100 palline prese a classi di 10} A: evento estrazione 5 palline bianche su 10 estrazioni. Quindi A è il numero dei casi favorevoli e quindi tutte le combinazioni di 30 palline prese a classi di 5 e di 70 palline prese a classi di 5. P(A)=#a / #omega (Generalizzando l’esempio si avrà: è data un’urna con M palline.K palline sono bianche e M-K rosse.Si estraggono N palline senza restituzione. La probabilità di avere X palline bianche è data da) P(X=x)= K su x PER M-K su n-x tutto diviso M su N CASO 2: Ipotesi con ordine di estrazione IMPORTANTE ed estrazione SENZA restituzione. Omega=( tutte le disposizioni possibili senza restituzione di 100 palline prese a classi di 10) P(A)= #A / #OMEGA (Si osservi il coefficiente binomiale che figura nel calcolo determina l’ordine delle possibili alternanze delle palline bianche e rosse estratte). P(X=x)= n su x PER k^x PER (M-K)^(n-x) tutto diviso M^n L’evento certo sarà dato dalla somma delle probabilità quindi:

e sostituendo n P(B) = ∑ P(Ai) · P(B/Ai) i= TEOREMA DI BAYES Con le seguenti ipotesi, ossia : 1)dato Ω come l’insieme dei risultati e n 2)dati gli eventi Ai per i = 1 … n ⇒ avremo ∪Ai = Ω (ipotesi di partizione degli eventi) i=

Ai ∩intersezione Aj = ɸ ,i diverso da j (ossia l’ipotesi di incompatibilità tra due eventi qualsiasi)
P(Ai) sarà > 0 i = 1...n (ipotesi che esclude che P(Ai) = 0 e quindi nessun evento è impossibile)
B sottoinsieme di Ω 6)P(B) > 0 ...si avrà che P(Ai/B)= P(Ai) per P(B/Ai) / P(B) Dimostrazione Per definizione si ha P(Ai/ B)= P(Ai ∩ B) / P(B) ma come gia visto prima ricordando che P(B/Ai)= P(B ∩ Ai) / P(Ai) si ottiene P(B ∩ Ai)= P(Ai) · P(B/Ai) Sostituendo tale risultato si ha P(Ai/B)= P(Ai) PER P(B/Ai) tutto diviso P(B) INDIPENDENZA STOCASTICA Dato un esperimento, fissato Ω e dati due eventi A e B , è noto che P(A/B) = P(A ∩ intersezione B) / P(B) Se supponiamo che A e B siano STATISTICAMENTE INDIPENDENTI si avrà P(A/B) = P(A) Pertanto si può concludere che in tale ipotesi P(A ∩ B) / P(B) = P(A ∩ B) = P(A) · P(B) che ci fornisce la CONDIZIONE DI INDIPENDENZA STOCASTICA. Per concludere si verifichi se i tre eventi hanno tra loro MUTUA INDIPENDENZA. Tale condizione si ha se risulta verificata anche la seguente condizione: P(A1 ∩ A2 ∩ A3 ) = P(A1) · P(A2) · P(A3)

VARIABILI ALEATORIE

dicesi variabile aleatoria una qualsiasi funzione definita in Ω e a valori in R dove X definita in Ω ha valore in R e che associa ad ogni oggetto di Ω un valore numerico. Esempio Sia X(ω) = variabile aleatoria che somma i risultati ottenuti nell’esperimento del lancio di due dadi Ω = {(i, j) con i = 1 … 6 E j = 1 … 6} quindi X(ω) = i + j i = 1 … 6 E j = 1 … 6 VARIABILI ALEATORIE DISCRETE Definizione: data X variabile aleatoria (v.a. in breve) definita in Ω essa dicesi discreta se ciascun elemento di ⋃{X(ω)} ω ∈Ω è un insieme finito o numerabilmente infinito. Nell’esempio precedente quindi la variabile aleatoria introdotta è discreta. FUNZIONE DI PROBABILITA’ DI UNA VARIABILE ALEATORIA DISCRETA Definizione: data una v.a. discreta X , indicato con Rs = { 1 ,𝑥 𝑥2 , … } il suo codominio, la funzione seguente definita in tutto R

p( ) = {Pr (X =𝑥 𝑥i) > 0 se 𝑥i ∈ R𝑥 {0 se 𝑥i Ø R 𝑥 dicesi FUNZIONE DI PROBABILITA’ per la v.a. discreta. Osservazioni: 1)∑ p( ) = 1𝑥 𝑥∈ R 𝑥 2)appartenente 𝑥 ∈ Rx : p( ) > =0𝑥 FUNZIONE DI RIPARTIZIONE DELLE PROBABILITA’ PER UNA V.A. DISCRETA Definizione: data una v.a. discreta X si definisce FUNZIONE DI RIPARTIZIONE di X la funzione y = F( ) definita in tutto R tale che F( ) = Pr(X ≤𝑥 𝑥 𝑥) 𝑥 ∈ in tutto R Si hanno le seguenti proprietà: −F( ) è CRESCENTE𝑥 −F( ) è continua in tutti i punti del dominio ad eccezione degli estremi delle classi in cui F( ) è𝑥 𝑥 continua solo a destra. −lim F( ) = 0 e𝑥 lim F(x)= x→–∞ x→+∞ VARIABILI ALEATORIE DOTATE DI DENSITA’ Definizione: data X v.a. definita in Ω essa dicesi dotata di densità se ciascun elemento di ⋃ {X(ω)} ω ∈Ω è un insieme infinito non numerabile. FUNZIONE DI DENSITA’ DELLA PROBABILITA’ Definizione: data una v.a. X dotata di densità si definisce FUNZIONE DI DENSITA’ DELLA PROBABILITA’ di X, la funzione y = ƒ( ) che associa𝑥 una probabilità ad un qualunque intervallo (a, b) mediante Pr (a < X ≤ b) = ∫ che va da b ad a di ƒ( ) d𝑥 𝑥 con −∞ < a < b < +∞ La funzione di densità della probabilità gode delle seguenti proprietà: 1)ƒ( )𝑥 ≥ 0 𝑥 ∈ +∞

∫ ƒ( ) d𝑥 𝑥 = 1 –∞ FUNZIONE DI RIPARTIZIONE DELLE PROBABILITA’ PER UNA V.A. DOTATA DI DENSITA’ Definizione: data una v.a. dotata di densità X e sia ƒ( ) la sua funzione di densità. Si definisce𝑥 FUNZIONE DI RIPARTIZIONE di X la seguente funzione: x y = F( ) = ∫𝑥 ƒ(t) dt 𝑥 ∈ –∞ Quindi F( ) = Pr(X ≤𝑥 𝑥)è la probabilità con cui X assume valori ≤ di un fissato x. Si hanno le seguenti proprietà: −F( ) è crescente𝑥 −F( ) è continua𝑥 𝑥 ∈in tutto R −F( ) è derivabile𝑥 𝑥 ∈in tutto R ad eccezione degli estremi delle classi in cui è derivabile solo a destra. Lim F(x)=0 E Lim F(x)= x→–∞ x→+∞

-misure di dispersione (o variabiltà): VARIANZA, SCARTO QUADRATICO MEDIO, CAMPO DI VARIAZIONE E COEFFICIENTE DI VARIAZIONE. MISURE DI POSIZIONE CENTRALE MEDIA ARITMETICA Dato un carattere discreto X, ottenuti i valori di un esperimento 𝑥𝑖 𝑖 = 1 ….. 𝑁, la media aritmetica si indica con 𝜇 𝑋( ) ed ha sempre la stessa unità di misura degli elementi cui si riferisce. Nel caso di insiemi non aggregati la media aritmetica è data da N 𝜇 𝑋 ( )= 1/N PER ∑ di Xi i= Distribuzione con frequenza assoluta invece : N 𝜇 𝑋 ( )= 1/N PER ∑ di Xi (Ni) i= Distribuzione con frequenza relativa: N 𝜇 𝑋 ( )= 1/N PER ∑ di Xi (Pi) i= Distribuzione per intervalli con frequenze assolute: N 𝜇 𝑋 ( )= 1/N PER ∑ di mi (ni) dove mi rappresenta il punto medio dell’intervallo i= Distribuzione per intervalli con frequenze relative: N 𝜇 𝑋 ( )= ∑ di mi (Pi) i= Proprietà della media aritmetica Dato il carattere X e le osservazioni 𝑥𝑖 per 𝑖=

1... 𝑁e data una costante c si hanno le seguenti proprietà:

𝜇 𝑐( ) = 𝑐
𝜇 𝑐( + 𝑋) = 𝑐 + 𝜇 𝑋( )
𝜇 𝑐( ∙ 𝑋) = 𝑐 ∙ 𝜇 𝑋( ) n
∑ ( 𝑥𝑖 − 𝜇) = 0 𝑖 =1 la somma degli scarti dalla media è nulla n
∑ ( 𝑥𝑖 − 𝑎)2 è minima se 𝑎 =𝜇 𝑖 = La media è l’operatore che minimizza la somma degli scarti quadratici. Dimostreremo le proprietà 4) e 5) dim. 4) n n n ∑ ( 𝑥𝑖 − 𝜇)= ∑ xi - ∑ 𝜇 = 𝜇 (N) - 𝜇(N) = 𝑖 =1 i=1 i= n Dim. 5) posto 𝐿 = ∑ ( 𝑥𝑖 − 𝑎) i= Per minimizzare tale espressione bisogna calcolare la derivata della quantità L rispetto ad x e porla uguale a 0.

MODA

É data dal valore che appare più spesso in un insieme di dati, ha la stessa unità di misura dei dati stessi e si indica con Mo. Anche per la moda la sua espressione varia seconda dell’ambiente di partenza. Nel caso di insiemi non aggregati la moda è data proprio dall’osservazione che si ripete più volte. 𝑥 1 = 0, 𝑥2 = 2, 𝑥3 = 3, 𝑥4 = 3, 𝑥 5 = 2, 𝑥 6 = 1, 𝑥7 = 3, 𝑥8 = 0, 𝑥9 = 3, 𝑥10 = 3. si conclude facilmente che 𝑀𝑜 = 3. Organizzando i dati delle osservazioni in una distribuzione statistica, si ottiene la seguente tabella: 𝑥∗ 𝑖

La moda corrisponde alla modalità che presenta la massima frequenza che nel caso illustrato risulta essere 5, pertanto 𝑀𝑜= 3. Si osservi che se si hanno due o più frequenze massime la moda coincide con tutte le modalità che hanno frequenza massima!!!!!! MEDIANA Anche per la mediana la sua espressione varia a seconda dell’ambito nel quale stiamo operando. Si ricordi che è importante per lo studio della mediana disporre i dati in modo non decrescente. La mediana ha la stessa unità di misura dei dati oggetti di studio e si indica con Me. Nel caso di insieme non aggregato la mediana è data dall’osservazione che divide l’insieme delle osservazioni in due sottoinsiemi equifrequenti. Nel dettaglio, se N è il numero di osservazioni rilevate la mediana varierà a seconda se N è pari o dispari: - se N dispari, la mediana corrisponde all’osservazione posta in posizione centrale ottenuta attraverso 𝑁+1 / 2. -se N pari la mediana coincide con la media aritmetica tra l’osservazione posta in posizione n/2 e l’osservazione posta in posizione N/2+1. Nel caso di una distribuzione statistica, la mediana è la modalità in corrispondenza della quale le frequenze cumulate 𝐹 𝑖( ) superano per la prima volta il valore 0,5. Qualora avessimo un 𝐹 𝑥𝑖( ) = 0,5, la determinazione della mediana avviene attraverso il calcolo del valore medio tra la modalità in corrispondenza della frequenza cumulata pari a 0, e la modalità successiva. Da ultimo, per la determinazione della mediana nel caso di variabili statistiche continue per intervallo, occorre individuare la classe di intervallo in corrispondenza del quale la funzione di ripartizione 𝐹 𝑥𝑖( ) supera il valore 0,5 (classe mediana) ed uguagliarla a 0,5. Infine, risolvendo l’equazione di primo grado si otterrà il valore della mediana. MISURE DI POSIZIONE NON CENTRALE Si utilizzano per riassumere e descrivere caratteri quantitativi caratterizzati da molte classi di misura che prendono il nome di quantili. Oggetto del nostro studio saranno i quartili che dividono i dati ordinati in 4 gruppi ma analoghe osservazioni possono estendersi al caso dei decili (10 gruppi) e dei percentili (100 gruppi). Analizziamo solo il caso di insiemi non aggregati di N oggetti ordinati Il primo quartile Q1 è il valore rispetto al quale il 25% delle osservazioni sono più piccole ed il 75% delle osservazioni sono più grandi ed in genere corrisponde all’osservazione posta in posizione N+1/4.

PROPRIETA’ DELLA VARIANZA

Dato il carattere X, il carattere Y e data una costante c si hanno le seguenti proprietà:

σ^2(c) = 0
σ^2 (c + X) = σ^2(X)
σ^2 (c ∙ X) = c^2 ∙ σ^2(X)
σ^2 (X ± Y) = σ^2(X) + σ^2(Y) se e solo se i due caratteri sono statisticamente indipendenti. SCARTO QUADRATICO MEDIO Definito anche standard deviation coincide con il valore positivo della radice quadrata della varianza, ha la stessa unità di misura delle osservazioni e si indica con σ. In base all’ambito nel quale ci troviamo calcoleremo la varianza e di conseguenza lo scarto quadratico medio. σ = +σ^ ELEVATO AD 1/ CAMPO DI VARIAZIONE Date N osservazioni ordinate in modo non decrescente x(1), x(2), .... x(N) si definisce campo di variazione la quantità x(N) − x(1) per insiemi non aggregati o x(K) ∗ − x(1) ∗per le distribuzioni statistiche. COEFFICIENTE DI VARIAZIONE Si definisce coefficiente di variazione il rapporto tra lo scarto quadratico medio ed il valore assoluto della media aritmetica. CV = σ / |μ(X)|. Il coeff di variazione è una quantità adimensionale e fornisce un utile strumento per confrontare la variabilità di caratteri con differenti unità di misura. D.L & F.P