







Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
La densità di frequenza e le proprietà associate, inclusa la correlazione lineare tra due caratteri. Viene introdotto l'indice di correlazione lineare e la regressione. Il documento include anche osservazioni sulla correlazione inversa e la regressione lineare dei minimi quadrati.
Tipologia: Appunti
1 / 13
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!








Data una distribuzione continua per intervalli Xi-Xi+1 con frequenza relativa Pi, si definisce densità delle frequenze la quantità Fi come= Pi/Xi+1-Xi. La densità di frequenza consente di determinare la funzione di densità delle frequenze f(x) che gode delle seguenti proprietà: 1)Fx: appartenente ad R ; 2)Fx >= 0 ; 3)Pi rappresenta l’area del rettangolo, Fx l’altezza ed Xi+1-Xi la base. FUNZIONE DI RIPARTIZIONE O CUMULATIVA DELLE FREQUENZE Si definisce funzione di ripartizione l’insieme delle coppie ordinate [Xi,ed F(Xi)] dove Xi rappresenta un valore reale ed F(Xi) rappresenta la frequenza cumulata con cui si rilevano i valori inferiori o uguali ad Xi. Si ha dunque F(Xi)= Fr (X<=Xi) dove Fr rappresenta la frequenza relativa. -CASO DISCRETO PROPRIETA’
Lo studio della connessione riguarda lo studio del legame tra due caratteri indicati rispettivamente con X ed Y. I due caratteri si rappresentano mediante una tabella a doppia entrata con frequenze relative o assolute dove lo schema di tabella riferito alle frequenze relative è il seguente: dove le 𝑥1,......., h indicano le modalità del carattere X; 𝑥 le y1,……y k indicano le modalità del carattere Y; le p1,……phk indicano le frequenze congiunte dei due caratteri. Definizione : date due variabili statistiche X ed Y esse si definiscono tra loro statisticamente indipendenti se pij = pi. · p.j appartenente i = 1…h & appartenente a j= 1…k e sappiamo che se i due caratteri non sono statisticamente indipendenti sono definiti connessi. Per lo studio della connessione viene introdotto un ulteriore indice definito indice quadratico medio di contingenza dato da Fi^2 (x,y)= ∑ di H con i=1 e ∑ di K con j=1 [Pij-pi. X P.j]^2 / Pi. X P.j La bontà della connessione è stabilita dall’indice quadratico medio di contingenza relativo dato da: fi^2(x,y)= fi^2(x,y) / min (h-1,k-1) Se fi^2 (x,y)=0 avremo indipendenza statistica Da 0 ad 1 avremo bassa connessione Se fi^2 (x,y)=1 invece massima connessione
La correlazione lineare ci fornisce informazioni per verificare se il legame, già stabilito con la Connessione Fi^2(X,Y)tra due caratteri è di tipo lineare. Per lo studio della correlazione lineare è stato introdotto un indice definito appunto indice di correlazione lineare dato da Ro(X, Y) =cov (X, Y) / σ(X) · σ(Y) dove la quantità cov (X, Y) è data per definizione da cov= Mi(X, Y) − Mi(X) · Mi(Y) Con Mi(x,y)= ∑ di H con i=1 e ∑ di K con j=1 Xi* x Yj* x Pij ovvero la media congiunta dei caratteri X ed Y. Mi(x) rappresenta la media del carattere X e Mi(y) rappresenta la media del carattere Y Osservazioni: p(X, Y) esistente [−1,1] Se p(X, Y) = −1 avremo massima correlazione lineare inversa e la retta che rappresenta il legame tra i due caratteri avrà inclinazione negativa. Se p(X, Y) = 1 avremo massima correlazione lineare diretta e la retta che rappresenta il legame tra i due caratteri avrà inclinazione positiva. Se p(X, Y) = 0 non avremo correlazione lineare. Il segno p(X, Y) è determinato dal segno di cov (X, Y), essendo σ(X) e σ(Y) quantità non negative. In particolare se cov (X, Y) > 0 avremo caratteri concordanti, se invece sarà < 0 avremo caratteri discordanti.
μ (X, Y)– [μ (Y) - bμ2 (X)] mi(x) − bμ (X2) = 0 ⇒ μ (X, Y)– μ (X) μ (Y) + bμ2 (X) − bμ (X2) = 0 ⇒ (ricordando la definizione di covarianza e raccogliendo la b) cov (X, Y) − b[μ (X2) − μ2 (X)] = 0 ⇒ cov (X, Y) − bsigma^2(X)= 0 ⇒b= cov (X,Y)/sigma^2 (x). INDICE DI DETERMINAZIONE R^2 corrisponde (=) a Ro^2(X,Y), con R^2 che esiste tra 0 e 1; Se R^2=0 avremo caratteri indipendenti, se uguale a 1 avremo massima efficienza della retta, se tra 0 e 1 invece retta scarsamente efficace.
Dati S1 , S2 , …Sr insiemi, ciascuno costituito da n1 , n2…nr oggetti diversi è possibile considerare il PRODOTTO CARTESIANO:ossia il prodotto dei vari sistemi s1,s2… ∈Sr. Dove sappiamo che gli elementi del prodotto cartesiano vengono definiti allineamenti ed in relazione al modo di considerare tali allineamenti si possono stabilire le seguenti definizioni. Dato un insieme S = {a1 , a2 …, an} di n oggetti diversi e dato un numero naturale r si indica con Dn,r il numero di tutti gli allineamenti che si possono formare con r oggetti scelti tra gli n e considerando diversi due allineamenti se si verifica una delle seguenti condizioni: 1)gli allineamenti sono composti da elementi diversi, 2)gli allineamenti sono composti dagli stessi elementi disposti in modo diverso, 3)gli allineamenti sono composti dagli stessi elementi ripetuti un numero diverso di volte. Il numero di Dn,r è dato da n^r e ciascun allineamento è definito DISPOSIZIONE CON RESTITUZIONE (O RIPETIZIONE). Dato un insieme S di n oggetti diversi e dato un numero naturale r ≤ n si indica con D*n,r il numero di tutti gli allineamenti che si possono formare con r oggetti scelti tra gli n tali per cui due allineamenti si dicono diversi se si verifica una delle seguenti condizioni: 1)gli allineamenti sono composti da elementi diversi; 2)gli allineamenti sono composti dagli stessi elementi disposti in modo diverso. Il numero di Dn,r è dato da n^r con n^(r) = n · (n − 1) · (n − 2) · … .· (n − r + 1) e ciascun allineamento è definito DISPOSIZIONE SENZA RESTITUZIONE (O RIPETIZIONE). CASO PARTICOLARE: Se n = r: Dn,n si indica con Pn Il numero di Pn è dato da n! e ciascun allineamento è definito PERMUTAZIONE. Dato un insieme S = {a1 , a2 … an} di n oggetti diversi e dato un numero naturale r ≤ n si indica con Cn,r il numero di tutti gli allineamenti che si possono formare con r oggetti scelti tra gli n e considerando diversi due allineamenti se si verifica la seguente condizione: -gli allineamenti sono composti da elementi diversi. Il numero di Cn,r è dato dal coefficiente binomiale di N Su R= n! / r!(n-r)! e ciascun allineamento è definito COMBINAZIONE SENZA RESTITUZIONE (O RIPETIZIONE).
Per intraprendere lo studio della probabilità risultano di fondamentale importanza le definizioni di: 1)EVENTO= Dato un esperimento dicesi evento un fatto fisico o concettuale espresso a parole per mezzo di un enunciato che ammette due soli risultati logici: vero (V) o falso (F). Dove gli eventi saranno indicati con lettere maiuscole dell’alfabeto latino. 2)INSIEME DEI RISULTATI ELEMENTARI= Dato un esperimento dicesi insieme dei risultati o insieme degli eventi elementari e si indica con omega(Ω) l’insieme di tutti i possibili risultati dell’esperimento incompatibili tra loro. Ω = {ω1, ω2, … ωn} 3)CLASSE DEGLI EVENTI= Dato un esperimento e fissato l’insieme dei risultati Ω dicesi classe degli eventi e si indica con F l’insieme di tutti i sottoinsiemi di Ω che gode delle seguenti proprietà: a) ф ∈ F ; b) Ω ∈ F c) Se A ∈ F ⇒ A^C ∈F, dove A^C indica il complementare dell’insieme A rispetto ad Ω
d)Dati n eventi A1, A2,… An ∈ F⇒ n ⋃ Ai ∈F , dove la numerosità di F è data da 2^n i= 4) PROBABILITA’= 3 tipologie di interpretazione.
Esempio E’ data un’urna con 100 palline. 30 palline sono bianche e 70 rosse. Si estraggono 10 palline. Qual è la probabilità di ottenere 5 palline bianche? CASO 1 :Richiesta con ordine di estrazione NON IMPORTANTE ed estrazione SENZA restituzione tutte le combinazioni possibili di 100 palline prese a classi di 10} A: evento estrazione 5 palline bianche su 10 estrazioni. Quindi A è il numero dei casi favorevoli e quindi tutte le combinazioni di 30 palline prese a classi di 5 e di 70 palline prese a classi di 5. P(A)=#a / #omega (Generalizzando l’esempio si avrà: è data un’urna con M palline.K palline sono bianche e M-K rosse.Si estraggono N palline senza restituzione. La probabilità di avere X palline bianche è data da) P(X=x)= K su x PER M-K su n-x tutto diviso M su N CASO 2: Ipotesi con ordine di estrazione IMPORTANTE ed estrazione SENZA restituzione. Omega=( tutte le disposizioni possibili senza restituzione di 100 palline prese a classi di 10) P(A)= #A / #OMEGA (Si osservi il coefficiente binomiale che figura nel calcolo determina l’ordine delle possibili alternanze delle palline bianche e rosse estratte). P(X=x)= n su x PER k^x PER (M-K)^(n-x) tutto diviso M^n L’evento certo sarà dato dalla somma delle probabilità quindi:
e sostituendo n P(B) = ∑ P(Ai) · P(B/Ai) i= TEOREMA DI BAYES Con le seguenti ipotesi, ossia : 1)dato Ω come l’insieme dei risultati e n 2)dati gli eventi Ai per i = 1 … n ⇒ avremo ∪Ai = Ω (ipotesi di partizione degli eventi) i=
dicesi variabile aleatoria una qualsiasi funzione definita in Ω e a valori in R dove X definita in Ω ha valore in R e che associa ad ogni oggetto di Ω un valore numerico. Esempio Sia X(ω) = variabile aleatoria che somma i risultati ottenuti nell’esperimento del lancio di due dadi Ω = {(i, j) con i = 1 … 6 E j = 1 … 6} quindi X(ω) = i + j i = 1 … 6 E j = 1 … 6 VARIABILI ALEATORIE DISCRETE Definizione: data X variabile aleatoria (v.a. in breve) definita in Ω essa dicesi discreta se ciascun elemento di ⋃{X(ω)} ω ∈Ω è un insieme finito o numerabilmente infinito. Nell’esempio precedente quindi la variabile aleatoria introdotta è discreta. FUNZIONE DI PROBABILITA’ DI UNA VARIABILE ALEATORIA DISCRETA Definizione: data una v.a. discreta X , indicato con Rs = { 1 ,𝑥 𝑥2 , … } il suo codominio, la funzione seguente definita in tutto R
p( ) = {Pr (X =𝑥 𝑥i) > 0 se 𝑥i ∈ R𝑥 {0 se 𝑥i Ø R 𝑥 dicesi FUNZIONE DI PROBABILITA’ per la v.a. discreta. Osservazioni: 1)∑ p( ) = 1𝑥 𝑥∈ R 𝑥 2)appartenente 𝑥 ∈ Rx : p( ) > =0𝑥 FUNZIONE DI RIPARTIZIONE DELLE PROBABILITA’ PER UNA V.A. DISCRETA Definizione: data una v.a. discreta X si definisce FUNZIONE DI RIPARTIZIONE di X la funzione y = F( ) definita in tutto R tale che F( ) = Pr(X ≤𝑥 𝑥 𝑥) 𝑥 ∈ in tutto R Si hanno le seguenti proprietà: −F( ) è CRESCENTE𝑥 −F( ) è continua in tutti i punti del dominio ad eccezione degli estremi delle classi in cui F( ) è𝑥 𝑥 continua solo a destra. −lim F( ) = 0 e𝑥 lim F(x)= x→–∞ x→+∞ VARIABILI ALEATORIE DOTATE DI DENSITA’ Definizione: data X v.a. definita in Ω essa dicesi dotata di densità se ciascun elemento di ⋃ {X(ω)} ω ∈Ω è un insieme infinito non numerabile. FUNZIONE DI DENSITA’ DELLA PROBABILITA’ Definizione: data una v.a. X dotata di densità si definisce FUNZIONE DI DENSITA’ DELLA PROBABILITA’ di X, la funzione y = ƒ( ) che associa𝑥 una probabilità ad un qualunque intervallo (a, b) mediante Pr (a < X ≤ b) = ∫ che va da b ad a di ƒ( ) d𝑥 𝑥 con −∞ < a < b < +∞ La funzione di densità della probabilità gode delle seguenti proprietà: 1)ƒ( )𝑥 ≥ 0 𝑥 ∈ +∞
-misure di dispersione (o variabiltà): VARIANZA, SCARTO QUADRATICO MEDIO, CAMPO DI VARIAZIONE E COEFFICIENTE DI VARIAZIONE. MISURE DI POSIZIONE CENTRALE MEDIA ARITMETICA Dato un carattere discreto X, ottenuti i valori di un esperimento 𝑥𝑖 𝑖 = 1 ….. 𝑁, la media aritmetica si indica con 𝜇 𝑋( ) ed ha sempre la stessa unità di misura degli elementi cui si riferisce. Nel caso di insiemi non aggregati la media aritmetica è data da N 𝜇 𝑋 ( )= 1/N PER ∑ di Xi i= Distribuzione con frequenza assoluta invece : N 𝜇 𝑋 ( )= 1/N PER ∑ di Xi (Ni) i= Distribuzione con frequenza relativa: N 𝜇 𝑋 ( )= 1/N PER ∑ di Xi (Pi) i= Distribuzione per intervalli con frequenze assolute: N 𝜇 𝑋 ( )= 1/N PER ∑ di mi (ni) dove mi rappresenta il punto medio dell’intervallo i= Distribuzione per intervalli con frequenze relative: N 𝜇 𝑋 ( )= ∑ di mi (Pi) i= Proprietà della media aritmetica Dato il carattere X e le osservazioni 𝑥𝑖 per 𝑖=
1... 𝑁e data una costante c si hanno le seguenti proprietà:
É data dal valore che appare più spesso in un insieme di dati, ha la stessa unità di misura dei dati stessi e si indica con Mo. Anche per la moda la sua espressione varia seconda dell’ambiente di partenza. Nel caso di insiemi non aggregati la moda è data proprio dall’osservazione che si ripete più volte. 𝑥 1 = 0, 𝑥2 = 2, 𝑥3 = 3, 𝑥4 = 3, 𝑥 5 = 2, 𝑥 6 = 1, 𝑥7 = 3, 𝑥8 = 0, 𝑥9 = 3, 𝑥10 = 3. si conclude facilmente che 𝑀𝑜 = 3. Organizzando i dati delle osservazioni in una distribuzione statistica, si ottiene la seguente tabella: 𝑥∗ 𝑖
La moda corrisponde alla modalità che presenta la massima frequenza che nel caso illustrato risulta essere 5, pertanto 𝑀𝑜= 3. Si osservi che se si hanno due o più frequenze massime la moda coincide con tutte le modalità che hanno frequenza massima!!!!!! MEDIANA Anche per la mediana la sua espressione varia a seconda dell’ambito nel quale stiamo operando. Si ricordi che è importante per lo studio della mediana disporre i dati in modo non decrescente. La mediana ha la stessa unità di misura dei dati oggetti di studio e si indica con Me. Nel caso di insieme non aggregato la mediana è data dall’osservazione che divide l’insieme delle osservazioni in due sottoinsiemi equifrequenti. Nel dettaglio, se N è il numero di osservazioni rilevate la mediana varierà a seconda se N è pari o dispari: - se N dispari, la mediana corrisponde all’osservazione posta in posizione centrale ottenuta attraverso 𝑁+1 / 2. -se N pari la mediana coincide con la media aritmetica tra l’osservazione posta in posizione n/2 e l’osservazione posta in posizione N/2+1. Nel caso di una distribuzione statistica, la mediana è la modalità in corrispondenza della quale le frequenze cumulate 𝐹 𝑖( ) superano per la prima volta il valore 0,5. Qualora avessimo un 𝐹 𝑥𝑖( ) = 0,5, la determinazione della mediana avviene attraverso il calcolo del valore medio tra la modalità in corrispondenza della frequenza cumulata pari a 0, e la modalità successiva. Da ultimo, per la determinazione della mediana nel caso di variabili statistiche continue per intervallo, occorre individuare la classe di intervallo in corrispondenza del quale la funzione di ripartizione 𝐹 𝑥𝑖( ) supera il valore 0,5 (classe mediana) ed uguagliarla a 0,5. Infine, risolvendo l’equazione di primo grado si otterrà il valore della mediana. MISURE DI POSIZIONE NON CENTRALE Si utilizzano per riassumere e descrivere caratteri quantitativi caratterizzati da molte classi di misura che prendono il nome di quantili. Oggetto del nostro studio saranno i quartili che dividono i dati ordinati in 4 gruppi ma analoghe osservazioni possono estendersi al caso dei decili (10 gruppi) e dei percentili (100 gruppi). Analizziamo solo il caso di insiemi non aggregati di N oggetti ordinati Il primo quartile Q1 è il valore rispetto al quale il 25% delle osservazioni sono più piccole ed il 75% delle osservazioni sono più grandi ed in genere corrisponde all’osservazione posta in posizione N+1/4.
Dato il carattere X, il carattere Y e data una costante c si hanno le seguenti proprietà: