



Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una introduzione alla statistica, spiegando concetti come fenomeno statistico, unità statistica, popolazione statistica, numerosità, statistica descrittiva monovariata, bivariata e multivariata, rilevazione, scale qualitative e quantitative, modalità, media aritmetica, proprietà di internalità e omogeneità, medie di chisini e armonica, variabilità, range, devianza quadratico e minimo, funzioni di perdita drastica, media e varianza marginale e condizionata, associatività delle medie condizionate, varianza nei e fra, indice di indipendenza, covarianza e correlazione perfetta, probabilità, variabile casuale, media e varianza, devianza e variabile casuale binomiale.
Tipologia: Appunti
1 / 7
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




Statistica
− Fenomeno statistico (X,Y,A,B )fenomeno d’interesse per la statistica che si presenta con una molteplicità di manifestazioni (x,y,a,b); − unità statistichesupporti fisici delle diverse manifestazioni (u.s.); − popolazione statistica o universol’insieme delle unità statistiche (U); − numerosità o dimensione di Un° di unità statistiche che compongono la popolazione statistica (N); − statistica descrittiva monovariata (un solo fenomeno rilevato su U), bivariata( coppia di fenomeni), multivariata(se i fenomeni sono più di 2); − la rilevazione di X su U è un processo di creazione di dati; − scala di modalità o di rilevazioneinsieme di tutte le possibili manifestazioni x di X (su U); devono rispettare 2 principi generali Esaustività(deve prevedere tutte le possibili manifestazioni di X su U), Mutua esclusività(deve prevedere solo modalità che si escludono a vicenda senza creare confusione); − Scale qualitative (attributi o categorie), quantitative (numeri); − Qualitative possono esserequalitative ordinali(possono essere ordinati secondo un criterio logico) relazioni = o ≠ ≥≤, sconnesse(non ammettono un ordinamento)solo relazioni = o ≠sottotipo della scala sconnessadicotomica o binaria (2 modalità, esaustive ed esclusive; − Quantitative possono essererapporto(l’origine della scala sia il n°0 con significato assoluto) x :, non rapporto(l’origine nn è assoluto ma convenzionale) relazioni ≥≤+ -. − I fenomeni possono essere qualitativi, quantitativa,ordinali, categoriali(rilevabili su scala qualitativa sconnessa), quantitativi discreti(mediante conteggio e enumerazione)quantitativi continui(mediante misurazione); − intervallimodalità (χl) di un fenomeno X continuo; − χlestremo inferiore, χLestremo superiore; − freq.assoluta (ƒi)n°di u.s. che manifesta xi di X, l’insieme delle freq.assolute è detta distribuzione di frequenza; − organizzazione dati grezzi in forma tabellare − freq.relativa (pi) ƒi/N se si moltiplica x 100 si ha la percentuale; − freq. Cumulata assoluta (Fi)F1= ƒ1, F2=F1+ƒ2…. =∑ ƒ=N; − cumulata relativa(Φi) Φ1=p1, Φ2=p1+p2…..= ∑ =Fi/N=1; − valore centralein caso di intervalli χ^ χ^ ; − densità di frequenza assoluta ( i) (^) χ ƒχ;
− densità di frequenza relativa i / N = (^) χ χ; − moda o norma (χ0) è la modalità a cui è associata la freq. più elevata (si osserva nella tab. dei pi); − mediana di X (χ0.5) è la modalità che nell’ordinamento occupa la posizione centrale (si osserva nella tab.
− minimo (χ1), massimo(χk) l’ultimo dell’elenco, I quartile(χ0.25) si osserva nelle freq. cumulate il valore sopra lo 0.25; mediana o II quartile(χ0.5), III quartile(χ0.75) osserva nelle freq. cumulate il valore sopra lo 0.75 attraverso questi valore si costruisce il box plot; − media aritmetica ẍ= ·∑ χi · ƒi= ∑ χi · pi; − proprietà di internalità χ1≤ ẍ ≥ χk; − proprietà di omogeneità ÿ=a·ẍ; − proprietà associativa (medie delle medie) ẍ= ∑ ẍj · Nj; − proprietà di linearità ÿ=a·bẍ; − proprietà di annullamento degli scarti∑^ ( χi − ẍ)ƒi = 0; − proprietà di mantenimento e di equidistribuzione del totale ∑ χiƒi = Nẍ = ∑ ẍƒi; − scarto quadratico ∑ ( χi − valor medio)² ƒi; − scarto quadratico minimo medio ∑ ( χi − ẍ)² ƒi; − scarto quadratico minimo modano ∑^ ( χi − χ0)² ƒi; − scarto quadratico minimo mediano ∑^ ( χi − χ0.5)² ƒi;
− funzione di perdita drasticalim(→* ∑^ |χi · valor medio| ˢ ƒi; − funzione di minimo di perdita della media lim(→* ∑^ , |χi · ẍ| ˢ ƒi ; − funzione di minimo di perdita della modalim(→* ∑^ , |χi · χ0 | ˢ ƒi; − funzione di minimo di perdita della mediana lim(→* ∑ , |χi · χ0.5| ˢ ƒi; − media di Chisini∑^ χiƒi = ∑^ ẍƒi; − media Armonica (^) ∑ ƒ- / (^012) .-
− variabilità o dispersione di X attitudine di un fenomeno quantitativo a manifestarsi, sulle N unità di U, con modalità fra loro diverse e distanti, misure di variabilità assolute:
Devianza standard o scarto quadratico medio di X 3 = 4 · ∑ ( χi − ẍ) ƒi formula alternativa:
3 = 4 · ∑^ χi ƒi − ẍ² = 4∑^ χ^
/ 012 5 ƒ −^ ẍ²; Varianza di X 3 ² = (^) · ∑^ ( χi − ẍ) ƒi formula alternativa: 3 = (^) · ∑^ χi ƒi − ẍ² = ∑^ χ^
/ 012 5 ƒ −^ ẍ²; Devianza di X 63 ² = ∑^ ( χi − ẍ) ƒi; − misure di variabilità relative: Coefficiente di variazione di X 78 = (^9) ẍ ; − normalizzazione procedimento per trasformare un indicatore statistico assoluto in una %:I (^) :;=>:^ :;< :;<; Si procede con la stesura della tab.osservata e sulla base di essa della tabella di massima variabilità χi ƒi Χmin Χmax
ƒ N-ƒ N
ẍ= ?@ABCƒ + xmax (6 − ƒ)F ƒ=(>;=>>;=> >;<^ ẍ) − normalizzazione di σ (^) 9;=>^9 interpretabile come % di variabilità;
− numeri indice basse fissa (istante-base t=1) >G> · 100;
− variazione % rispetto all’anno-base v= (NI base fissa – 100);
− numeri indice a base mobile (^) >G>G · 100;
− variazione % annua v= (NI base mobile – 100);
− tasso di variazione medio annuoṽ=I KL2 4 >J> − 1M · 100 = N(>JO) KL2^2 − 1P · 100 (positivo o negativo);
− invariante >JO · ∏^ JG (^) >G>G = ∏^ JG(**RG + 1);
− tabelle a doppia entrata i= fenomeno X, j= fenomeno Y, k=n° differenti modalità (xi) di X, h=n° differenti modalità (yj) di Y, ƒi·=freq. Marginali di X, ƒ·j=freq. Marginali di Y, ƒij= freq. Congiunte. Y X
y1…… ƒi·
x1… ƒ·j N
− Varianza NEI è la media delle varianze condizionate: σ²NEI = ∑^ σ² ÿ |xi · ƒi ·= ∑^ ∑^ (a − ÿ |xi)²ƒij;
− Varianza FRAè la varianza delle medie condizionate: σ²FRA = (^) ∑^ ( ÿ |xi − ÿ )²ƒi ·;
− Scomposizione della varianzaσ²NEI+ σ²FRA= σ²Y;
− Indice di indipendenza (di Y da X) o rapporto di correlazione di Pearsonη² Y=σ² σ²bcde se risulta =1 allora Y dipende
perfettamente da X o X spiega totalmente il variare di Y;
− Indice di indipendenza di X da Y η² X=σ² σ²bcdf con σ²FRA = ∑ ( ẍ |yj − ẍ )²ƒ · j e σ²x= (^) ∑ (xi − ẍ )²ƒi ·;
− Coefficiente di correlazione lineare ρXY = (^) kσ²jfefj²e se ρXY=-1 X e Y sono perfettamente e negativamente correlati,
ρXY=+1 sono perfettamente e positivamente correlati, ρXY=0 sono incorrelati; − Situazioni limite assenza di relazione e relazione perfetta fra X e Y: Indipendenza statistica assenza di relazione fra X e Y : X²= 0 Indipendenza in media di Y da X assenza di condizionamento di X su Y: η² Y=0; Indipendenza in media di X da Y assenza di condizionamento di Y su X: η² x=0; Incorrelazione assenza di relazione lineare fra X e Y: ρXY=0; Massima connessione esiste un legame perfetto fra X e Y: X² normalizzato = η² x = η² Y =1 ; perfetta correlazione esiste una perfetta relazione lineare fra X e Y: ρXY=±1 η² X = η² Y = 1 X² = 1; − Inferenzaindica il processo logistico di passaggio dalla premessa alla conclusione, un caso speciale è l’inferenza induttiva che procede dal particolare al generale. L’Inferenza statistica è un’inferenza induttiva che procede dal campione (una parte) alla popolazione (il tutto); il campione deve avere la caratteristica della rappresentatività, cioè sia una immagine in scala ridotta ma fedele all’intera U. L’inferenza statistica si basa su campioni casuali, ossia è casuale se è una parte di U scelta a caso da U stessa. La casualità del campione è garanzia della sua rappresentatività. Il campione rappresenta tutti i dati ed è parziale e casuale. Ci si trova in una situazione casuale quando l’insieme di circostanze che determinano l’evento E è noto solo parzialmente. La parte di circostanze ignote definisce il caso. Definizioni fondamentali: − Esperimento casualeesperimento condotto sotto l’effetto del caso, cioè quando è nota solo una parte, è possibile solo elencare a priori l’insieme dei possibili esiti; − Evento elementare ciascuno dei possibili esiti di un esperimento casuale; − Spazio campionario (Ω) insieme di tutti i possibili esiti di un esperimento casuale, elencabili a priori, è l’insieme di tutti gli eventi elementari; − Evento casuale è un sottoinsieme di Ωcioè un insieme di eventi elementari: E C Ω;
− Probabilità P(E) è il rapporto (cioè una funzione) fra il numero di casi favorevoli ad (E) e il numero di tutti i casi
possibili, posto che possano ritenersi tutti ugualmente possibili: definizione frequentista o statistica: P(E)= lim→q ^ ƒ;
− Variabile casuale (v.c.)è una funzione con dominio nello spazio campionario Ω e condominio nell’insieme dei n° reali
a cui rimangono associate le probabilità degli eventi di Ω;
− Variabile casuale di X assume un numero finito di valori di x che di solito sono n° interi; − Funzione di probabilità di X è associata ad una v.c. discreta, ne descrive completamente le probabilità ed ha sempre somma 1: P(X=x) con ∑ (^) > r(s = @) = 1; − Funzione di ripartizione è simile alla freq.cumulata P(X≤x) dove x è un n° reale;
− Media detta anche valore atteso E(X) ∑ · r(s = @)> =; − Varianza V(X)= ∑ ?@ − t(s)F² · r(s = @)> ;
− Devianza SD(X)=ku(s);
− Variabile casuale binomiale (X∼Bin (n,p)) è una particolare v.c. discreta, serve per modellare situazioni statistiche che hanno 3 caratteristiche: l’esperimento casuale consiste nell’esecuzione di n prove indipendenti, e l’esito di ciascuna prova non influenza l’esito della prova successiva; ciascuna prova può avere come esito uno di due eventi fra loro contrari ed esaustivi (successo e insuccesso); è nota e costante in ciascuna prova la probabilità del successo (p) che varia da 0 a 1: P (successo)=p 0<p< P(insuccesso)= 1-p; X∼Bin (n,p) con n> 0 intero, 0< p < 1 e x= 0,1,2,…n;
− Coeff. Binomiale v<>w = (^) >!(<<! >)! che si legge n! enne fattoriale e si calcola: n!= n·(n-1)·(n-2)… 3·2·1;
− Funzione di probabilità di X∼Bin (n,p) P(X=x)= v<>w>(1 − )<^ >^ 7yC @ = 0,1,2, … C;
− Media di X∼Bin (n,p)E(X)= n·p;
− Varianza di X∼Bin (n,p) V(X)= n·p·(1-p);
− Deviazione standard di X∼Bin (n,p)SD(X)=kn · p · (1 − p);
− Variabili casuali continue si utilizzano su fenomeni statistici continui, assumono infiniti valori ed occorre far riferimento a insiemi di valori (intervalli), non hanno la funzione di probabilità P(X=x) ma hanno la funzione di densità (x) che serve per calcolare le probabilità di intervalli di una v.c. X continua; nel continuo le probabilità sono aree. − Variabile casuale normale o di Gauss (X∼N(μ,σ²)) ha sempre funzione di densità (x), si rappresenta graficamente
− con una curva a campana sul valore μ, che rappresenta sia la media di X∼N(μ,σ²): E(X)= μ, sia la mediana di X; il
paramento σ² è la varianza di X∼N(μ,σ²): V(X)= σ² dalla quale si determina la deviazione standard SD(X)= kσ²= σ. L’area sottesa della curva è uguale sia a sinistra che a destra è pari dunque a 0.5 P (X≤μ) = P(X≥μ)=0.5; − Standardizzare una v.c. X significa toglierle la sua media E(X) e dividerla per la sua deviazione standard
SD(X)=ku(s) = Ok(O)^ ~(O) E(X standard)=0 e V(X standard)= SD(X standard)=
MSE(Ṕ)= V(Ṕ)=u < (<,)< = < uvBC(C, )w = <··(<²^ )= ·(<^ )
SE(Ṕ)= 4 ṕ ·(<^ ṕ ).
χi ƒi χ 1 ƒ χ 2 ƒ χn ƒn N
χi ƒi pi Φi χL-χl i / N = (^) χ χ i/N