Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica: Concetti Fondamentali, Appunti di Statistica

Una introduzione alla statistica, spiegando concetti come fenomeno statistico, unità statistica, popolazione statistica, numerosità, statistica descrittiva monovariata, bivariata e multivariata, rilevazione, scale qualitative e quantitative, modalità, media aritmetica, proprietà di internalità e omogeneità, medie di chisini e armonica, variabilità, range, devianza quadratico e minimo, funzioni di perdita drastica, media e varianza marginale e condizionata, associatività delle medie condizionate, varianza nei e fra, indice di indipendenza, covarianza e correlazione perfetta, probabilità, variabile casuale, media e varianza, devianza e variabile casuale binomiale.

Tipologia: Appunti

2010/2011

Caricato il 28/06/2011

felicia1988
felicia1988 🇮🇹

4.5

(59)

13 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica
Fenomeno statistico (X,Y,A,B )fenomeno d’interesse per la statistica che si presenta con una molteplicità di
manifestazioni (x,y,a,b);
unità statistichesupporti fisici delle diverse manifestazioni (u.s.);
popolazione statistica o universol’insieme delle unità statistiche (U);
numerosità o dimensione di Un° di unità statistiche che compongono la popolazione statistica (N);
statistica descrittiva monovariata (un solo fenomeno rilevato su U), bivariata( coppia di fenomeni), multivariata(se
i fenomeni sono più di 2);
la rilevazione di X su U è un processo di creazione di dati;
scala di modalità o di rilevazioneinsieme di tutte le possibili manifestazioni x di X (su U); devono rispettare 2
principi generali Esaustività(deve prevedere tutte le possibili manifestazioni di X su U), Mutua esclusività(deve
prevedere solo modalità che si escludono a vicenda senza creare confusione);
Scale qualitative (attributi o categorie), quantitative (numeri);
Qualitative possono esserequalitative ordinali(possono essere ordinati secondo un criterio logico) relazioni = o ≠
≥≤, sconnesse(non ammettono un ordinamento)solo relazioni = o ≠sottotipo della scala sconnessadicotomica
o binaria (2 modalità, esaustive ed esclusive;
Quantitative possono essererapporto(l’origine della scala sia il n°0 con significato assoluto) x :, non
rapporto(l’origine nn è assoluto ma convenzionale) relazioni ≥≤+ -.
I fenomeni possono essere qualitativi, quantitativa,ordinali, categoriali(rilevabili su scala qualitativa sconnessa),
quantitativi discreti(mediante conteggio e enumerazione)quantitativi continui(mediante misurazione);
intervallimodalità (χl) di un fenomeno X continuo;
χlestremo inferiore, χLestremo superiore;
freq.assoluta (ƒi)n°di u.s. che manifesta xi di X, l’insieme delle freq.assolute è detta distribuzione di frequenza;
organizzazione dati grezzi in forma tabellare
freq.relativa (pi) ƒi/N se si moltiplica x 100 si ha la percentuale;
freq. Cumulata assoluta (Fi)F1= ƒ1, F2=F1+ƒ2…. =ƒ

=N;
cumulata relativa(Φi) Φ1=p1, Φ2=p1+p2…..= 

=Fi/N=1;
valore centralein caso di intervalli
χχ
;
densità di frequenza assoluta ( i)
ƒ
χχ
;
densità di frequenza relativa i / N =

χχ
;
moda o norma (χ0) è la modalità a cui è associata la freq. più elevata (si osserva nella tab. dei pi);
mediana di X (χ0.5) è la modalità che nell’ordinamento occupa la posizione centrale (si osserva nella tab.
della Φi il primo valore che supera lo 0.5 quella è la mediana) formula: χ0.5= χl + (0.5-
Φ
i-1)· (
χχ

) dove
Φ
i-1 rappresenta la frequenza cumulata dell’intervallo precedente a quello dove si osserva lo 0.5;
minimo (χ1), massimo(χk) l’ultimo dell’elenco, I quartile(χ0.25) si osserva nelle freq. cumulate il valore sopra
lo 0.25; mediana o II quartile(χ0.5), III quartile(χ0.75) osserva nelle freq. cumulate il valore sopra lo 0.75
attraverso questi valore si costruisce il box plot;
media aritmetica =
·χi·ƒi

= χi·pi

;
proprietà di internalità χ1≤ ≥ χk;
proprietà di omogeneità ÿ=a·;
proprietà associativa (medie delle medie) =
j·Nj

;
proprietà di linearità ÿ=a·b;
proprietà di annullamento degli scarti(χi)

ƒi= 0;
proprietà di mantenimento e di equidistribuzione del totale χi

ƒi= N=ƒi

;
scarto quadratico (χi valor medio)² ƒi

;
scarto quadratico minimo medio (χi)² ƒi

;
scarto quadratico minimo modano (χiχ0)² ƒi

;
scarto quadratico minimo mediano (χiχ0.5)² ƒi

;
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Introduzione alla Statistica: Concetti Fondamentali e più Appunti in PDF di Statistica solo su Docsity!

Statistica

− Fenomeno statistico (X,Y,A,B )fenomeno d’interesse per la statistica che si presenta con una molteplicità di manifestazioni (x,y,a,b); − unità statistichesupporti fisici delle diverse manifestazioni (u.s.); − popolazione statistica o universol’insieme delle unità statistiche (U); − numerosità o dimensione di Un° di unità statistiche che compongono la popolazione statistica (N); − statistica descrittiva monovariata (un solo fenomeno rilevato su U), bivariata( coppia di fenomeni), multivariata(se i fenomeni sono più di 2); − la rilevazione di X su U è un processo di creazione di dati; − scala di modalità o di rilevazioneinsieme di tutte le possibili manifestazioni x di X (su U); devono rispettare 2 principi generali Esaustività(deve prevedere tutte le possibili manifestazioni di X su U), Mutua esclusività(deve prevedere solo modalità che si escludono a vicenda senza creare confusione); − Scale qualitative (attributi o categorie), quantitative (numeri); − Qualitative possono esserequalitative ordinali(possono essere ordinati secondo un criterio logico) relazioni = o ≠ ≥≤, sconnesse(non ammettono un ordinamento)solo relazioni = o ≠sottotipo della scala sconnessadicotomica o binaria (2 modalità, esaustive ed esclusive; − Quantitative possono essererapporto(l’origine della scala sia il n°0 con significato assoluto) x :, non rapporto(l’origine nn è assoluto ma convenzionale) relazioni ≥≤+ -. − I fenomeni possono essere qualitativi, quantitativa,ordinali, categoriali(rilevabili su scala qualitativa sconnessa), quantitativi discreti(mediante conteggio e enumerazione)quantitativi continui(mediante misurazione); − intervallimodalità (χl) di un fenomeno X continuo; − χlestremo inferiore, χLestremo superiore; − freq.assoluta (ƒi)n°di u.s. che manifesta xi di X, l’insieme delle freq.assolute è detta distribuzione di frequenza; − organizzazione dati grezzi in forma tabellare − freq.relativa (pi) ƒi/N se si moltiplica x 100 si ha la percentuale; − freq. Cumulata assoluta (Fi)F1= ƒ1, F2=F1+ƒ2…. =∑  ƒ=N; − cumulata relativa(Φi) Φ1=p1, Φ2=p1+p2…..= ∑  =Fi/N=1; − valore centralein caso di intervalli χ^ χ^ ; − densità di frequenza assoluta ( i)  (^) χ ƒχ;

− densità di frequenza relativa  i / N = (^) χ χ; − moda o norma (χ0) è la modalità a cui è associata la freq. più elevata (si osserva nella tab. dei pi); − mediana di X (χ0.5) è la modalità che nell’ordinamento occupa la posizione centrale (si osserva nella tab.

della Φi il primo valore che supera lo 0.5 quella è la mediana) formula: χ0.5= χl + (0.5-Φi-1)· (χ^  χ) dove

Φi-1 rappresenta la frequenza cumulata dell’intervallo precedente a quello dove si osserva lo 0.5;

− minimo (χ1), massimo(χk) l’ultimo dell’elenco, I quartile(χ0.25) si osserva nelle freq. cumulate il valore sopra lo 0.25; mediana o II quartile(χ0.5), III quartile(χ0.75) osserva nelle freq. cumulate il valore sopra lo 0.75 attraverso questi valore si costruisce il box plot; − media aritmetica ẍ=  ·∑  χi · ƒi= ∑  χi · pi; − proprietà di internalità χ1≤ ẍ ≥ χk; − proprietà di omogeneità ÿ=a·ẍ; − proprietà associativa (medie delle medie) ẍ=  ∑  ẍj · Nj; − proprietà di linearità ÿ=a·bẍ; − proprietà di annullamento degli scarti∑^ ( χi − ẍ)ƒi = 0; − proprietà di mantenimento e di equidistribuzione del totale ∑  χiƒi = Nẍ = ∑  ẍƒi; − scarto quadratico ∑ ( χi − valor medio)² ƒi; − scarto quadratico minimo medio ∑ ( χi − ẍ)² ƒi; − scarto quadratico minimo modano ∑^ ( χi − χ0)² ƒi; − scarto quadratico minimo mediano ∑^ ( χi − χ0.5)² ƒi;

− funzione di perdita drasticalim(→* ∑^  |χi · valor medio| ˢ ƒi; − funzione di minimo di perdita della media  lim(→* ∑^ , |χi · ẍ| ˢ ƒi ; − funzione di minimo di perdita della modalim(→* ∑^ , |χi · χ0 | ˢ ƒi; − funzione di minimo di perdita della mediana lim(→* ∑ , |χi · χ0.5| ˢ ƒi; − media di Chisini∑^  χiƒi = ∑^  ẍƒi; − media Armonica (^) ∑ ƒ- / (^012) .-

− variabilità o dispersione di X attitudine di un fenomeno quantitativo a manifestarsi, sulle N unità di U, con modalità fra loro diverse e distanti, misure di variabilità assolute:

Range di Xχmax- χmin se χmax=χmin range=0, se χmax>χmin range>0;

Differenza quartile χ0.75 - χ0.25;

Devianza standard o scarto quadratico medio di X 3 = 4 · ∑ ( χi − ẍ) ƒi formula alternativa:

3 = 4 · ∑^  χi ƒi − ẍ² = 4∑^ χ^

/ 012 5 ƒ  −^ ẍ²; Varianza di X 3 ² = (^)  · ∑^ ( χi − ẍ) ƒi formula alternativa: 3 = (^)  · ∑^  χi ƒi − ẍ² = ∑^ χ^

/ 012 5 ƒ  −^ ẍ²; Devianza di X 63 ² = ∑^ ( χi − ẍ) ƒi; − misure di variabilità relative: Coefficiente di variazione di X 78 = (^9) ; − normalizzazione procedimento per trasformare un indicatore statistico assoluto in una %:I (^) :;=>:^ :;< :;<; Si procede con la stesura della tab.osservata e sulla base di essa della tabella di massima variabilità χi ƒi Χmin Χmax

ƒ N-ƒ N

ẍ=  ?@ABCƒ + xmax (6 − ƒ)F ƒ=(>;=>>;=> >;<^ ẍ) − normalizzazione di σ  (^) 9;=>^9 interpretabile come % di variabilità;

− numeri indice basse fissa (istante-base t=1) >G> · 100;

− variazione % rispetto all’anno-base v= (NI base fissa – 100);

− numeri indice a base mobile (^) >G>G  · 100;

− variazione % annua v= (NI base mobile – 100);

− tasso di variazione medio annuoṽ=I KL2 4 >J> − 1M · 100 = N(>JO) KL2^2 − 1P · 100 (positivo o negativo);

− invariante >JO · ∏^ JG (^) >G>G = ∏^ JG(**RG + 1);

− tabelle a doppia entrata i= fenomeno X, j= fenomeno Y, k=n° differenti modalità (xi) di X, h=n° differenti modalità (yj) di Y, ƒi·=freq. Marginali di X, ƒ·j=freq. Marginali di Y, ƒij= freq. Congiunte. Y X

y1…… ƒi·

x1… ƒ·j N

− Varianza NEI è la media delle varianze condizionate: σ²NEI =  ∑^ σ² ÿ |xi · ƒi ·= ∑^  ∑^ (a − ÿ |xi)²ƒij;

− Varianza FRAè la varianza delle medie condizionate: σ²FRA = (^)  ∑^ ( ÿ |xi − ÿ )²ƒi ·;

− Scomposizione della varianzaσ²NEI+ σ²FRA= σ²Y;

− Indice di indipendenza (di Y da X) o rapporto di correlazione di Pearsonη² Y=σ² σ²bcde se risulta =1 allora Y dipende

perfettamente da X o X spiega totalmente il variare di Y;

− Indice di indipendenza di X da Y η² X=σ² σ²bcdf con σ²FRA =  ∑ ( |yj − )²ƒ · j e σ²x= (^)  ∑ (xi − )²ƒi ·;

− Momento misto una sorta di media bivariata: μXY=  ∑  ∑  @BahB;

− Covarianza una sorta di misura di variabilità congiunta: σXY=  ∑  ∑ (@B − ẍ ) · (a − ÿ)hB, formula

alternativa: σXY= μXY - ẍ·ÿ;

− Coefficiente di correlazione lineare ρXY = (^) kσ²jfefj²e se ρXY=-1 X e Y sono perfettamente e negativamente correlati,

ρXY=+1 sono perfettamente e positivamente correlati, ρXY=0 sono incorrelati; − Situazioni limite assenza di relazione e relazione perfetta fra X e Y: Indipendenza statistica assenza di relazione fra X e Y : X²= 0 Indipendenza in media di Y da X assenza di condizionamento di X su Y: η² Y=0; Indipendenza in media di X da Y assenza di condizionamento di Y su X: η² x=0; Incorrelazione assenza di relazione lineare fra X e Y: ρXY=0; Massima connessione esiste un legame perfetto fra X e Y: X² normalizzato = η² x = η² Y =1 ; perfetta correlazione esiste una perfetta relazione lineare fra X e Y: ρXY=±1 η² X = η² Y = 1 X² = 1; − Inferenzaindica il processo logistico di passaggio dalla premessa alla conclusione, un caso speciale è l’inferenza induttiva che procede dal particolare al generale. L’Inferenza statistica è un’inferenza induttiva che procede dal campione (una parte) alla popolazione (il tutto); il campione deve avere la caratteristica della rappresentatività, cioè sia una immagine in scala ridotta ma fedele all’intera U. L’inferenza statistica si basa su campioni casuali, ossia è casuale se è una parte di U scelta a caso da U stessa. La casualità del campione è garanzia della sua rappresentatività. Il campione rappresenta tutti i dati ed è parziale e casuale. Ci si trova in una situazione casuale quando l’insieme di circostanze che determinano l’evento E è noto solo parzialmente. La parte di circostanze ignote definisce il caso. Definizioni fondamentali: − Esperimento casualeesperimento condotto sotto l’effetto del caso, cioè quando è nota solo una parte, è possibile solo elencare a priori l’insieme dei possibili esiti; − Evento elementare ciascuno dei possibili esiti di un esperimento casuale; − Spazio campionario (Ω) insieme di tutti i possibili esiti di un esperimento casuale, elencabili a priori, è l’insieme di tutti gli eventi elementari; − Evento casuale è un sottoinsieme di Ωcioè un insieme di eventi elementari: E C Ω;

− Probabilità P(E) è il rapporto (cioè una funzione) fra il numero di casi favorevoli ad (E) e il numero di tutti i casi

possibili, posto che possano ritenersi tutti ugualmente possibili: definizione frequentista o statistica: P(E)= lim→q ^ ƒ;

− Variabile casuale (v.c.)è una funzione con dominio nello spazio campionario Ω e condominio nell’insieme dei n° reali

a cui rimangono associate le probabilità degli eventi di Ω;

− Variabile casuale di X assume un numero finito di valori di x che di solito sono n° interi; − Funzione di probabilità di X è associata ad una v.c. discreta, ne descrive completamente le probabilità ed ha sempre somma 1: P(X=x) con ∑ (^) > r(s = @) = 1; − Funzione di ripartizione è simile alla freq.cumulata P(X≤x) dove x è un n° reale;

− Media detta anche valore atteso E(X) ∑ · r(s = @)> =; − Varianza  V(X)= ∑ ?@ − t(s)F² · r(s = @)> ;

− Devianza SD(X)=ku(s);

− Variabile casuale binomiale (X∼Bin (n,p)) è una particolare v.c. discreta, serve per modellare situazioni statistiche che hanno 3 caratteristiche: l’esperimento casuale consiste nell’esecuzione di n prove indipendenti, e l’esito di ciascuna prova non influenza l’esito della prova successiva; ciascuna prova può avere come esito uno di due eventi fra loro contrari ed esaustivi (successo e insuccesso); è nota e costante in ciascuna prova la probabilità del successo (p) che varia da 0 a 1: P (successo)=p 0<p< P(insuccesso)= 1-p; X∼Bin (n,p) con n> 0 intero, 0< p < 1 e x= 0,1,2,…n;

− Coeff. Binomiale v<>w = (^) >!(<<! >)! che si legge n! enne fattoriale e si calcola: n!= n·(n-1)·(n-2)… 3·2·1;

− Funzione di probabilità di X∼Bin (n,p) P(X=x)= v<>w>(1 − )<^ >^ 7yC @ = 0,1,2, … C;

− Media di X∼Bin (n,p)E(X)= n·p;

− Varianza di X∼Bin (n,p) V(X)= n·p·(1-p);

− Deviazione standard di X∼Bin (n,p)SD(X)=kn · p · (1 − p);

− Variabili casuali continue si utilizzano su fenomeni statistici continui, assumono infiniti valori ed occorre far riferimento a insiemi di valori (intervalli), non hanno la funzione di probabilità P(X=x) ma hanno la funzione di densità (x) che serve per calcolare le probabilità di intervalli di una v.c. X continua; nel continuo le probabilità sono aree. − Variabile casuale normale o di Gauss (X∼N(μ,σ²)) ha sempre funzione di densità (x), si rappresenta graficamente

− con una curva a campana sul valore μ, che rappresenta sia la media di X∼N(μ,σ²): E(X)= μ, sia la mediana di X; il

paramento σ² è la varianza di X∼N(μ,σ²): V(X)= σ² dalla quale si determina la deviazione standard SD(X)= kσ²= σ. L’area sottesa della curva è uguale sia a sinistra che a destra è pari dunque a 0.5 P (X≤μ) = P(X≥μ)=0.5; − Standardizzare una v.c. X significa toglierle la sua media E(X) e dividerla per la sua deviazione standard

SD(X)=ku(s) = Ok(O)^ ~(O) E(X standard)=0 e V(X standard)= SD(X standard)=

MSE(Ṕ)= V(Ṕ)=u † < (<,)< ‡ = < uvˆBC(C, )w = <··(<²^ )= ·(<^ )

SE(Ṕ)= 4 ·(<^ ).

χi ƒi χ 1 ƒ χ 2 ƒ χn ƒn N

χi ƒi pi Φi χL-χl  i / N = (^) χ χ  i/N