Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


STATISTICA elementi introduttivi, Sbobinature di Statistica

Definizione concetti principali; rappresentazioni grafiche. Calcolare: media aritmetica; moda; mediana; percentili e quartili; box-plot; media geometrica Numeri indici; variabilità (intervallo, disuguaglianze 2 a 2, scarto in valore assoluto) Indicatore di variabilità; concentrazione (indice di Gini e spezzata di Lorenz); connessione; covarianza

Tipologia: Sbobinature

2022/2023

In vendita dal 14/04/2023

S.ara2002
S.ara2002 🇮🇹

4.7

(3)

27 documenti

1 / 51

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA
Fenomeno collettivo: quei fenomeni naturali o sociali la cui conoscenza e misura richiedono
l’osservazione delle diverse unità che fanno parte del collettivo.
Collettivo statistico: si supponga di voler studiare le caratteristiche di un gruppo di studenti -> il
gruppo in esame
Unita’ statistica: unita’ elementare su cui vengono osservati i caratteri oggetto di studio - persona,
animale, oggetto, va al singolare. Se sono tutte per struttura uguali allo statistico non interessa
Carattere: aspetto del fenomeno oggetto di studio, rilevato o misurato sulle unita’ statistiche: eta’,
peso, genere, diploma, voto, sport
Modalita’: e’ l’espressione concreta del carattere nelle unita’ - valore che l’unita’ statistica manifesta.
21 febbraio
MODALITA’:
Come carattere:
gruppo sanguigno (modalità: 0, A, B, AB),
ripartizione geografica (modalità: nord ovest, nord est, centro, sud, isole),
voto universitario (modalità: 18, 19, 27, 28, 30, 30 e lode)
Modalità: differenza da ciò che ci aspettiamo di osservare e quello che si osserva realmente. Le
modalità si dicono disgiunte -> una unità statistica può manifestare il carattere in una e una sola
modalità tra quelle indicate. Modalità difettosi -> tinta degli occhi (nera, marrone, azzurra, verde,
chiara, scura) non disgiunte, patente (A, B,C ma ce ne sono altre) e non esaustivo.
Analisi statistica: univariata, bivariata e multivariata = dipende dal numero di carattere in oggetto di
studio.
Analisi statistica DESCRITTIVA -> descrivere le caratteristiche della popolazione (insieme unità
statistiche e non sono solo le persone); INFERENZIALE -> prendo sottoinsieme della popolazione -
il campione: passare dal particolare al generale. Il campione => non è necessario rilevare tutti per
avere le misure precise di quello che mi interessa.
Analisi statistica descrittiva: sintetizzare i dati raccolti -> strumenti descrittivi grafici e numerici.
Classificazione dei caratteri:
Qualitativi -> non assume valore numerico, mutabile statistica per indicare ciò che può assumere
le varie modalità del carattere:
1. Sconnesso: non esiste un ordinamento degli attributi del carattere
2. Ordinabile: stabilire una relazione d’ordine e specificando che una certa unità precede l’altra:
a. rettilinei: modalità iniziale e una fine
b. ciclici: ordine naturale di successione ma non hanno vere e proprie modalità iniziali e finali
(mese, stagione)
Quantitativi -> variabile: si puo’ fare una media
1. Discreto o enumerabile: valori interi - n. Di componenti la famiglia, di dipendenti di un’azienda
2. Continuo o misurabile: assume tutti i valori di un intervallo, può avere la virgola ma dipende di
cosa parliamo - statura, temperatura, tempo di percorrenza di una distanza
- Con scala a intervalli o non rapporto: lo zero è scelto in modo arbitrario; temperatura
- Con scala di rapporti: origine è lo zero e ha significato assoluto; statura, peso, reddito, età.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33

Anteprima parziale del testo

Scarica STATISTICA elementi introduttivi e più Sbobinature in PDF di Statistica solo su Docsity!

STATISTICA

Fenomeno collettivo: quei fenomeni naturali o sociali la cui conoscenza e misura richiedono l’osservazione delle diverse unità che fanno parte del collettivo. Collettivo statistico: si supponga di voler studiare le caratteristiche di un gruppo di studenti -> il gruppo in esame Unita’ statistica: unita’ elementare su cui vengono osservati i caratteri oggetto di studio - persona, animale, oggetto, va al singolare. Se sono tutte per struttura uguali allo statistico non interessa Carattere: aspetto del fenomeno oggetto di studio, rilevato o misurato sulle unita’ statistiche: eta’, peso, genere, diploma, voto, sport Modalita’: e’ l’espressione concreta del carattere nelle unita’ - valore che l’unita’ statistica manifesta. 21 febbraio

MODALITA’:

Come carattere: ● gruppo sanguigno (modalità: 0, A, B, AB), ● ripartizione geografica (modalità: nord ovest, nord est, centro, sud, isole), ● voto universitario (modalità: 18, 19, 27, 28, 30, 30 e lode) Modalità: differenza da ciò che ci aspettiamo di osservare e quello che si osserva realmente. Le modalità si dicono disgiunte -> una unità statistica può manifestare il carattere in una e una sola modalità tra quelle indicate. Modalità difettosi -> tinta degli occhi (nera, marrone, azzurra, verde, chiara, scura) non disgiunte, patente (A, B,C ma ce ne sono altre) e non esaustivo. Analisi statistica: univariata, bivariata e multivariata = dipende dal numero di carattere in oggetto di studio. Analisi statistica DESCRITTIVA -> descrivere le caratteristiche della popolazione (insieme unità statistiche e non sono solo le persone); INFERENZIALE -> prendo sottoinsieme della popolazione - il campione: passare dal particolare al generale. Il campione => non è necessario rilevare tutti per avere le misure precise di quello che mi interessa. Analisi statistica descrittiva: sintetizzare i dati raccolti -> strumenti descrittivi grafici e numerici.

Classificazione dei caratteri:

Qualitativi -> non assume valore numerico, mutabile statistica per indicare ciò che può assumere le varie modalità del carattere:

  1. Sconnesso: non esiste un ordinamento degli attributi del carattere
  2. Ordinabile: stabilire una relazione d’ordine e specificando che una certa unità precede l’altra: a. rettilinei : modalità iniziale e una fine b. ciclici : ordine naturale di successione ma non hanno vere e proprie modalità iniziali e finali (mese, stagione) ● Quantitativi -> variabile: si puo’ fare una media
  3. Discreto o enumerabile: valori interi - n. Di componenti la famiglia, di dipendenti di un’azienda
  4. Continuo o misurabile: assume tutti i valori di un intervallo, può avere la virgola ma dipende di cosa parliamo - statura, temperatura, tempo di percorrenza di una distanza
  • Con scala a intervalli o non rapporto: lo zero è scelto in modo arbitrario ; temperatura
  • Con scala di rapporti: origine è lo zero e ha significato assoluto; statura, peso, reddito, età.
  • Carattere trasferibile: ha senso immaginate che un’unità statistica possa cedere tutto o parte del carattere posseduto a un’altra unità statistica
  • Carattere non trasferibile: peso, età, statura, titolo di studio Esempi: ● ANNO DI NASCITA: 2002, 2003, 1965, 1910 -> qualitativo ordinabile ● MARCA SCARPE: qualitativo sconnesso ● KM PERCORSI: quantitativo continuo -> unità statistica: studente ● N. STANZE: unità statistica: abitazione, quantitativo discreto - SUPERFICIE: quantitativo continuo - PIANO: qualitativo ordinabili ● BATTITO CARDIACO: quantitativo discreto

Simbologia:

Caratteri qualitativi: prime lettere dell’alfabeto in maiuscolo -> A, B, C Caratteri quantitativi: ultime lettere dell’alfabeto in maiuscolo -> X, Y, Z Con le lettere minuscole corrispondenti: a, b, x, y -> si indicano la loro determinazione. L’insieme degli attributi o degli stati di grandezza di un carattere rilevato su un insieme di n unita’ statistiche (u.s.): A: marca di scarpe; unita’ statistica: acquirente Addas: a1; Mike: a2; Addas: a3; Basics: an

Protocollo elementare:

Protocollo elementare: dati grezzi, distribuzione unitaria semplice -> insieme dei valori assunti dal carattere oggetto di indagine sulle unita’ statistiche del collettivo in esame. Non è costituito dalle unità statistiche ma dai valori che il carattere che stiamo osservando assume nelle varie unità Collettivo in esame: 88 individui iscritti al corso di Statistica; quantitativo discreto -> carattere; n = 88 -> e’ la numerosita’ Carattere osservato: voto conseguito all’esame di statistica La simbologia: il voto lo indico con X, X1, X2, XN

Distribuzioni di frequenze:

Organizzare i dati con le: distribuzioni di frequenze - tabella organizzata in classi (K che deve essere minore o uguale a n ) formate sulla base delle modalità osservate, riorganizzazione del collettivo. La frequenza assoluta di una classe, indica la consistenza numerica di una modalita’ del carattere cioè il numero di volte che tale modalita’ viene osservata nel collettivo.

Carattere quantitativo continuo : estremo sx compreso, estremo dx esclusa |-! La somma di tutte le frequenze assolute è la NUMEROSITA’ di n ->

Modalità con cui dividere il mio collettivo: dipende X= altezza -> quantitativo continuo ● Classi omograde: intervalli uguali ● Classi eterograde: intervalli diversi

Frequenze relative e relativa percentuale:

Per far quadrare le frequenze relative f, per fare in modo che il totale sia pari a 1, modifico la frequenza relativa più grande così commetto il minore errore relativo. FREQUENZE RELATIVE PERCENTUALI che danno come risultato 100; se è solo fi - non si moltiplica per 100 e da come risultato finale 1

27 febbraio

Non crescente: Ni -> parto dal sotto, risponde alla domanda: ALMENO, DA* IN SU.

Ni’: parto dal basso => 4, 14, 19, 25, 36, 42, 52, 58, 68, 73, 80, 85, 88 Non ha senso calcolare le distribuzioni di frequenza cumulate per caratteri: si quantitativi e qualitativi ordinabili, no per quello sconnesso.

RAPPRESENTAZIONI GRAFICHE: ● Diagramma a nastri : qualitativo sconnesso -> va in ordine di frequenza Due grafici sono confrontabili se sovrapponibili e quindi hanno la stessa scala ● Diagramma a barre : sono alte in proporzione alle frequenze, fa da guida la modalità tipo i voti quantitativo discreto ● Grafico a torta : si riferisce alla frequenza -> la prima modalità corrisponde alla prima fetta, in senso orario ● Cartogrammi:Grafici cartesiani e diagrammi lineari : serie storica - dati riferiti al tempo,

Unita’ statistica: animale

Carattere: specie - qualitativo sconnesso

Posso usare il diagramma a torta o a nastri, a barre non ha molto senso, NO quello lineare

● Istogramma :

  • distribuzioni di frequenze relative a carattere QUANTITATIVO CONTINUO
  • barre non distanziate, ogni barra ha un’area proporzionale alla corrispondente

frequenza

  • intervalli di ampiezza diversa - classi eterograde
  • e’ basato sulla nozione della densità di frequenza -> data la distribuzione di frequenza

{Xi-1 - X; ; ni}, si chiama densità di frequenza della i-esima classe la frequenza media

nell'intervallo unitario contenuto in X;-1 - X;, vale a dire il rapporto h; (h sta per height,

altezza) della frequenza di tale classe rispetto l'ampiezza dell'intervallo corrispondente.

La base del rettangolo è l’intervallo della classe

L’altezza, area è hi ovvero Ni: l’intervallo della classe, aree proporzionali alle frequenze.

CARATTERE DISCRETO:

Moltiplicare ciascuna modalita’ per la frequenza => non va bene per il carattere qualitativo.

Le modalità non li posso sommare

Protocollo elementare con le classi

moltiplico per Ni un unico valore che rappresenti la classe = valore centrale della classe

Quando le classi sono aperte:

Tabella

14.180 sono le persone che vivono in famiglie da 2

Indici statistici di posizione:

Medie analitiche: quantitativi

Medie lasche: quantitativi e qualitativi

Media aritmetica:

Media aritmetica

Media aritmetica per protocollo elementare :

Unità statistica : litro di benzina

Carattere : prezzo

Tipo: qualitativo continuo

1 marzo

SBARCHI:

Paesi di provenienza: carattere osservato; modalità nome stati: qualitativo sconnesso

Eventi: barca che arriva -> unità statistica

5,45,65,6= ni

Sbarcati: 55 -> quantità complessiva di carattere

Calcolare la frequenza in percentuale sia su ni che su sbarcati, calcolare il numero medio di

persone che arrivano.

Proprieta’:

MEDIA ARITMETICA: proprietà ->

1. Identità di somma : sia protocollo elementare sia per la distribuzione di frequenze.

2. Nullità della somma algebrica degli scarti : la somma della differenza tra i valori xi e la

loro media aritmetica e’ pari a 0

4. Equivarianza rispetto a trasformazioni lineari:

5. La media e’ compresa tra la più piccola e la più grande modalita’ della distribuzione :

6. Associativita’: più utilizzata

Media tronca:

Non lavoro su tutti i valori, tolgo gli estremi se sono troppo distanti, consente di diminuire

l’effetto di valori estremi sulla media aritmetica.

MODA:

medie lasche, medie di posizione -> è la modalità della distribuzione che si presenta con la

massima frequenza (assoluta, relativa o percentuale) mt , calcolata per qualunque tipo di

carattere

Sensibilita’ per i dati anomali:

-> la media aritmetica risente dei valori anomali soprattutto con numerosita’ piccole; la

mediana e’ piu robusta nei confronti dei dati anomali; per la moda: sarebbero 4 ma possiamo

dire che non c’è.

Distribuzione di frequenze:

per calcolare la mediana

devo fare la cumulata.

Sono dispari = numerosita’

+ 1 : 2 e poi cerco il valore

più grande o uguale al valore

che viene dal calcolo nella

distribuzione di frequenze

cumulate (Ni) non

decrescenti e devo risalire

alla modalita’ a cui si

riferisce -> titolo fino a

licenza media.

Distribuzione di frequenza

carattere qualitativo

ordinabile pari => avrò 2

valori mediani - per i caratteri

quantitativi farei la media

Distribuzione di frequenze relative percentuali => (pi; fi) calcolo le cumulate (Pi; Fi) -> non

si chiede più se la numerosità del collettivo sia pari o dispari => cerco il primo valore uguale o

più grande di 50

Distribuzione di frequenze per un carattere discreto => calcolare la cumulata.

Distribuzione di frequenze di carattere continuo e ho classi, la mediana è la classe

Proprieta’ della mediana:

PERCENTILI E QUARTILI:

Percentili -> dividono la popolazione in 100 parti di uguali numerosità, la mediana è il 50-

esimo percentile

Il 25-esimo, il 50-esimo e il 75-esimo sono detti anche 1 quartile - la mediana è anche il 2

quartile.