





Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
piccoli riferimenti e riassunti di statistica
Tipologia: Sintesi del corso
1 / 9
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!






LA STATISTICA : (una delle molteplici definizioni) studia in termini quantitativi i fenomeni collettivi. I FENOMENI COLLETTIVI : sono fenomeni che la mente umana non può conoscere con una sola osservazione, ma che invece apprende mediante la sintesi di fenomeni più semplici. LA STATISTICA ci fornisce dei metodi che possono essere utilizzati in qualsiasi materia; es. economia, medicina ecc. Es. statistica in letteratura: attribuire un testo ad un autore anonimo. COSA SI INTENDE IN STATISTICA PER POPOLAZIONE/COLLETTIVO : è un insieme di unità omogenee rispetto ad una qualunque caratteristica: ci deve essere una caratteristica in comune tra queste unità. Dimensione della popolazione N (non sempre N è noto) C i sono POPOLAZIONI :
CON UNA POPOLAZIONE EMPIRICA E FINTA posso fare una RILEVAZIONE TOTALE / CENSIMENTO RILEVAZIONE TOTALE : si osserva la variabile di interesse su tutte le unità della popolazione, ma spesso tale rilevazione risulta spesso inattuabile, per motivi: 1- Economici: costa troppo 2- Temporali: ci vuole troppo tempo 3- L’osservazione può comportare la distruzione dell’unità stessa Quindi posso fare RILEVAZIONE PARZIALE : si osserva la variabile di interesse su un sottoinsieme di unità della popolazione. Sottoinsieme di unità = CAMPIONE (n) RILEVAZIONE PARZIALE= RILEVAZIONE CAMPIONARIA Le indagini parziali effettuate su un campione sono dette: INDAGINI CAMPIONARIE n N ^ FRAZIONE DI CAMPIONAMENTO^ (in caso di popolazione con lista, quando N è nota). STATISTICA DESCRITTIVA : complesso di metodi che comprendono la raccolta, la sintesi e la presentazione dei dati STATISTICA INFERENZIALE: insieme di metodi che consentono di valutare una caratteristica della popolazione sulla base di un campione PROBABILITA’ : lega insieme la statistica descrittiva e la statistica inferenziale VARIABILE (O CARATTERE) X è quel particolare aspetto delle unità statistiche che costituisce l’oggetto dell’indagine COME SI DIVIDONO LE VARIABILI
K modalità o valori distinti nj numero di volte che si manifesta quella determinazione: si chiama FREQUENZA ASSOLUTA : rappresenta il numero di unità statistiche su cui la variabile X ha assunto valore o modalità. c j (j = 1, 2, …, k). Ovviamente la somma di tutte le frequenze assolute coincide con il numero delle unità esaminate, cioè vale la seguente uguaglianza k
DISTRIBUZIONE DI FEQUENZA (DISTRIBUZIONE DI SINTESI) : nella prima tabella contiene le k modalità distinte (o valori), nelle seguenti tabelle contiene le varie frequenze:
la distribuzione di frequenza viene fatta quando le variabili X sono è di tipo qualitativo o quantitativo discreto. Quando invece la variabile di interesse X è quantitativa continua , i valori distinti risultano essere troppi, così si crea una DISTINZIONE PER CLASSI. X1 ≤ …. ≤ Xn Campo di variazione [ X1, X(n) ] l’intervallo della retta reale: tutte le mie osservazioni sono contenute all’interno dell’intervallo. Anziché prendere valori distinti faccio: K classi contigue (C0, C 1 ], (C 1 , C 2 ],….,(CK-1, Ck] Classe C0 – C 1 notazione corretta C 0 C 1 LA DISTRIBUZIONE PER CLASSI : comporta una perdita di informazione e le informazioni sono meno precise.
sono indici che sintetizzano in un valore o modalità l’insieme dei dati, a seconda che la variabile considerata sia qualitativa o quantitativa. MEDIE 1- Di posizione : quando non utilizzo operazioni algebriche (variabili qualitative) 2- Analitiche : sono ottenute mediante operazioni algebriche (variabili quantitative) la media di una variabile qualitativa dovrà necessariamente coincidere con una delle modalità assunte dalla variabile, mentre nel caso di una variabile quantitativa la media sarà sempre interna al suo campo di variazione. MODA: modalità o valore che si presenta con la massima frequenza
ovvero Mx è la determinazione della variabile a cui è associata la frequenza massima Se la distribuzione è espressa mediante le frequenze relative, anziché mediante le frequenze assolute, la moda coincide ovviamente con la determinazione della X per
Nell’analisi statistica dei dati relativi a una variabile X è importante conoscere il numero di unità che manifestano una particolare determinazione della variabile per ciascuna delle possibili determinazioni distinte. In genere è invece del tutto irrilevante sapere su quali unità è stata rilevata una specifica determinazione.
Il simbolo np rappresenta quindi la parte intera superiore di np per cui np np < np 1. Sono frequentemente utilizzati i quantili x0.25, x0.5 e x0.75 che, per la loro importanza nella descrizione delle caratteristiche della variabile X, hanno un nome particolare e vengono detti quartili.
almeno la metà delle unità presenta un valore minore o uguale a x0.5 e almeno la metà delle unità presenta un valore maggiore o uguale a x0.5. Altri quantili di uso frequente sono i nove decili x0.1, x0.2, ..., x0.9 e i novantanove centili x0.01, x0.02, ..., x0.99. In questi casi la mediana corrisponde al quinto decile o al cinquantesimo centile. In una distribuzione di frequenza il quantile di ordine p della variabile quantitativa X corrisponde al valore cj a cui è associata la prima frequenza assoluta cumulata Nj maggiore o uguale a np. Invece, nella distribuzione per classi: ci limitiamo solo a trovare la classe mediana classe mediana : classe al cui interno è contenuta la mediana. LA MEDIA (per la variabile quantitativa) LA MEDIA: La media aritmetica (o semplicemente media) è una media di tipo analitico, in quanto la sua determinazione richiede operazioni di tipo algebrico sui valori assunti dalla variabile, per cui può essere calcolata esclusivamente per variabili di tipo quantitativo (sia discrete, sia continue). Date n osservazioni di una variabile quantitativa X, la media 𝑥̅ è uguale alla somma di tutti i valori divisa per n.
Utilizzando l’operatore sommatoria, la formula di calcolo della media risulta x ̅ =∑ j = l n Xj n MEDIA: se ho una distribuzione per classi devo calcolare il valore centrale è solo un’approssimazione della media, ovvero non posso trovare in modo reciso la media. LA MEDIA ARITMETICA PONDERATA: una media dove ogni singolo valore contribuisce alla determinazione dell’ammontare complessivo in maniera proporzionale a un qualche ‘’peso’’ associato al valore stesso Un esempio tipico di media ponderata si presenta quando si vuole calcolare il voto medio ottenuto negli esami di profitto di un corso universitario quando ai diversi esami è attribuito un numero di crediti (CFU) variabile. In questo caso la media dei voti deve tenere conto di questa informazione che “pesa” l’importanza di ciascuno degli esami superati. **PROPRIETA’ DELLA MEDIA ARITMETICA
- Campo di variazione: [X(1), X(n)] X(1) ≤ 𝑥̅ ≤ X(n) 2) SECONDA PROPRIETA’: l’ammontare di una variabile quantitative X rilevata su n unità corrisponde a n volte il valore della media, ossia ∑ j = l n Xj = n x ̅ Una conseguenza immediata della precedente relazione è che la somma degli scarti della media è zero (0), ovvero (^) ∑ j = l n ( xi − x ̅ )= 0 3) TERZA PROPRIETA’: La somma dei quadrati degli scarti delle osservazioni dalla media è un minimo.