
























Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
PRIMA PARTE INTERMEDIA ESAME STATISTICA--SLIDE PROF.
Tipologia: Prove d'esame
1 / 32
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!

























In offerta
Le pagine che seguono sono rivolte agli studenti che frequentano le lezioni di Statistica, presso la Facoltà di Economia di Sassari. Nate come appunti per lo svolgimento delle lezioni, sono mes- se a disposizione degli studenti frequentanti per aiutarli nella comprensione degli argomenti trattati durante il corso e per affrontare lo studio del libro di testo BORRA SBORRA SBORRA SBORRA S.,.,.,., DDDDIIII CIACIACIACCIACCCCIO A.,CIO A.,CIO A.,CIO A.,
stituisce lo strumento fondamentale per la preparazione dell’esame. Gli studenti che riscontrassero imprecisioni o errori sono pregati di segnalarli alla docente all’indirizzo di posta elettronica: [email protected]
IntroduzioneIntroduzioneIntroduzioneIntroduzione Per affrontare lo studio della statistica è necessario illustrare brevemente la terminolo- gia statistica di base, per poi passare a considerare le principali metodologie per la ri- levazione e l’acquisizione dei dati. Ma prima di tutto dobbiamo rispondere alla doman-
La parola statistica deriva dal termine stato, perché inizialmente essa si occupava delle cose attinenti alla vita dello stato, cioè della popolazione e veniva vista come una parte della politica economica chiamata aritmetica politica. La Statistica ha avuto inizio come “attività pratica”, volta cioè volta alla soluzione di problemi pratici della vita sociale. In un secondo tempo, accanto al lavoro pratico si è sviluppato quello di teorizzazione, che ha dato origine alla fase metodologica. L’interesse iniziale era, infatti, la misura- zione degli elementi quantitativi di ricchezza e potenza degli stati europei: economici, demografici, fiscali, geografici, militari. Fin da quando si sono formate le prime società umane, si è sentito il bisogno di enumerare, ad esempio gli uomini atti alle armi, i capi di bestiame, ecc. Ma al di là dell’etimologia della parola e dell’origine più antica della statistica, vediamo di darne una definizione che corrisponda al significato odierno di statistica. La statistica è quella disciplina che analizza in termini quantitativi i fenomeni collettfenomeni collettfenomeni collettfenomeni collettiiiivivivivi, ossia quei fenomeni il cui studio richiede l’osservazione di un insieme di manifestazio- ni individuali, ovvero l’acquisizione di un complesso di osservazioni sulle singole unità (dati statisticidati statisticidati statisticidati statistici) di un determinato insieme chiamato collettivo statistico. Un fenomeno collettivo non si presta ad essere percepito, se non in modo approssima- to, con un’unica osservazione. L’insieme di studenti nell’aula universitaria. Non siamo in grado di dire quanti sono gli studenti osservandoli. L’operazione che si deve fare è
In base a tale operazione si perviene alla conoscenza del numero delle persone che co- stituiscono il gruppo. La mente umana non sa sintetizzare numericamente i risultati di un elevato numero di osservazioni, di fatti che essa percepisce singolarmente.
te in Italia, il reddito di un insieme di individui, il peso di un gruppo di oggetti o di persone, ecc.
La statistica mira: alla rappresentazione sintetica dei fenomeni collettivirappresentazione sintetica dei fenomeni collettivirappresentazione sintetica dei fenomeni collettivirappresentazione sintetica dei fenomeni collettivi: alla scoperta delle eventuali regolarità ed uniformitàscoperta delle eventuali regolarità ed uniformitàscoperta delle eventuali regolarità ed uniformitàscoperta delle eventuali regolarità ed uniformità che caratterizzano tali fe- nomeni, malgrado la diversità degli elementi che li compongono; alla identificazione delle loro leggiidentificazione delle loro leggiidentificazione delle loro leggiidentificazione delle loro leggi interneinterneinterneinterne e dei legami e relazionie dei legami e relazionie dei legami e relazionie dei legami e relazioni che tra di essi intercorrono.
Oltre al carattere “Grado di istruzione”, altri esempi di carattere qualitativo sono, in- vece. il sesso, il gruppo sanguigno, la professione, lo stato civile, la categoria alber- ghiera, ecc.
cm.
Le informazioni contenute in queste tabelle costituiscono la cosiddetta distribuzidistribuzidistribuzidistribuzio-o-o-o- ne di frne di frne di frne di freeeequenzaquenzaquenzaquenza della variabile esaminata.
Tabella: distribuzione della popolazione italiana residente, in età da 6 anni in poi,Tabella: distribuzione della popolazione italiana residente, in età da 6 anni in poi,Tabella: distribuzione della popolazione italiana residente, in età da 6 anni in poi,Tabella: distribuzione della popolazione italiana residente, in età da 6 anni in poi, per grado di istruzione (fonte: Annuario ISTAT 1991)per grado di istruzione (fonte: Annuario ISTAT 1991)per grado di istruzione (fonte: Annuario ISTAT 1991)per grado di istruzione (fonte: Annuario ISTAT 1991)
Grado di istruzGrado di istruzGrado di istruzGrado di istruzioneioneioneione Numero di individuiNumero di individuiNumero di individuiNumero di individui
Laurea 1.477.
Diploma 6.018.
Licenza media inferiore 12.480.
Licenza elementare 21.277.
Alfabeti privi di titolo 9.547.
Analfabeti 1.608.
Totale 52.410.
Sono necessarie ulteriori distinzioni e classificazioni. Un carattere qualitativo viene distinto in: sconnessosconnessosconnessosconnesso (o con scala nominalecon scala nominalecon scala nominalecon scala nominale), se date due sue modalità è possibile affermare se esse sono uguali o diverse. Esempi: la religione, la professione, la nazionalità, il sesso, ecc. ordinatoordinatoordinatoordinato (o con scalcon scalcon scala ordinalecon scala ordinalea ordinalea ordinale),), se date due sue modalità è possibile solo dare un),), ordine, specificando che una precede l’altra. Pur non facendo riferimento a valori numerici, i caratteri ordinati assumono modalità logicamente sequenziali, crescenti o decrescenti. Non si possono fare operazioni aritmetiche sulle modalità del carat- tere, ma si può stabilire una relazione di ordine. Esempi: caratteri che esprimono il
Se un carattere è sconnesso, l’ordinamento non può che essere arbitrario, in quanto non esiste una successione naturale delle modalità stesse. A loro volta i caratteri quantitativi (variabili) si suddividono in discrete e continue:
Distribuzione di un carattereDistribuzione di un carattereDistribuzione di un carattereDistribuzione di un carattere
Elencare i dati rilevati in una rilevazione statistica non ha senso, è utile invece rappre- sentare i dati in forma organizzata. Vediamo quali sono i tipi di rappresentazione che possiamo adottare: Distribuzione di frequenzaDistribuzione di frequenzaDistribuzione di frequenzaDistribuzione di frequenza: indicano come le unità della popolazione si distribui- scono rispetto alle modalità del carattere in esame. Serie storicheSerie storicheSerie storicheSerie storiche: esprimono la dinamica di un certo fenomeno nel tempo. Serie territoriali o spazialiSerie territoriali o spazialiSerie territoriali o spazialiSerie territoriali o spaziali: esprimono la distribuzione del fenomeno in rapporto al territorio. Ci soffermeremo qui essenzialmente a considerare le distribuzioni di frequenza. Partiamo, come sempre, da un esempio. Una distribuzione unitaria sUna distribuzione unitaria sUna distribuzione unitaria sUna distribuzione unitaria sempliceempliceempliceemplice di un carattere è l’elenco delle modalità osservate unità, per unità nel collettivo esaminato. Si definisce distribuzione unitaria multipladistribuzione unitaria multipladistribuzione unitaria multipladistribuzione unitaria multipla l’elenco che fa riferimento a più caratteri. Supponiamo di avere esaminato 85 studenti frequentanti il corso di Statistica. in fun- zione del sesso, dell’età, del comune di residenza, dell’anno di corso frequentato, del corso di laurea, della scuola superiore frequentata, del voto di diploma e del numero di esami superati e di avere inserito i dati in una tabella, della quale riportiamo l’intestazione e la prima riga. Unità Sesso Età Comune Res
Anno di corso
Corso di Laurea
Scuola Freq
Voto di- ploma
Numero esami superati 1 M 19 Sassari I Economia Scientifico 76 2 Ogni riga riporta le modalità dei caratteri osservati in corrispondenza di ogni unità, mentre ciascuna colonna corrisponde alla distribuzione unitaria semplice di un carat- tere. Possiamo costruire, ad esempio, la distribuzione unitaria del carattere sesso nel collet- tivo in esame. Si riportano solo alcune righe della distribuzione.
Esempio: distribuzione unitaria per il carattere sessoEsempio: distribuzione unitaria per il carattere sessoEsempio: distribuzione unitaria per il carattere sessoEsempio: distribuzione unitaria per il carattere sesso Codice Sesso 1 M 2 F 3 M
La distribuzione unitaria descrive fedelmente la situazione osservata, ma non permette di cogliere sinteticamente le caratteristiche del fenomeno. Per esempio con la distribu-
zione precedente non sappiamo se sono stati esaminati più maschi o femmine; analo- gamente se costruiamo la distribuzione unitaria secondo il carattere scuola superiore frequentata non sappiamo quanti sono gli studenti che hanno frequentato il liceo scientifico, ecc. Per rispondere a queste domande costruiamo delle distribuzioni di frequenza Una volta completata la raccolta dei dati, si passa alla classificazione delle unità stati- stiche, cioè alla loro suddivisione in gruppi costituiti secondo criteri specifici. Se la classificazioneclassificazioneclassificazioneclassificazione è stata effettuata prendendo in considerazione un solo carattereun solo carattereun solo carattereun solo carattere, si co- stituiscono tanti gruppi quante sono le modalità del carattere inserendo in uno stessotanti gruppi quante sono le modalità del carattere inserendo in uno stessotanti gruppi quante sono le modalità del carattere inserendo in uno stessotanti gruppi quante sono le modalità del carattere inserendo in uno stesso gruppo le unità che presegruppo le unità che presegruppo le unità che presegruppo le unità che presentino la stessa modalitàntino la stessa modalitàntino la stessa modalitàntino la stessa modalità. Se la classificazioneSe la classificazioneSe la classificazioneSe la classificazione è stata invece effettuata, invece, prendendo in considerazione duedueduedue caratteri congiuntamentecaratteri congiuntamentecaratteri congiuntamentecaratteri congiuntamente, si costituisce un numero di gruppi pari al prodotto dellenumero di gruppi pari al prodotto dellenumero di gruppi pari al prodotto dellenumero di gruppi pari al prodotto delle modalità del primo carattere per il numero delle modalimodalità del primo carattere per il numero delle modalimodalità del primo carattere per il numero delle modalimodalità del primo carattere per il numero delle modalità del secondotà del secondotà del secondotà del secondo, inserendo in uno stesso gruppo le unità che presentino una medesima modalità del primo carattere associata ad una stessa modalità del secondo. L’effetto dell’operazione di determinazione delle modalità con le quali ognuno dei due caratteri si presenta in ciascuna unità del collettivo è la distribuzione del collettivo se-
si indica come si distribuiscono le modalità dei caratteri nelle unità del collettivo.
Il risultato della suddivisione in classi di una popolazione secondo uno o più caratteri è un insieme di sottopopolazioni. Il numero delle unità portatrici di una data modalità o anche il numero di volte con le quali detta modalità si presenta è detto frequenza afrequenza afrequenza afrequenza as-s-s-s- ssssoooolutlutlutalutaaa. L’attributo assoluta è dovuto alla necessità che si avrà in seguito di introdurre anche la fffrequenza relativfrequenza relativrequenza relativrequenza relativaaaa o la frequenza percentualefrequenza percentualefrequenza percentualefrequenza percentuale. Esempio: classificazione del complesso delle famiglie che abitano un caseggiato popo- lare per numero di componenti. Ammettiamo che le famiglie più numerose siano quel- le costituite da 5 componenti. Distribuzione che riporta per ogni modalità la corri- spondente frequenza.
Sesso Frequenze assolute
Frequenze relative
Frequenze percentuali M 50 0,59 59 F 35 0,41 41 Totale 85 1 100
La distribuzione doppia riporta, per modalità congiunte (scuola frequentata e sesso)), il numero degli studenti a frequenza corrispondente
Esempio di tabellaEsempio di tabellaEsempio di tabellaEsempio di tabella. ordine di misurazione (i)
quoziente d’intelligenza simbolo
1 104 x 1 2 100 x 2 3 95 x 3 4 117 x 4 5 87 x 5 6 99 x 6 7 113 x 7 8 123 x 8
Si potrà quindi scrivere: x = (104, 100, 95, 117, 87, 99, 113, 123)
o più genericamente avendo un numero nnnn di osservazioni
x= (x 1 , x 2 ,......... xi,....... xn);
questo modo di scrivere rappresenta quello che in matematica è chiamato vettorevettorevettorevettore,, ov-,, vero un successione di valori riferiti ad una data caratteristica X.
Talvolta è necessario denotare un simbolo con più di un deponente quando ad esem- pio abbiamo ripetute prove di esame su uno stesso argomento, come nella Tabella a doppia entrata della pagina seguente relativa a 3 alunni che hanno svolto 5 test in in- glese. Tabella a doppia entrata :Tabella a doppia entrata :Tabella a doppia entrata :Tabella a doppia entrata : Test Alunni P Q R S T 1 7 4 9 8 7 2 8 3 10 7 9 3 6 5 8 8 6 Simbologia della Tabella precedenteSimbologia della Tabella precedenteSimbologia della Tabella precedenteSimbologia della Tabella precedente n° d’ordine dei test (j) n° d’ordine alun- ni (i) (^1 2 3 4 )
1 x 11 x 12 x 13 x 14 x 15
2 x 21 x 22 x 23 x 24 x 25
3 x 31 x 32 x 33 x 34 x 35
Generalizzazione della TabellaGeneralizzazione della TabellaGeneralizzazione della TabellaGeneralizzazione della Tabella
1 2 ....j..... .......... m 1 x 11 x 12 ... x1j ......... x1m 2 x 21 x 22 ... x2j ......... x2m . i
. xi1 xi
.
... xxxxijijijij . .
......... xim
n xn1 xn2 ... xnj ......... xnm
In questo modo xxxxijijijij rappresenta la generica misurazione dell’alunno iiii nella prova j.j.j.j.
In genere il numero massimo per i è indicato dalla lettera n (i=1…n)n (i=1…n)n (i=1…n)n (i=1…n) e il massimo per j e dato da m (j=1…m).m (j=1…m).m (j=1…m).m (j=1…m). Questo tipo di rappresentazione fa riferimento al concetto di matricematricematricematrice a due dimensioni.
Frequenze assolute, percentuali e relativeFrequenze assolute, percentuali e relativeFrequenze assolute, percentuali e relativeFrequenze assolute, percentuali e relative In corrispondenza delle varie modalità o intensità della variabile sono stati riportati i valori ni ovvero le frequenze o frequenze assolfrequenze assolfrequenze assolfrequenze assoluteuteuteute per distinguerle da frequenze di al- tro tipo che sono ricavate dalle precedenti e che costituiscono la prima e più usuale e- laborazione dei dati. Quelle di uso più comune sono le cosiddette frequenze percefrequenze percefrequenze percen-frequenze percen-n-n- tualitualitualituali che corrispondono, com’è noto, ai rapporti tra le frequenze assolute ed il numero totale delle unità esaminate moltiplicate per cento, cosicché la percentuale corrispon- dente ad ogni ni è:
nnnniiii/n * 100/n * 100/n * 100/n * 100 È ovvio che la somma delle frequenze percentuali è uguale a 100: Σi (ni/n * 100) = 100/n * Σini = 100/n * n = 100 Le frequenze percentuali risultano utili per evidenziare la composizione della collet- tività in relazione alle diverse determinazioni della variabile senza tenere conto della numerosità complessiva e vengono utilizzate soprattutto quando si vogliono confron- tare le strutture distributive di uno stesso carattere per collettività con un diverso nu- mero di componenti. Informazioni identiche a quelle fornite dalle frequenze percen- tuali possono essere espresse anche mediante le cosiddette frequenze rfrequenze rfrequenze rfrequenze relativeelativeelativeelative:
ffffiiii = ni/n= ni/n= ni/n= ni/n
Ovviamente possiamo formare delle classi di modalità, ogniqualvolta siamo in pre- senza di caratteri contraddistinti da un elevato numero di modalità, ovvero anche nel caso di caratteri nominali, quali il Settore di attività, oppure di caratteri quantitativi di- screti (il numero di automobili che attraversano un incrocio).
In tutti questi casi può essere utile accorpare le modalità. Vediamo, in concreto, come si formano le classi per caratteri quantitativi e in particolar modo nel caso di caratteri continui per cui la suddivisione in classi si rivela una scelta obbligata. Se il carattere è quantitativo si definisce suddivisionesuddivisionesuddivisionesuddivisione inininin classiclassiclassiclassi del carattere l’operazione che consiste nel suddividere l’insieme dei possibili valori in intervalli tra loro disgiunti. Si costruiscono delle successioni di intervalli in modo che ogni unità possa essere attribuita a uno ed un solo intervallo. Come possono essere le classi? Intervalli contenenti entrambi gli estremi Intervalli contenenti un solo estremo
Che cos’è l’ampiezza di classeampiezza di classeampiezza di classeampiezza di classe?
É la lunghezza dell’intervallo che definislunghezza dell’intervallo che definislunghezza dell’intervallo che definislunghezza dell’intervallo che definisce la classece la classece la classece la classe, se l’intervallo include un solo estremo è b-a; se l’intervallo include entrambi, l’ampiezza è b-a+1.
È stato rilevato il carattere “peso” (Kg) su 320 persone; dato l’alto numero di osserva- zioni, il carattere viene presentato nelle seguenti classi:
Esempio: Si confrontino le frequenze della seguente distribuzione per età:Si confrontino le frequenze della seguente distribuzione per età:Si confrontino le frequenze della seguente distribuzione per età:Si confrontino le frequenze della seguente distribuzione per età:
EtàEtàEtàEtà %%%%
0 -|10 10
10-|20 10
20-|40 20
40-|60 30
60-|100 30
Tot. 100
Le frequenze di classi di ampiezze diverse si possono confrontare?
Direttamente no, solo dopo aver eliminato l’effetto della diversa ampiezza.
Come si elimina l’effetto della diversa ampiezza?
Si divide la frequenza della classe per l’ampiezza della classe, in questo modo si calcola la frequenza per unità di misura della classe cioè la densità di frequenzadensità di frequenzadensità di frequenzadensità di frequenza.
É possibile confrontare solo le frequenze relative a classi omogenee, quindi si calcola- no le densità di frequenza:
EtàEtàEtàEtà %%%% ampiezzaampiezzaampiezzaampiezza densitàdensitàdensitàdensità
0 -|10 10 10 1.
10-|20 10 10 1.
20-|40 20 20 1.
40-|60 30 20 1.
60-|100 30 40 0.
L’interpretazione è la seguente: la classe con maggiore densità è la classe (40-60], con densità pari a 1.5 punti percentuali per anno.
É possibile risalire dalle densità alle frequenze? Sì, basta moltiplicare le densità per l’ampiezza delle classi.
Si nota facilmente che non è consigliabile seguire questa procedura (cioè elencare una ad una tutte le unità del collettivo studiato) quando la popolazione è molto numerosa; oltre all’eccessiva lunghezza delle matrici dei dati ci si troverebbe quasi sicuramente a dover indicare ripetutamente le modalità dei caratteri che si presentano più volte. Per ovviare a questo inconveniente e sintetizzare in modo adeguato le informazioni raccolte si ricorre alle distribuzioni di frequenza: in esse si tiene conto di quante volte le modalità dei caratteri studiati si sono presentate nel collettivo osservato.
Invece la distribuzione di frequenza ha tante righe quante sono le diverse modalità del carattere (nell’esempio sono 5). Naturalmente, essendo N il totale del collettivo e k le modalità che il carattere assume, si deve avere:
Nell’esempio si ha infatti:
Esempio 2Esempio 2Esempio 2Esempio 2 Il carattere “primo esame sostenuto all’università” è un carattere qualitativo sconnesso; rilevato su 300 studenti della Facoltà di Economia, ha dato i seguenti risultati:
Non è possibile stabilire un univoco ordinamento delle modalità, perché non c’è un criterio che faccia preferire una modalità alle altre: pertanto la prima modalità della ta- bella può essere indifferentemente l’esame di Statistica, oppure quello di Matematica, oppure quello di Economia Aziendale, oppure ancora quello di Diritto Privato. Possiamo costruire anche la distribuzione per frequenze relative corrispondente.
Interpretazione: il 16% degli individui facenti parte del collettivo composto da 300 per- sone ha conseguito il diploma classico e la laurea in giurisprudenza, l’8% il diploma scientifico e la laurea in giurisprudenza ecc.
Rappresentazioni graficheRappresentazioni grafiche^ Rappresentazioni graficheRappresentazioni grafiche
Obiettivo delle rappresentazioni grafiche è dare evidenza visiva alla natura delle distri- buzioni, fornendo indicazioni non immediatamente ricavabili dalle tabelle; in questo modo è possibile cogliere con maggiore immediatezza l’andamento delle distribuzioni.
Si possono predisporre numerosi tipi di grafici, utilizzando semplici disegni oppure ri- ferimenti cartesiani; fra le rappresentazioni grafiche più importanti vi sono:
DiagrammiDiagrammiDiagrammiDiagrammi arealiarealiarealiareali Comunemente definiti come grafici “a torta”, e sono molto utili per rappresentare strutture in termini assoluti o percentuali. Sono costituiti da un cerchio (la cui area e- sprime la frequenza o l’intensità totale del carattere, cioè la “torta”) che viene diviso in tanti settori circolari (le “fette”) quante sono le modalità del carattere. Per rispettare le relazioni fra le modalità, gli angoli al centro dei settori circolari sono proporzionali alle frequenze. È possibile rappresentare con diagrammi a torta tutti i caratteri, sia qualitativi che quantitativi.
Esempio 1Esempio 1Esempio 1Esempio 1 Rappresentare tramite diagramma a torta la seguente distribuzione: