












Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
principi base della statistica con indici di posizione variabilità e forma
Tipologia: Dispense
1 / 20
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!













La statistica trae sue fonti e principali spinte evolutive da una stretta connessione con l’attività pratica essendo una scienza onnipresente nella ricerca scientifica e nelle analisi sperimentali,apporta un contributo significativo alle vicende quotidiane nel prendere decisioni razionali e coerenti. La parola Statistica deriva dal vocabolo italiano Stato e fa riferimento, nella quasi totalità dei linguaggi europei, alla constatazione per cui le prime informazioni su fenomeni reali sono state raccolte ed organizzate ad opera degli organismi statali che ne sono stati anche i principali utilizzatori.La statistica è una disciplina che studia l’elaborazione dei dati raccolti.La parola Statistica è stata utilizzata per la prima volta dall‟italiano Girolamo Ghislini che, nel 1589, ha definito la Statistica come “descrizione delle qualità che caratterizzano e degli elementi che compongono uno Stato” e, tra il 1666 ed il 1668, ha dato alle stampe il Ristretto della civile, politica, statistica e militare scienza. La Statistica,nell’applicare la sua metodologia ai problemi reali, utilizza alcuni criteri logico- concettuali di riferimento, i cosiddetti paradigmi. Il paradigma statistico di base è quello della sintesi delle informazioni, in quanto di fronte all’analisi di fenomeni complessi si cerca un indicatore riassuntivo, utile per qualche scopo predefinito e si attribuisce a quest‟unica misura il significato di “rappresentanza”. Un secondo paradigma statistico è la scoperta del nuovo, intendendo con ciò la messa in evidenza di fatti, congetture problematiche, connessioni, leggi che non erano note in precedenza o che andavano verificate. Un terzo paradigma è il contenimento dell‟errore, in quanto la connessione tra le informazioni possedute in ingresso, input, e quelle osservate in uscita, output, è alterata da una componente erratica, di natura aleatoria e quindi imprevedibile. Un quarto paradigma essenziale della ricerca statistica, infine, è la dialettica della conoscenza, cioè l‟accettazione dei risultati, la loro critica, la proposta di ipotesi alternative e lo studio di nuovi risultati per proporre, rifiutare e migliorare precedenti acquisizioni.
All’interno della disciplina metodologica,si possono distinguere due diversi correnti:
che possono essere valide e riferibili ad un contesto più ampio rispetto a quello dei dati di quel singolo esperimento.Essa tende a giustificare le osservazioni in termini di modelli teorici esplicativi dei fenomeni. Mentre la statistica descrittiva si occupa di rappresentare l’nformazione contenuta in un dato insieme o campione di dati, la statistica inferenziale utilizza tale informazione per fare delle affermazioni più generali riguardanti i parametri della popolazione da cui il campione è stato estratto. La statistica inferenziale,si occupa di risolvere il cosiddetto problema inverso, ovvero, sulla base delle osservazioni su un campione di unità selezionate con date procedure dalla popolazione, perviene a soluzioni valide entro dati livelli di probabilità e quindi di applicabilità anche per la popolazione stessa.
I casi individuali ,oggetto di osservazione,ovvero i più piccoli elementi su cui è possibile effettuare un’ osservazione,sono dette Unità Statistiche che si dividono in: → Semplici:persone singole,autovetture,lanci di moneta,incidenti stradali; → Composte o aggregati di unità semplici:famiglie,edifici,aziende; → Multipli o complesse formate da 1 o più unità semplici legati tra loro da un vincolo:marito e moglie,padre e figlio,soci di una società.
L’insieme di più unità statistiche,omogenee rispetto ad uno o più aspetti costituisce il collettivo statistico. Esempio popolazione presente su un dato territorio,in un’epoca stabilita è un collettivo statistico in quanto le varie unità hanno le proprietà comune di essere presenti su un territorio alla data indicata e di essere omogenee come specie. Esempio aziende di un dato ramo di attività economica I collettivi possono essere: ➢ Finiti:costituiti da un numero finito di elementi(popolazioni,aziende)tali collettivi sono sempre concreti; ➢ Infiniti:(collettivo dei lanci di una moneta,quello delle prove e degli esperimenti)tali collettivi sono sempre ipotetici.
I collettivi statistici sono alla base dello studio dei fenomeni collettivi che sono fenomeni naturali o sociali la cui conoscenza e misura richiede l’osservazione delle diverse unità che fanno parte del collettivo .La statistica è un insieme di metodi per lo studio dei fenomeni collettivi,caratteristiche che nei collettivi statistici si manifestano in modo variabile in seguito all’influenza di varie circostanze.
o Frequenza relativa:essendo N la somma delle frequenze assolute di ogni unità statistica(la somma delle frequenze relative è pari a 1) F.R=F.A/N o Frequenza percentuale: F%=F.R * o Frequenza cumulata:associa ad ogni valore o classe della variabile,la somma della rispettiva frequenza,con le frequenze dei valori precedenti.In particolare si avrà la frequenza assoluta cumulata,relativa,percentuale; esempio. Le variabili statistiche possono essere: ❖ Continue:che possono essere suddivise a loro volta in: Chiusi a sinistra e a destra: xi|---|xi+1 i=1,2,…,s intervallo che comprende il valore xi e il valore successivo xi+ Aperti a sinistra e a destra: xi---xi+1 intervallo che esclude il valore xi ed il valore successivo xi+ Chiusi a sinistra e aperti a destra: xi|---xi+1 intervallo che comprende il valore xi ed esclude il valore successivo xi+ Aperti a sinistra e chiusi a destra: xi---|xi+1 intervallo che esclude il valore xi e comprende il valore succesivo xi+ ❖ Discrete Vari esempi
Insieme di modalità di un carattere qualitativo e dalle frequenze ad esse associate La mutabile statistica può essere: ▪ Rettilinea :si ha quando le modalità xi ammettono un ordine naturale di successione con una modalità iniziale ed una finale ▪ Ciclica :le modalità xi èresentano un ordine naturale ciclico di successione
− Se i due caratteri sono entrambi qualitativi si parla di mutabile statistica doppia; − Se i due caratteri sono entrambi quantitativi si parla di variabile statistica doppia − Se uno dei due caratteri è quantitativo e l’altro qualitativo si parla di distribuzione mista
Ogni analisi empirica si articola secondo il seguente schema: obiettivi – informazioni – metodi statistici – risultati dove per obiettivo si intende, sia la natura delle informazioni da raccogliere, sia gli strumenti mediante i quali esaminare tali informazioni. La metodologia statistica, dunque, opera mediante stadi successivi: - predefinire obiettivi delimitati ed agevoli da investigare sul piano empirico; - individuare le informazioni necessarie per una puntuale conoscenza del fenomeno, oggetto di studio; - applicare metodi adeguati per il trattamento delle informazioni; - esaminare criticamente i risultati della metodologia statistica per saggiarne la coerenza, la validità e la generalizzabilità. Lo studio di un fenomeno con metodo statistico,ovvero l’indagine statistica si pùo articolare in 4 fasi: Rilevazione:insieme di operazioni con le quali si perviene alla conoscenza dei dati,ossia delle modalità di uno o più caratteri collettivi,la rilevazione è completa(si esaminano tutti gli elementi oggetti di studio)e parziale(ci si limita a studiare un sotto insieme,ovvero un campione dell’insieme di riferimento) Elaborazione:insieme di operazioni attraverso le quali i dati rilevati vengono opportunamente classificati e sintetizzati al fine di ottenere dati più espressivi; Presentazione:esposizione dei dati statistici informa chiara e compatta,con tabelle grafici,medie,indici;
Interpretazione:spiegazione delle risultanze dell’indagine statistica alla luce delle teorie e delle precedenti conoscenze del fenomeno studiato o di altri fenomeni ad esso connessi.
Gli indici statistici consentono di valutare l’ordine di grandezze delle manifestazioni e servono per localizzare la distribuzione ovvero individuare attorno a quale valore del carattere si accentra la distribuzione stessa.Si suddividono in: « Indici statistici di posizione: Media Mediana Moda Quartili « Indici statistici di variabilità: Campo di variazione Varianza Deviazione standard Coefficiente di variazione Scostamento « Indici statistici di forma: Coefficiente di asimmetria Coefficiente di curtosi Un indice di posizione è lo scalare che esprime come si manifesta la proprietà in esame nel campione considerato.Tali indici si possono ricavare effettuando operazioni che coinvolgono:
La media può essere:
La moda Mo di una distribuzione di frequenza X,calcolabile per caratteri qualitativi e quantitativi,rappresenta la modalità caratterizzata dalla massima frequenza o densità di frequenza,ovvero il valore numerico che è maggiormente presente nella serie.La moda può risultare di tipo: ▫ Zeromodale:che non ammette alcun valore modale; ▫ Unimodale:che ammette un solo valore; ▫ Bimodale:che ammette due valori; ▫ Trimodale:che ammette tre valori.
Esempio N=13 3 5 9 3 5 7 3 2 9 3 4 3 6 Mo=3(compare 5 volte) Esempio I caratteri possono:
frequenze,ovvero individuando la frequenza più alto;
classe con maggiore frequenza;se le classi di modalità,hanno ampiezza diversa calcolando,la densità di frequenza
Sono una famiglia di misure che dividono,dopo aver ordinato i dati,una distribuzione di un certo numero di parti uguali.Se si divide la distribuzione in tre parti si parla di terzili (il 1° terzile è quello che lascia alla sinistra un terzo delle osservazioni e alla destra i due rimanenti)se si divide in quattro parti si parla di quartili (il 1°quartile lascia alla sua sinistra il 25% dei casi e a destra il rimanente 75%,il 2°quartile che coincide con la mediana,lascia alla sua sinistra il 50% dei casi e alla sua destra il rimanente 50%,il 3°quartile lascia alla sua sinistra il 75% dei casi e alla sua destra il rimanente 25%)se si divide la distribuzione in dieci o cento parti si parla di decili e percentili o centili. I quantili si possono calcolare per tutte quelle variabili per le quali risulta possibile ordinarne le modalità,ovvero solo per variabili qualitative ordinabili e per variabili quantitative.
I percentili o centili rappresentano un modo per confrontare una misura con i valori normali della popolazione,ovvero rappresenta il livello di misura al di sotto del quale cade una determinata percentuale della distribuzione.Il percentile costituisce l’unità di misura che si utilizza per stabilire come procede la crescita del bambino in peso e altezza.I bambini vengono suddivisi a seconda del peso e statura e poi vengono inseriti in 100 sottogruppi,ciascuno formato da 10 bambini.Ogni sottogruppo rappresenta un centile ad ogni centile l’1% della
II. 2°CASO N è dispari N+ divisibile per 4 III. 3°CASO N può essere sia pari che dispari N,N+1 non sono divisibili per 4 Esercizio
Esercizio Se si effettua un’indagine si ottiene la tabella Esempio
_________________________________oppure_________________________________________ IL COEFFICIENTE DI VARIAZIONE Il coefficiente di variazione CV è una misura relativa di dispersione ed è una grandezza adimensionale particolarmente utile quando si devono confrontare le distribuzioni di due gruppi con medie molto diverse o con dati espressi in scale differenti. SCOSTAMENTO SEMPLICE MEDIO S(Ma) Lo scostamento semplice medio S(Ma) consiste nel calcolare la distanza di tutti i dati dalla media e fare la media aritmetica di tali distanza. Se i dati sono senza frequenze Se i dati sono con frequenze ESEMPIO
Dopo aver analizzato gli indici di posizione e di variabilità di una distribuzione analizziamo alcuni aspetti della forma di una distribuzione della quale si considerano due caratteristiche, precisamente l’asimmetria e la curtosi. Due distribuzioni aventi stessa posizione e variabilità, infatti, possono differire per forma; la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della distribuzione. Una curva di frequenza unimodale e simmetrica che assume la caratteristica forma a campana è nota con il nome di curva normale o gaussiana. ASIMMETRIA L’asimmetria rappresenta lo spostamento del vertice della distribuzione dall’asse centrale: verso sinistra per valori di asimmetria positivi e verso destra per valori di asimmetria negativi. Una distribuzione unimodale è: Rappresenta la più importante distribuzione statistica continua,la cui caratteristica principale è che media,moda e mediana coincidono
CURTOSI La curtosi rappresenta lo sciacciamento della campana della distribuzione:un valore di curtosi negativo indica una distribuzione<<più sciacciata>> verso il basso rispetto alla curva normale (curva platicurtica o iponormale) un valore di curtosi positivo indica una distribuzione <<più appiattita>>rispetto alla curva normale(curva leptocurtica o ipernormale).La curtosi si può calcolare solo per le distribuzioni unimodali simmetriche. L’indice di curtosi di una distribuzione simmetrica,misura lo <