Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


statistica statistica statistica statistica statistica, Dispense di Statistica

statistica statistica statistica statistica statistica statistica

Tipologia: Dispense

2017/2018

Caricato il 06/07/2018

Utente sconosciuto
Utente sconosciuto 🇮🇹

3.3

(3)

7 documenti

1 / 10

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Corso di Statistica (canale Q-Z) A.A. 2001/12 Prof.ssa P. Vicard
INTRODUZIONE
STATISTICA (scienza dello stato): insieme dei principi e di metodi per la raccolta,
elaborazione, utilizzazione e interpretazione di informazioni riguardanti fenomeni
collettivi. In termini più generali la statistica ha come scopo la conoscenza
quantitativa dei fenomeni collettivi.
La STATISTICA DESCRITTIVA fornisce gli strumenti per rappresentare,
sintetizzare ed interpretare il modo in cui un fenomeno di interesse si è manifestato
nel collettivo osservato.
La statistica descrittiva non fornisce alcuno strumento per estendere i risultati ad una
popolazione più ampia di quella effettivamente osservata. Per un’analisi di questo tipo
è necessaria la STATISTICA INFERENZIALE che permette con le sue
metodologie basate sul calcolo delle probabilità di estendere (mediante logica
induttiva) all’intera popolazione di riferimento, i risultati e le interpretazioni effettuate
sulla base di una rilevazione parziale.
Generalmente i fenomeni collettivi sono tali perché sono relativi ad una collettività di
casi singoli. Quindi sono fenomeni collettivi quelli che riguardano una popolazione:
natalità, nuzialità, reddito,… Anche la temperatura media registrata in un certo luogo
nel corso di un mese è un fatto collettivo; essa infatti è ottenuta misurando le
temperature (variabili) registrate in quel luogo in tutti giorni del mese.
LA STATISTICA SERVE A UN MANAGER?
La risposta è SI!
PERCHE’?
Vediamo solo alcune motivazioni.
1. Per saper rappresentare e descrivere in modo appropriato le informazioni in
possesso
2. Per identificare problemi e risolverli (analisi della qualità)
3. Come supporto per le decisioni (scelte strategiche)
4. Per sapere come trarre conclusioni riferite a una popolazione
5. Per ottenere previsioni affidabili.
In questo corso ci occuperemo dei metodi che riguardano i punti 1, 2, 3.
I metodi statistici sono usati in molte aree funzionali di un’azienda.
ESEMPIO
Un’indagine sui consumatori indica che una banca dovrebbe migliorare la qualità del
servizio clienti.
Che può fare la banca?
Può controllare il numero di clienti in coda, il tempo che un cliente impiega per fare
una transazione, gli errori che gli impiegati commettono, il costo per gestire richieste
non standard. In questo modo la banca studia il processo di produzione del servizio e
può direttamente capire qual è l’origine del cattivo servizio e decidere dove
intervenire.
In generale non si può pensare che il metodo scientifico (statistico) di analisi di
informazioni disponibili possa rimpiazzare l’analisi critica dei fenomeni. Il metodo
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica statistica statistica statistica statistica statistica e più Dispense in PDF di Statistica solo su Docsity!

INTRODUZIONE

STATISTICA (scienza dello stato): insieme dei principi e di metodi per la raccolta, elaborazione, utilizzazione e interpretazione di informazioni riguardanti fenomeni collettivi. In termini più generali la statistica ha come scopo la conoscenza quantitativa dei fenomeni collettivi. La STATISTICA DESCRITTIVA fornisce gli strumenti per rappresentare, sintetizzare ed interpretare il modo in cui un fenomeno di interesse si è manifestato nel collettivo osservato. La statistica descrittiva non fornisce alcuno strumento per estendere i risultati ad una popolazione più ampia di quella effettivamente osservata. Per un’analisi di questo tipo è necessaria la STATISTICA INFERENZIALE che permette con le sue metodologie basate sul calcolo delle probabilità di estendere (mediante logica induttiva) all’intera popolazione di riferimento, i risultati e le interpretazioni effettuate sulla base di una rilevazione parziale.

Generalmente i fenomeni collettivi sono tali perché sono relativi ad una collettività di casi singoli. Quindi sono fenomeni collettivi quelli che riguardano una popolazione: natalità, nuzialità, reddito,… Anche la temperatura media registrata in un certo luogo nel corso di un mese è un fatto collettivo; essa infatti è ottenuta misurando le temperature (variabili) registrate in quel luogo in tutti giorni del mese.

LA STATISTICA SERVE A UN MANAGER? La risposta è SI!

PERCHE’? Vediamo solo alcune motivazioni.

1. Per saper rappresentare e descrivere in modo appropriato le informazioni in possesso 2. Per identificare problemi e risolverli (analisi della qualità) 3. Come supporto per le decisioni (scelte strategiche) 4. Per sapere come trarre conclusioni riferite a una popolazione 5. Per ottenere previsioni affidabili.

In questo corso ci occuperemo dei metodi che riguardano i punti 1, 2, 3. I metodi statistici sono usati in molte aree funzionali di un’azienda.

ESEMPIO Un’indagine sui consumatori indica che una banca dovrebbe migliorare la qualità del servizio clienti. Che può fare la banca? Può controllare il numero di clienti in coda, il tempo che un cliente impiega per fare una transazione, gli errori che gli impiegati commettono, il costo per gestire richieste non standard. In questo modo la banca studia il processo di produzione del servizio e può direttamente capire qual è l’origine del cattivo servizio e decidere dove intervenire.

In generale non si può pensare che il metodo scientifico (statistico) di analisi di informazioni disponibili possa rimpiazzare l’analisi critica dei fenomeni. Il metodo

statistico, se correttamente usato, può consentire di generare una serie di informazioni quantitative che consentono di analizzare la realtà interna ed esterna all’azienda e di percepire segnali e prendere di conseguenza decisioni per ottenere un rapido miglioramento dei processi produttivi e dei prodotti.

LA STATISTICA È IMPORTANTE ANCHE PER UN ECONOMISTA?

Il metodo statistico è importante anche nell’analisi dei

sistemi economici.

E’ importante nella politica economica perché è con il metodo statistico che si può valutare in anticipo (previsioni) l’impatto di una scelta di politica economica. In questo caso si parla di econometria e di metodi statistici per le previsioni.

Nell’approccio più moderno alla statistica (soprattutto nelle analisi economiche) si dice che la statistica è lo studio della variabilità. Infatti ogni fenomeno si manifesta con un maggiore o minore grado di variabilità. La variabilità è intrinseca ai dati (due unità, cioè ad es. due oggetti o persone, non saranno mai esattamente le stesse sotto ogni aspetto). La comprensione della variabilità è fondamentale per un sistema economico e per un’azienda; infatti è importante conoscere e spiegare la variabilità del reddito propria di un collettivo di individui cercando di identificarne la cause. Altrettanto importante è studiare la variabilità ad es. nel livello di soddisfazione di un gruppo di consumatori. Ad es. ci possono essere due consumatori che rientrano nella stessa fascia di età, di reddito che hanno lo stesso sesso e lo stesso titolo di studio ma esprimo due tipi di giudizio diverso in merito ad un certo bene/ servizio. Ne consegue che comprendere la causa della variabilità e quindi ridurla consente all’azienda di cercare di migliorare la sua offerta.

I DATI??? I dati occorrono; occorrono sempre quando si vuole conoscere il mondo circostante. I dati sono necessari in azienda

  • Per fornire l’input necessario a un sondaggio
  • Per fornire l’input necessario ad una ricerca
  • Per valutare un processo produttivo o la prestazione di un servizio
  • Come supporto alle decisioni. I dati sono necessari per le analisi economiche
  • Per conoscere l’andamento dei grandezze economiche (PIL, produzione, investimenti)
  • Per valutare la bontà e l’efficacia delle politiche adottate
  • Come supporto per la scelta delle politiche.

COME RACCOGLIERLI?

  • Indagini totali (censimento della popolazione, anagrafe cioè nascite, morti, matrimoni, determinazione della produzione totale). In queste indagini si rilevano le informazioni di interesse su tutte le unità della popolazione. Ad es. nel censimento della popolazione (indagine condotta dall’ISTAT ogni 10 anni) si dà il questionario ad ogni famiglia che si trova in Italia con l’intento di conoscere tutti i componenti della famiglia presenti sul territorio italiano in una determinata data..
  • Indagini campionarie

E’ solo in base alla definizione dell’obiettivo di un’indagine che si può predisporre il tipo di rilevazione più adatta, individuare il periodo di tempo in cui eseguire la rilevazione (o a cui riferire la rilevazione), definire la popolazione di riferimento dell’indagine e decidere quali caratteristiche rilevare sulle unità della popolazione di riferimento.

ESEMPIO: supponiamo che l’ospite di un talk show alla radio dica di voler conoscere qual è il ristorante preferito dai cittadini di Roma per andare a mangiare pesce. → Popolazione? Tutte le persone che vivono a Roma quando viene fatta la trasmissione. E’ necessario fare un campione → Come? Proposta: chiedere agli ascoltatori di telefonare e manifestare la loro preferenza. Questo è sicuramente un modo economico per ottenere un campione; ma il campione così ottenuto è rappresentativo??? NO! Il campione infatti non rappresenta tutti i romani perché coloro che ascoltano la trasmissione sono un sottogruppo particolare con gusti comuni in merito alle trasmissioni radiofoniche. Inoltre coloro che hanno la pazienza di fare le telefonate sono certamente persone molto motivate e convinte della loro opinione. → E allora che fare? Ad esempio un’indagine telefonica in cui i numeri telefonici vengono scelti a caso dall’elenco degli abbonati della città di Roma.

I campioni casuali si possono estrarre in diversi modi. In generale per campionamento casuale si intende l’insieme di quelle tecniche di selezione del campione in cui le unità vengono selezionate in base a regole probabilistiche. E’ solo mediante un campione casuale che i risultati ottenuti dall’analisi del campione possono essere estesi all’intera popolazione da cui il campione è stato estratto.

ES.: nell’esempio descritto sopra potrei estrarre un campione prendendo 10 fogliettini e scrivendo su ognuno di essi un numero compreso tra 0 e 9 e poi estraendo successioni di sette e/o otto bigliettini al fine di comporre numeri telefonici di 7 e/o 8 cifre. Altrimenti potrei usare un computer, oppure una tavola dei numeri casuali. Se non costruissi un campione casuale e operassi dicendo agli ascoltatori di chiamare, i risultati ottenuti saranno utilizzati per descrivere le preferenze solamente di coloro che hanno telefonato.

Quello dell’es. sopra è il “campionamento casuale semplice”. In questa procedura i campioni della stessa dimensione estraibili da una popolazione hanno uguale probabilità di essere estratti. Esistono tipi di campionamento più complesso quali: il campionamento stratificato e il campionamento a grappolo.

Il campionamento stratificato può essere effettuato quando si possiedono alcune informazioni a priori sulla popolazione di riferimento. Supponiamo di condurre un’indagine campionaria sulle imprese italiane. Sappiamo da precedenti indagini che la distribuzione nelle regioni italiane delle imprese non è omogenea in quanto a numero di addetti. Se facessimo un campione casuale rischieremmo di selezionare molte imprese da regioni come le Marche (per es.) dove ci sono imprese molto piccole arrivando così a concludere che in Italia ci sono molte piccole imprese. In questo caso è necessario suddividere la popolazione (di imprese) per regione ed estrarre un campione casuale semplice da ogni regione. Quello che si ottiene è un campione casuale stratificato in cui gli strati sono le regioni. Con una procedura di questo tipo sarà possibile costruire stime relative non solo all’intero territorio nazionale ma relative anche alle singole regioni italiane.

Nota : Anche le indagini campionarie sono soggette ad errori (i cosiddetti errori campionari) ma questi possono essere controllati. Per le indagini campionarie è necessaria la completezza della lista da cui estrarre il campione altrimenti si incorre nei cosiddetti errori di copertura (cioè esclusione dalla lista di certi gruppi di soggetti). Ad es. nelle indagini telefoniche va prestata attenzione al fenomeno delle utenze private e a tutti coloro che possiedono solo il telefono cellulare e non hanno abbonamento alla Telecom, cioè a tutti coloro che non campaiono negli elenchi telefonici). Il problema di “non copertura” risulta particolarmente grave quando il motivo della non inclusione nella lista è in qualche modo legato all’oggetto dell’indagine. Come conseguenza si ha una potenziale distorsione dei risultati.

Pertanto la lista è estremamente importante perché rappresenta lo strumento principale per la scelta delle unità statistiche. Una lista dovrebbe essere

  • completa (contenere tutte le unità della popolazione); purtroppo una lista non è quasi mai completa ed in genere occorre integrarla.
  • esatta (le unità devono individuare effettivamente le unità della popolazione)
  • aggiornata (ogni cambiamento deve essere registrato).

METODI DI ACQUISIZIONE DEI DATI

L’intervista (diretta o indiretta) è tra i metodi più usati; essa consiste nel rivolgere una serie domande (somministrazione di un questionario) alle unità della popolazione di interesse. Se si fa un’indagine sulle industrie ad es. risponderà alle domande il rappresentante di ogni singola industria oggetto di rilevazione. Cosa analoga succede per l’indagine sulle famiglie in cui ad es. risponde il capo-famiglia. Per fare le interviste ci sono metodi diretti e indiretti. Se l’intervista è diretta (cioè se il rilevatore contatta direttamente l’intervistato) allora si ha la garanzia che a rispondere sia il rappresentante dell’industria o il capo-famiglia. Se l’intervista è indiretta (spedizione del questionario) allora non si ha garanzia sull’identità di chi risponde e quindi sulla esattezza delle risposte.

I dati possono essere acquisiti ricorrendo a collezioni di dati predisposti da enti e/o società esterne e pronti per essere analizzati. E’ fondamentale conoscere l’autorevolezza e l’affidabilità delle fonti dei dati. Alcune fonti sono:

  • ISTAT. Svolge circa 200 indagini

COMPONENTI BASE DELLA STATISTICA DESCRITTIVA

CARATTERE: informazione di interesse UNITÀ STATISTICA: entità elementare a cui si riferiscono le informazioni di interesse MODALITÀ DEL CARATTERE : modo in cui il carattere si manifesta in una particolare unità statistica COLLETTIVO STATISTICO: l’insieme delle unità statistiche omogenee rispetto a qualche circostanza di interesse.

ESEMPI

1. In un’indagine sul fatturato e sul numero di addetti delle piccole imprese (cioè con numero di addetti ≤ 19) si ha: Popolazione : tutte le imprese con n.addetti ≤ 19 Unità : ogni singola impresa avente al più 19 addetti Carattere1 : fatturato Modalità : ammontare in € del fatturato di una determinata impresa Carattere2 : n. addetti Modalità : numero intero compreso tra 1 e 19 Carattere3 : settore di attività economica Modalità : settore di attività economica in cui opera una determinata impresa. 2. Classifica dei marcatori di SerieA Popolazione : tutti i giocatori di squadre di SerieA Unità : ogni singolo giocatore (Totti, Del Piero, Di Canio, …) Carattere : numero di gol segnati Modalità : numero intero ≥ 0 3. Statistiche sulla classe di Statistica Popolazione : tutti gli studenti del I canale (che non hanno ancora sostenuto l’esame) Unità : ogni singolo studente Carattere : sesso, tipo di diploma, voto alla maturità, età, professione dei genitori, voto al test di accesso Modalità di sesso : Maschio, Femmina Modalità di tipo di diploma : Lic. Cl., Lic. Sc., Ragioneria, Ist. Tec. Comm., … …

CLASSIFICAZIONE DEI CARATTERI

Come abbiamo visto, su ogni unità statistica si rilevano una o più informazioni di interesse ( caratteri ). Il modo in cui un carattere si manifesta in un’unità statistica è detto modalità.

E’ importante che ad ogni unità si possa associare una sola modalità; inoltre le modalità elencate devono rappresentare tutti i possibili “stati” che il carattere assume nel collettivo statistico. Esistono varie tipologie di caratteri. I due grandi raggruppamenti sono: → Caratteri qualitativi → Caratteri quantitativi

CARATTERI QUALITATIVI

 CARATTERI QUALITATIVI SCONNESSI: hanno per modalità denominazioni qualitative tra le quali non esiste (e non è possibile stabilire) un ordinamento (sesso, religione, regione di residenza, luogo di nascita, tipo di fondo di investimento, tipo di utilizzo di un terreno). Ad es. non si può dire che il sesso maschile ha una precedenza su quello femminile. Unico confronto tra le modalità è uguaglianza o diversità delle modalità. In altri termini si dice che un carattere costituisce una scala nominale se per le sue modalità è possibile affermare solo se sono uguali o diverse (cioè se è qualitativo sconnesso).

 CARATTERI QUALITATIVI ORDINATI: hanno per modalità denominazioni qualitative tra le quali esiste un ordinamento naturale (titolo di studio, anno di iscrizione all’università, qualifica funzionale, ceto sociale, grado di soddisfazione, livello di rischio associato ad un titolo azionario). Questo tipo di caratteri costituisce una scala ordinale proprio perché è possibile dare un ordine alle modalità in modo da affermare che una modalità precede un’altra.

Tra i caratteri qualitativi ordinati va individuato un sottogruppo di caratteri ( caratteri ordinati ciclici ) per i quali una qualunque modalità potrebbe essere scelta come prima o come ultima, per i quali cioè la scelta della prima modalità è frutto di una convenzione. Ad es. i giorni della settimana, il mese di nascita.

CARATTERI QUANTITATIVI

Hanno per modalità dei numeri che esprimono una misura o una quantità. Quando si opera con caratteri quantitativi, date due modalità è possibile non solo dire quale delle due viene prima ma anche effettuare una sottrazione o costruire un rapporto tra di esse al fine di confrontare le quantità. Quando è possibile calcolare solo la differenza si parla di scala a intervalli ; quando è possibile anche calcolare il rapporto tra modalità si parla di scala di rapporti.

Quando il carattere è quantitativo continuo allora è proprio necessario effettuare il raggruppamento in classi. Se ad es. si sta rilevando l’altezza di un collettivo di individui, tale carattere assume valori in un continuo ma gli strumenti di misura ci costringono ad una certa approssimazione. Per es. quando rileviamo che una persona è alta 173 cm., in realtà la sua altezza sarà compresa diciamo tra 172,6 e 173,5 e tutti gli individui con altezza in questa classe verranno codificati come alti 173 cm.. Quindi quando i caratteri sono quantitativi continui, raggruppare in classi è un procedimento “naturale” dovuto alla imprecisione propria degli strumenti di misura. Inoltre per non riportare una lista lunghissima (al limite infinita) di possibili valori del carattere (e quindi a scopo di sintesi e per desiderio di estrarre informazioni dai dati) si raggruppano i valori in classi. Quando si hanno caratteri continui bisogna stare attenti a far sì che la proprietà di disgiunzione delle classi sia verificata. Pertanto, considerando la variabile altezza ad esempio si può avere uno dei casi seguenti:

  1. 165 | 170 ( che significa cioè che 165 è incluso nella classe e 170 no) si dice che la classe è chiusa a sinistra e aperta a destra.
  2. 165 | 170 ( che significa cioè che 165 non è incluso nella classe e 170 sì) si dice che la classe è chiusa a destra e aperta a sinistra. In questo modo si vede che le classi non si sovrappongono. In generale supponiamo che nel collettivo che esaminiamo l’altezza assuma valori tra 155 e 185 cm allora un possibile raggruppamento in classi (usando la regola 1.) è 155 | 160 160 | 165 165 | 170 170 | 175 175 | 180 180 || 185 Osservate che l’ultima classe per ovvie ragioni è chiusa sia a destra sia a sinistra.