Statistica aziendale

Qualità informazione statistica: Rilevanza(risponda alle mie domande), Accuratezza(no errori),

Tempestività, Coerenza(integrazione diverse fonti), Confrontabilità, Accessibilità(comprensione).

FASI INDAGINE CAMPIONARIA:1.FORMULAZIONE OBIETTIVI: si decidono le informazioni

prioritarie e complementari 2.INDIVIDUAZIONE UNIVERSO: popolazione obiettivo 3.SCELTA

DELLA TECNICA DI CAMPIONAMENTO: metodi probabilistici o non, in base a costi e attendibilità

4.MODALITÀ’ DI RACCOLTA DATI: questionario (postale, telefonico, diretto..)

5.PROGETTAZIONE QUESTIONARIO 6. RILEVAZIONE DATI: determinare il periodo più adatto

di raccolta dati 7.CODIFICA E ARCHIVIAZIONE DATI 8.ANALISI DATI: produzione stime

9.RAPPORTO FINALE

CAMP PROBABILISTICO= unità scelte in maniera casuale, e hanno tutte probabilità nota e non

nulla di essere estratte. CAMP non PROBABILISTICO= unità scelte arbitrariamente non è quindi

possibile fare inferenza. Le unità non hanno probabilità nota. Risorse economiche meno elevate,

durata più breve e l’errore campionario non è valutabile.

CARATTERISTICHE PIANO DI CAMPIONAMENTO PROBABILISTICO:

-è una funzione che associa ad ogni possibile campione estraibile una probabilità positiva.

-ogni unità della pop ha una probabilità positiva e nota di far parte del campione (probabilità di

inclusione)

STIMATORE= Lo scopo di un’indagine campionaria è di valutare un parametro della popolazione

sulla base dell’osservazione sul campione. Si definisce stimatore del parametro θ una funzione

che per ogni campione associa un numero reale detto stima di θ. Lo stimatore è CORRETTO

quando il suo valore atteso è pari al valore del parametro della popolazione. E(θ^)= θ La

VARIANZA rappresenta la precisione dello stimatore.

Errore standard della stima L’errore standard della stima definisce la variabilità delle stime e

permette di calcolare l’intervallo di confidenza della stima. L’errore standard è la radice quadrata

della varianza dell’errore. La varianza dell’errore e l’errore standard possono essere stimati per

qualsiasi parametro stimato. Nel caso della media, se estraiamo tutti i possibili campioni da una

popolazione, le stime di HT della media della popolazione che si ottengono da ogni campione, se

l’estrazione del campione è casuale, si distribuiranno secondo una distribuzione normale. La

media di tutte queste possibili medie è uguale alla media della popolazione (il valore vero). La

varianza di tutte queste possibili medie è la varianza dell’errore della media, la deviazione

standard di tutte queste possibili medie è l’errore standard. Dato però che dalla popolazione

normalmente estraiamo solo un campione tra tutti i possibili potremo calcolare solo la stima

dell’errore standard.

CCS caratteristiche: -ogni campione ha stessa probabilità di essere estratto P(c) costante. P(c)=

1/Cn,N

-ogni n della pop ha stessa probabilità di inclusione nel campione (tecnica autoponderante) ℼ

costante. = n/ N = f (frazione di campionamento). Perchè = n/ N? Perchè se in 1 estrazione la ℼ ℼ

probabilità di inclusione è 1/N allora in n estrazioni è nx1/N.

Anteprima parziale del testo

Scarica Statistica Aziendale: Qualità dell'Informazione e Tecniche di Campionamento e più Appunti in PDF di Statistica solo su Docsity!

Statistica aziendale Qualità informazione statistica: Rilevanza(risponda alle mie domande), Accuratezza(no errori), Tempestività, Coerenza(integrazione diverse fonti), Confrontabilità, Accessibilità(comprensione). FASI INDAGINE CAMPIONARIA: 1.FORMULAZIONE OBIETTIVI: si decidono le informazioni prioritarie e complementari 2.INDIVIDUAZIONE UNIVERSO: popolazione obiettivo 3.SCELTA DELLA TECNICA DI CAMPIONAMENTO: metodi probabilistici o non, in base a costi e attendibilità 4.MODALITÀ’ DI RACCOLTA DATI: questionario (postale, telefonico, diretto..) 5.PROGETTAZIONE QUESTIONARIO 6. RILEVAZIONE DATI: determinare il periodo più adatto di raccolta dati 7.CODIFICA E ARCHIVIAZIONE DATI 8.ANALISI DATI: produzione stime 9.RAPPORTO FINALE CAMP PROBABILISTICO = unità scelte in maniera casuale, e hanno tutte probabilità nota e non nulla di essere estratte. CAMP non PROBABILISTICO = unità scelte arbitrariamente non è quindi possibile fare inferenza. Le unità non hanno probabilità nota. Risorse economiche meno elevate, durata più breve e l’errore campionario non è valutabile. CARATTERISTICHE PIANO DI CAMPIONAMENTO PROBABILISTICO : -è una funzione che associa ad ogni possibile campione estraibile una probabilità positiva. -ogni unità della pop ha una probabilità positiva e nota di far parte del campione (probabilità di inclusione) STIMATORE= Lo scopo di un’indagine campionaria è di valutare un parametro della popolazione sulla base dell’osservazione sul campione. Si definisce stimatore del parametro θ una funzione che per ogni campione associa un numero reale detto stima di θ. Lo stimatore è CORRETTO quando il suo valore atteso è pari al valore del parametro della popolazione. E(θ^)= θ La VARIANZA rappresenta la precisione dello stimatore. Errore standard della stima L’errore standard della stima definisce la variabilità delle stime e permette di calcolare l’intervallo di confidenza della stima. L’errore standard è la radice quadrata della varianza dell’errore. La varianza dell’errore e l’errore standard possono essere stimati per qualsiasi parametro stimato. Nel caso della media, se estraiamo tutti i possibili campioni da una popolazione, le stime di HT della media della popolazione che si ottengono da ogni campione, se l’estrazione del campione è casuale, si distribuiranno secondo una distribuzione normale. La media di tutte queste possibili medie è uguale alla media della popolazione (il valore vero). La varianza di tutte queste possibili medie è la varianza dell’errore della media, la deviazione standard di tutte queste possibili medie è l’errore standard. Dato però che dalla popolazione normalmente estraiamo solo un campione tra tutti i possibili potremo calcolare solo la stima dell’errore standard. CCS caratteristiche: -ogni campione ha stessa probabilità di essere estratto P(c) costante. P(c)= 1/Cn,N -ogni n della pop ha stessa probabilità di inclusione nel campione (tecnica autoponderante) ℼ costante. ℼ = n/ N = f (frazione di campionamento). Perchèℼ = n/ N? Perchè se in 1 estrazione la probabilità di inclusione è 1/N allora in n estrazioni è nx1/N.

PRO→ semplicità concettuale e di esecuzione CONTRO→ campione troppo sparso e costi elevati (vengono estratte famiglie di milano e di palermo. Estrazione di un campione poco rappresentativo (in umbria dove prevalgono piccole imprese, estraggo la maggior parte “grandi” imprese) S^2 è la varianza campionaria, necessario per ottenere la stima della varianza dello stimatore della media (variabilità osservata nel campione) s^2=1/n-1Σ(y-Ӯ)^2. La varianza stimata di m diminuisce:-al diminuire del fattore di correzione (1-f) -al diminuire di s^2 -al crescere di n DETERMINAZIONE DI n La numerosità ottimale di un campione è quella che consente di ottenere gli obiettivi dell’indagine al minimo costo. è quindi importante capire quale è la n minima per assicurare stime sufficientemente precise. Un criterio consiste nel determinare n , che con probabilità elevata, comporta un errore e ( θ^- θ) non superiore ad un certo limite δ. δ=Z alfa/2x ES(m^). CAMPIONAMENTO SISTEMATICO Consiste nel formare un campione selezionando un’unità ogni k presenti nella lista partendo da un punto di partenza J (numero casuale tra 1 e k). k = N/n passo di campionamento. Fissando un k molte unità hanno probabilità zero ma dato che il punto di partenza j non viene scelto in maniera arbitraria è assimilabile ad un CCS. Però non è necessario conoscere la lista e dimensione del campione. Caratteristiche : Equivale al CCS solo se le unità della lista sono in ordine casuale (liste anagrafiche). Invece se la lista presenta regolarità il campione ne risente dei seguenti: VANTAGGI→ la selezione del campione copre tutte le parti della lista SVANTAGGI→ lista periodica (es: settimana) rischio di campione non rappresentativo CAMPIONAMENTO STRATIFICATO Lo schema di campionamento stratificato consiste nel suddividere la popolazioni in strati in base a delle caratteristiche. Da ogni strato poi viene estratto un campione casuale semplice e l’aggregazione di questi campioni forma il campione stratificato. Il CST è caratterizzato da una maggior efficienza rispetto al CCS. L’obiettivo è di ottenere stimatori più precisi utilizzando campioni più rappresentativi. Con il CST infatti, si ha un’adeguata copertura dei diversi strati che permette di avere una numerosità campionaria minore rispetto all CCS e quindi costi ridotti. Ma per ottenere ciò è necessario che gli strati siano il più possibile omogenei al loro interno e eterogenei tra loro. ALLOCAZIONE DELL n TRA GLI STRATI -Con l’alloc proporzionale , la frazione di campionamento è proporzionale alla dimensione di ogni strato nella pop, i pesi di strato nella pop (Nh/N) sono uguali ai pesi di strato nel campione (nh/n). Si tratta di campionamento autoponderante perchè tutte le unità hanno stessa probabilità di inclusione ℼ= n/ N. Ad ogni strato viene applicata la stessa funzione di campionamento f=n/N=fh=nh/Nh da cui si ricava la numerosità di ogni strato: nh=fxNh=n/NNh=nWh. La media ed il totale possono essere stimati ignorando la divisione in strati.

Con l’alloc non proporzionale si decide di sovrarappresentare alcuni strati e quindi di sottorappresentare altri. Questo per creare un campione più rappresentativo nel caso di indagini in cui il fenomeno studiato ha maggior variabilità in alcuni strati rispetto che altri. Quella più usata è l’alloc OTTIMALE DI NEYMAN, nella quale l’ampiezza degli strati nel campione è proporzionale alla varianza nello strato della variabile da stimare. Questo metodo è quindi preferibile per ottenere stime più efficienti quando si lavora con strati di diversa variabilità, in quelli più eterogenei si applica una frazione di campionamento maggiore rispetto a quella degli strati più omogenei.

Fissato il livello di significatività del test pari ad alfa (probabilità di commettere un errore di I tipo ed esprimere il rischio che siamo disposti a commettere di rifiutare H0 quando è vera), si rifiuta l’ipotesi H0 per valori della statistica test cappello > (s-1)(t-1);alfa. Modo alternativo: p-value (livello di significatività osservato) ed è pari alla probabilità che la statistica test assuma un valore più estremo, sotto H0, di quello calcolato sui dati campionari. p-value< alfa RH

Statistica Aziendale: Qualità dell'Informazione e Tecniche di Campionamento, Appunti di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Statistica Aziendale: Qualità dell'Informazione e Tecniche di Campionamento e più Appunti in PDF di Statistica solo su Docsity!