Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Statistica: Guida ai Concetti Fondamentali e Analisi dei Dati - Prof. Gagliardi, Appunti di Statistica

Università degli Studi di Siena (UNISI)Statistica

Prof. Francesca Gagliardi

Una panoramica dei concetti base della statistica, partendo dalla definizione dei dati fino all'analisi e alla visualizzazione. Vengono illustrate le fasi di un'analisi statistica efficace, la classificazione dei caratteri statistici (qualitativi e quantitativi), e le diverse tipologie di dati (discreti e continui). Anche la differenza tra popolazione e campione, le frequenze assolute e relative, e come creare tabelle pivot con excel per l'analisi dei dati. Infine, vengono introdotti gli indicatori sintetici descrittivi come media, mediana e moda, e concetti avanzati come l'indice di asimmetria di fisher e il coefficiente di spearman. Il documento include esempi pratici e formule per facilitare la comprensione dei concetti chiave, rendendolo utile per chi si avvicina per la prima volta alla statistica o per chi desidera ripassare i fondamenti. Approfondisce anche i test per la verifica di ipotesi sulla media.

Tipologia: Appunti

2024/2025

Caricato il 25/06/2025

maria-concetta-raimondo-1 🇮🇹

5

(1)

4 documenti

1 / 20

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

Statistica: Concetti Di Base

Fasi Di Un'Analisi Statistica

Per condurre un'analisi statistica efficace, è fondamentale seguire alcune fasi chiave:

●Definizione dei Dati: Identificare quali dati sono necessari per affrontare un

problema specifico o raggiungere un obiettivo.

●Raccolta dei Dati: Ottenere informazioni da fonti appropriate e affidabili.

●Organizzazione dei Dati: Strutturare i dati raccolti in tabelle per facilitarne l'analisi.

●Visualizzazione dei Dati: Creare grafici per rappresentare visivamente i dati e le

loro relazioni.

●Analisi dei Dati: Esaminare i dati per trarre conclusioni e presentare i risultati in

modo chiaro.

Nel contesto lavorativo attuale, le competenze analitiche sono sempre più richieste, poiché

le aziende che adottano l'analisi dei dati tendono a essere più competitive. Come affermato,

“il lavoro sexy nei prossimi 10 anni sarà quello degli statistici. E non sto scherzando”.

Definizione Di Statistica

La statistica è un campo ampio con applicazioni in molte discipline. Essa comprende:

●Raccolta e Analisi dei Dati: Un insieme di metodi quantitativi per osservare,

analizzare e interpretare fenomeni collettivi derivanti da manifestazioni individuali.

●Operazioni Statistiche: Include attività come il conteggio, la classificazione, la

misurazione e la sintesi tramite modelli esplicativi.

La statistica fornisce strumenti per rappresentare i dati in modo efficace, utilizzando tabelle e

grafici, e per sintetizzarli con indicatori caratteristici.

Concetti Fondamentali

1. Dati e Ipotesi: In tutte le discipline scientifiche, i dati raccolti raramente portano a

conclusioni certe al 100%. La statistica aiuta a valutare le diverse ipotesi in modo

oggettivo.

2. Software Statistico: Sebbene l'uso di software specifici sia fondamentale, non

sostituisce l'importanza dell'insegnamento della statistica. È essenziale comprendere

i principi analitici e saper interpretare i risultati.

Terminologia Statistica

Termini Descrizione

1

Scopri Appunti di Statistica Università degli Studi di Siena (UNISI)

Documenti correlati

Statistica gagliardi

(1)

Statistica parte 2 (corso prof. Gagliardi)

(2)

Statistica parte 1 (corso prof. Gagliardi)

(2)

Introduzione alla Statistica: Metodologie e Analisi dei Dati - Prof. Gagliardi

Distribuzioni Campionarie e Inferenza Statistica: Guida Dettagliata - Prof. Gagliardi

Introduzione alla Statistica: Tendenze Centrali, Variabilità e Forma dei Dati

politica e media - gagliardi

Analisi dei Dati Linguistici: Introduzione alla Linguistica dei Corpora - Prof. Gagliardi

(1)

Linguistica Gloria Gagliardi

(1)

FONETICA E FONOLOGIA APPUNTI COMPLETI PROF GAGLIARDI GLORIA

Sbobina lezione tre gagliardi

Domande esame: Metodologie e risorse per l'analisi dei dati linguistici - Prof. Gagliardi

Anteprima parziale del testo

Scarica Statistica: Guida ai Concetti Fondamentali e Analisi dei Dati - Prof. Gagliardi e più Appunti in PDF di Statistica solo su Docsity!

Statistica: Concetti Di Base

Fasi Di Un'Analisi Statistica

Per condurre un'analisi statistica efficace, è fondamentale seguire alcune fasi chiave: ● Definizione dei Dati : Identificare quali dati sono necessari per affrontare un problema specifico o raggiungere un obiettivo. ● Raccolta dei Dati : Ottenere informazioni da fonti appropriate e affidabili. ● Organizzazione dei Dati : Strutturare i dati raccolti in tabelle per facilitarne l'analisi. ● Visualizzazione dei Dati : Creare grafici per rappresentare visivamente i dati e le loro relazioni. ● Analisi dei Dati : Esaminare i dati per trarre conclusioni e presentare i risultati in modo chiaro. Nel contesto lavorativo attuale, le competenze analitiche sono sempre più richieste, poiché le aziende che adottano l'analisi dei dati tendono a essere più competitive. Come affermato, “il lavoro sexy nei prossimi 10 anni sarà quello degli statistici. E non sto scherzando”.

Definizione Di Statistica

La statistica è un campo ampio con applicazioni in molte discipline. Essa comprende: ● Raccolta e Analisi dei Dati : Un insieme di metodi quantitativi per osservare, analizzare e interpretare fenomeni collettivi derivanti da manifestazioni individuali. ● Operazioni Statistiche : Include attività come il conteggio, la classificazione, la misurazione e la sintesi tramite modelli esplicativi. La statistica fornisce strumenti per rappresentare i dati in modo efficace, utilizzando tabelle e grafici, e per sintetizzarli con indicatori caratteristici.

Concetti Fondamentali

Dati e Ipotesi : In tutte le discipline scientifiche, i dati raccolti raramente portano a conclusioni certe al 100%. La statistica aiuta a valutare le diverse ipotesi in modo oggettivo.
Software Statistico : Sebbene l'uso di software specifici sia fondamentale, non sostituisce l'importanza dell'insegnamento della statistica. È essenziale comprendere i principi analitici e saper interpretare i risultati.

Terminologia Statistica

Termini Descrizione

Popolazione Insieme di tutti i potenziali rispondenti che si vogliono studiare. Variabile Caratteristica di ogni membro della popolazione. Campione Sottoinsieme della popolazione. Censimento Studio che include l'intera popolazione. Errore di Campionamento Differenza tra una caratteristica misurata sull'intera popolazione e quella riscontrata in un campione. Grado di Variabilità Misura di come gli elementi della popolazione differiscono in riferimento alla variabile studiata.

Classificazione Dei Caratteri Statistici

I caratteri possono essere classificati in: ● Qualitativi : Non numerici, descrivono attributi (es. religione, genere). ● Quantitativi : Numerici, esprimono valori misurabili (es. età, reddito). I dati qualitativi possono essere ulteriormente suddivisi in: ● Nominali : Non esiste un ordine naturale (es. genere). ● Ordinali : Esiste un ordine naturale (es. grado di soddisfazione).

Dati Quantitativi

I dati quantitativi sono intrinsecamente numerici e si dividono in: ● Dati Discreti : Possono assumere solo determinati valori (es. numero di figli). ● Dati Continui : Possono assumere un numero infinito di valori in un intervallo (es. peso, altezza).

Popolazione E Campione

● Popolazione : Insieme completo di unità di interesse.

● Frequenze Relative : Rapporto tra la frequenza assoluta e il totale delle unità. Questi concetti formano la base per comprendere e applicare l'analisi statistica in vari contesti.

Frequenze Assolute e Relative

Frequenze Assolute

● Frequenze Assolute : Indicano quante unità presentano ciascuna modalità di un carattere X. Le frequenze sono denotate come n1, n2,…,nK. ○ Ad esempio, n1 rappresenta il numero di unità con la modalità x1 del carattere X. ● Totale delle Frequenze : La somma delle frequenze assolute deve corrispondere a n, il numero totale di unità nel campione.

Frequenze Relative e Percentuali

● Frequenza Relativa : Si calcola come il rapporto tra la frequenza assoluta di una modalità e il numero totale di unità. ● Frequenza Relativa Percentuale : È la frequenza relativa moltiplicata per 100. La somma delle frequenze relative percentuali deve sempre essere pari a 100. Importanza delle Frequenze Relative ● Le frequenze assolute variano con la dimensione del campione (n) e non sono utili per confronti tra collettivi di dimensioni diverse. Al contrario, le frequenze relative e percentuali sono numeri puri e consentono confronti significativi.

Esempio di Confronto tra Distribuzioni

● Un manager confronta i punti vendita in Toscana e Catalogna per numero di addetti. ○ Frequenze assolute: 2 punti vendita con 3 addetti in Toscana contro 4 in Catalogna. ○ Frequenze relative percentuali: 22,2% in Toscana contro 8,3% in Catalogna, suggerendo che la Toscana ha una maggiore incidenza di punti vendita con pochi addetti.

Frequenze Cumulate

● Frequenza Relativa Cumulata : È la somma delle frequenze relative di una classe e di tutte le classi precedenti. Non può mai decrescere. ● Frequenza Assoluta Cumulata : Analogamente, è la somma delle frequenze assolute fino a una certa classe.

Esempio di Frequenze Cumulate

● Se il 66,6% dei punti vendita ha un numero di addetti inferiore o uguale a 6, questo dato è utile per comprendere la distribuzione della forza lavoro.

Distribuzione di Frequenza in Classi di Valori

● Le variabili quantitative continue sono rappresentate tramite tabelle di frequenze associate a classi di valori. ○ Le classi devono essere contigue, non sovrapporsi e coprire tutti i valori dell'insieme di dati. ○ Possono avere ampiezze uguali o diverse.

Creazione di Classi di Ricavi

● Esempio di classi di ricavi: ○ Fino a 250 (incluso) ○ Da 250 (escluso) a 350 (incluso) ○ Oltre 350

Creazione di Tabelle Pivot con Excel

● Per creare una tabella pivot in Excel: ○ Selezionare i dati e scegliere "Tabella Pivot" dal menu "Inserisci". ○ Specificare l'area dei dati e dove posizionare la tabella. ○ Trascinare le variabili nelle aree appropriate per ottenere distribuzioni di frequenza o quantità.

Rappresentazioni Grafiche

● Tipi di Grafici : ○ Grafici a barre: per caratteri qualitativi ordinati. ○ Istogrammi: per caratteri quantitativi continui suddivisi in classi. ○ Grafici a torta: per rappresentare proporzioni di categorie. ○ Grafici radar: per dati ciclici.

Esempio di Grafico a Barre

● Un diagramma a barre rappresenta le frequenze o le frequenze relative di una tabella di frequenza tramite barre verticali o orizzontali.

Errori Comuni nella Visualizzazione dei Dati

● Sovraccarico di Informazioni : Può oscurare i dati reali.

Mediana e Moda

Mediana

● Definizione : La mediana è il valore centrale di un insieme di dati ordinati. Si trova nella posizione centrale e divide i dati in due parti uguali. ● Calcolo : Per trovare la mediana in una distribuzione di frequenza, si utilizza la colonna delle frequenze relative cumulate per identificare la prima frequenza (F_j) che è uguale o maggiore a 0,5. Il valore corrispondente (x_j) è la mediana della distribuzione. Ad esempio, in una distribuzione con (Me=6), la classe mediana è 3-5.

Moda

● Definizione : La moda è il valore che appare più frequentemente in un insieme di dati. ○ In un insieme di valori, è il termine che si ripete di più. ○ In una distribuzione di frequenza, è la modalità con la frequenza più alta. ○ In una distribuzione con classi di valori, è la classe con la densità di frequenza più alta. ● Caratteristiche : ○ Fornisce informazioni solo su una modalità del carattere. ○ Dipende dalle frequenze e acquista validità solo se c'è una netta prevalenza di una modalità. ○ Può non esistere, non essere unica o rappresentativa. Esempi: ● Moda di un insieme di valori : Nel carattere "Genere del responsabile", la modalità che si ripete di più è "maschio" (5 volte). ● Moda di una distribuzione di frequenza : La frequenza maggiore è 3, quindi la modalità per "Numero di addetti" è 6.

Scelta tra Media, Moda e Mediana

● Media : Generalmente utilizzata, ma sensibile agli outliers. Ad esempio, i prezzi mediani delle case sono meno influenzati da valori estremi. ● Mediana : Spesso preferita in presenza di outliers.

Quartili e Percentili

Quartili

● Definizione : I quartili dividono i dati ordinati in quattro segmenti uguali. ○ Primo Quartile (Q1) : È preceduto dal 25% dei termini e seguito dal 75%. Si calcola come il valore nella posizione ((n+1)/4). ○ Terzo Quartile (Q3) : È preceduto dal 75% dei termini e seguito dal 25%. Si calcola come il valore nella posizione (3(n+1)/4).

Percentili

● Definizione : I percentili dividono la distribuzione in cento parti uguali. Il rank percentile (P) di un valore è la percentuale di dati pari o inferiori a quel valore. ● Formula : (P = \frac{b + 2e}{n}), dove (b) è il numero di valori sotto il valore di interesse, (e) è il numero di valori uguali al valore di interesse e (n) è la dimensione del campione. ● Esempi : ○ Mediana = 50-esimo percentile. ○ (Q3 = 75)-esimo percentile. ○ (P10) = decimo percentile, lascia il 10% dei valori a sinistra.

Variabilità e Indici di Variabilità

Concetto di Variabilità

● La variabilità descrive quanto i dati si discostano l'uno dall'altro. Maggiore è la diversità tra i valori, maggiore sarà la variabilità. ● Un indice di variabilità deve: ○ Assumere valore minimo se tutte le unità presentano uguale modalità. ○ Aumentare con la diversità tra le modalità.

Misure di Variabilità

Range : Differenza tra il valore massimo e minimo ((Range = x_{MAX} - x_{Min})). ○ Rappresenta l'ampiezza dell'intervallo che contiene tutti i valori. ○ Può essere fuorviante se ci sono outliers.
Range Interquartile : Differenza tra (Q3) e (Q1), misura della variabilità non influenzata da outliers.
Varianza : Calcola la distanza media dalla media, elevando al quadrato gli scarti dalla media. ○ La varianza non può essere negativa e il valore minimo è 0.
Deviazione Standard : Radice quadrata della varianza, espressa nella stessa unità di misura dei dati.

Passaggi per il Calcolo della Deviazione Standard

Calcolare la differenza tra ciascun valore e la media.
Elevare al quadrato ogni differenza.
Sommare tutte le differenze al quadrato.
Dividere per (n) per ottenere la varianza.
Prendere la radice quadrata della varianza per ottenere la deviazione standard.

Coefficiente di Variazione

● Questi numeri sono rappresentati nel Box Plot e aiutano a descrivere la dispersione e la forma dei dati.

Indice di Asimmetria di Fisher

● Funzione degli scostamenti dalla media elevati al cubo. ● Valori: ○ (β = 0): Distribuzione simmetrica. ○ (β > 0): Asimmetria positiva. ○ (β < 0): Asimmetria negativa.

Distribuzioni Doppie

Distribuzione Doppia di Frequenze

● Rappresenta le frequenze congiunte di due caratteri (X) e (Y). ● Le frequenze relative possono essere ottenute dividendo per il totale corrispondente. Queste informazioni forniscono una base solida per comprendere le misure di centralità, variabilità e asimmetria nei dati, utili per analisi statistiche e decisioni informate.

Distribuzione Doppia di Frequenze

Definizione e Sintesi

● Distribuzione Doppia di Frequenze : Si riferisce a due caratteri, X e Y, e viene rappresentata attraverso una tabella di contingenza. Questa tabella mostra le frequenze congiunte, ovvero le frequenze assolute delle unità che presentano congiuntamente la modalità i-esima di X e la modalità j-esima di Y. ● Distribuzione di Frequenze Relative : Dividendo le frequenze congiunte per il totale, otteniamo le distribuzioni di frequenze relative, le distribuzioni marginali relative e le distribuzioni relative condizionate.

Esempi di Distribuzione Doppia

● Carattere Quantitativo : Nella distribuzione marginale e nelle distribuzioni parziali condizionate a una modalità di Y, possiamo calcolare indici di: ○ Tendenza centrale (media, varianza) ○ Dispersione ○ Asimmetria ● Carattere Qualitativo : Qui possiamo calcolare indici di tendenza centrale, come la moda marginale.

Relazioni tra Variabili: Indipendenza e Associazione

Indipendenza Statistica

● Definizione : Due caratteri X e Y sono indipendenti se la conoscenza della modalità di uno non migliora la previsione dell'altro. Se X è indipendente da Y, allora anche Y è indipendente da X. ● Condizione di Indipendenza : Le distribuzioni relative condizionate di un carattere rispetto all'altro devono essere uguali.

Associazione

● Definizione : Se esiste un legame tra X e Y, è necessario distinguere tra: ○ Dipendenza : Un legame unidirezionale, dove le modalità di un carattere dipendono da quelle di un altro. ○ Interdipendenza : Entrambi i caratteri hanno lo stesso ruolo e il legame è bidirezionale.

Esempi di Indipendenza e Dipendenza

● Frequenze Osservate vs Teoriche : Se le frequenze osservate differiscono dalle frequenze teoriche, non c'è indipendenza statistica.

Indici di Associazione 📈

Indice Descrizione Chi-quadrato Studia l’interdipendenza tra due caratteri qualitativi. Se χ² = 0, c'è indipendenza; se χ² > 0, c'è interdipendenza. Indice di Contingenza Quadratica Media Normalizza l'indice Chi-quadrato per tener conto delle dimensioni della tabella di contingenza. Indice V di Cramer Misura l'associazione tra due caratteri qualitativi. V = 0 indica indipendenza, V = 1 indica associazione perfetta.

Correlazione e Covarianza

Inferenza Statistica e Campionamento

Spazio Campionario e Eventi Elementari

● Spazio Campionario (Ω) : È l'insieme di tutti i possibili eventi elementari. Ad esempio, nel lancio di un dado, lo spazio campionario è Ω = {1, 2, 3, 4, 5, 6}. ● Eventi Elementari : Rappresentano i risultati possibili. Nel caso del dado, ogni faccia è un evento elementare. ● Esempio di Estrazione : Se estraiamo un campione di delfini, lo spazio campionario è Ω = {maschio, femmina}.

Operazioni sugli Eventi Elementari

● Negazione (Complemento) : Insieme di tutti gli esiti che non corrispondono a un evento A. ● Intersezione : Indica che entrambi gli eventi A e B si verificano. ● Unione : Indica che almeno uno tra A o B si verifica. Esempi di Operazioni ● E1 : "Esce un numero pari" = {2, 4, 6} (unione degli eventi elementari). ● E2 : "Esce un numero inferiore a 6" = {1, 2, 3, 4, 5} (negazione dell'evento 6). ● E3 : "Esce un numero pari inferiore a 6" = intersezione di E1 e E2.

Eventi Esaustivi ed Esclusivi

● Eventi Esclusivi : Non possono verificarsi contemporaneamente (intersezione nulla). ● Eventi Esaustivi : Uno e solo uno deve verificarsi (unione uguale a Ω).

Probabilità degli Eventi

● Probabilità dell'Unione di Eventi Incompatibili : Utilizza la regola additiva, applicabile anche a più di due eventi. ● Probabilità Condizionata : La probabilità di un evento A dato che B si è verificato, indicata come P(A | B).

Indipendenza tra Eventi

● Due eventi A e B sono indipendenti se il verificarsi di uno non influisce sull'altro. In termini matematici, P(A | B) = P(A).

Inferenza Statistica e Campionamento

● Inferenza Statistica : Utilizza informazioni da un campione per stimare parametri incogniti della popolazione. ● Parametri Incogniti : Caratteristiche della popolazione, come la media o la proporzione.

Estrazione del Campione

● Campione Rappresentativo : Deve riflettere la popolazione per evitare distorsioni. ● Campionamento Bernoulliano : Simula l'estrazione casuale di unità con reinserimento.

Distribuzione Campionaria

● Definizione : L'insieme delle statistiche campionarie calcolate su tutti i campioni di dimensione n. ● Teorema del Limite Centrale (TLC) : La distribuzione delle medie campionarie tende a essere normale anche se la popolazione non è normale, a condizione che n sia sufficientemente grande.

Stima Puntuale e Stima Intervallare

● Stimatore Puntuale : Un singolo valore utilizzato per stimare un parametro della popolazione. ● Stimatore Intervallare : Un intervallo di valori che ha una certa probabilità di contenere il vero valore del parametro.

Errore Standard e Precisione della Stima

● Errore Standard (ES) : La deviazione standard della media campionaria, che misura la precisione della stima. Formula: ES = σ/√n. ● Importanza : Maggiore è la dimensione del campione, minore è l'errore standard, aumentando la precisione della stima. Nota Importante : La statistica inferenziale richiede la conoscenza della distribuzione di probabilità della statistica utilizzata per stimare il parametro.

Stima Per Intervallo

Livello di Confidenza

● Il livello di confidenza è rappresentato da (1-a)%, dove a è la probabilità di trovarsi nelle code della distribuzione, al di fuori dell'intervallo di confidenza. ● La probabilità delle code sinistra e destra è pari a a/2.

Stima Per Intervallo

● La statistica calcolata su un campione (statistica campionaria) è una stima del parametro della popolazione, ma è soggetta a "errore campionario" dovuto alla variabilità casuale del campionamento. ● La stima per intervallo è un intervallo di valori plausibili associati a un livello di confidenza (90%, 95% o 99%). Ci aspettiamo che l'intervallo contenga, con quel livello di fiducia, il valore incognito del parametro della popolazione.

Intervallo di Confidenza per μ

● Gli estremi dell'intervallo dipendono dalla media campionaria 𝑋, dalla deviazione standard σ della popolazione, dal valore 𝑍α/2 e dalla dimensione campionaria n.

Lunghezza dell'Intervallo e Margine di Errore

● La lunghezza dell'intervallo è data da 2 𝑧 σ/√n, mentre il margine di errore è 𝑧σ/√n. ● Un margine di errore minore indica maggiore precisione e accuratezza della stima per intervallo.

Errore e Livello di Confidenza

● Conoscendo σ, l'errore varia direttamente al variare di 𝑧, che dipende dal livello di confidenza 1-α. ● La riduzione dell'errore può comportare un livello di confidenza minore.

Errore e Dimensione Campionaria

● L'errore varia inversamente al variare di n. Aumentare la dimensione del campione riduce l'errore.

Stima Per Intervallo della Proporzione π

Popolazione Bernoulliana

● Il carattere studiato assume due modalità: presenza/assenza di un attributo A. ● La proporzione campionaria p è utilizzata come stima puntuale di π.

Esempio di Sondaggi Elettorali

● Si estrae un campione casuale di n elettori per stimare la proporzione incognita π. ● Se la proporzione campionaria a favore di un candidato è 53,2%, si utilizza una stima per intervallo per valutare la sicurezza della vittoria.

Calcolo dell'Intervallo di Confidenza

● Al livello di confidenza del 95%, il margine di errore è stimato utilizzando 0,5 come valore prudenziale. ● Con un campione di 500 elettori, l'intervallo è [48,8; 57,6]. Con n=2000, l'errore è ridotto a 2,2%, portando a un intervallo più accurato [51,0; 55,4].

Verifica di Ipotesi Statistiche

Introduzione

● Le caratteristiche della popolazione devono essere stimate a partire dai campioni estratti. ● La verifica di un'ipotesi relativa alle caratteristiche della popolazione quantifica l'incertezza della stima.

Ipotesi Statistica Parametrica

● Un'ipotesi statistica è un'affermazione riguardante un parametro θ della popolazione, come "la lunghezza media delle scatole prodotte è di 10 cm".

Ipotesi Nulla e Alternativa

● Si considera un sistema di due ipotesi: ○ Ipotesi nulla (H0): rappresenta lo stato attuale. ○ Ipotesi alternativa (H1): opposta a H0.

Esempio di Verifica di Ipotesi

● Si estrae un campione di n scatole per valutare se l'ipotesi nulla possa essere ritenuta plausibile. ● Se il campione non fornisce evidenza contro H0, si conclude che non possiamo rifiutare H0.

Accettare H0 e H

● Accettare H0 non significa dimostrare che sia vera; si conclude solo che non c'è evidenza sufficiente contro di essa. ● Rifiutare H0 e accettare H1 implica che la lunghezza media delle scatole è significativamente diversa da 10 cm, richiedendo azioni correttive.

Esempi di Sistemi di Ipotesi

● Un manager vuole stabilire se il tempo medio di attesa è cambiato rispetto a 30 minuti. ● Un'industria automobilistica verifica se la durata media delle batterie è almeno 4000 ore.

Conclusione

● I valori campionari portano ad accettare H0 se sono "abbastanza vicini" a θ0, mentre valori "molto distanti" portano a rifiutare H0 e accettare H1.

Verifica Di Ipotesi

Valore Di T e Accettazione Di H

Estrazione del campione.
Calcolo della statistica test.
Decisione.

Esempio Di Verifica D’Ipotesi

● Scenario : Verificare se il fatturato medio dopo una campagna pubblicitaria sia aumentato rispetto a μ = 2500. ● Varianza Nota : La varianza è 1296. ● Inferenza Statistica : La verifica di ipotesi è uno strumento cruciale nel processo scientifico, dove H0 rappresenta la situazione conservatrice e H1 quella innovativa.

Importanza Del Livello Di Significatività

● Cautela Verso L’Innovazione : Si rifiuta H0 solo se i dati sono incompatibili con essa. Un errore di primo tipo è più grave di un errore di secondo tipo. ● Ipotesi Nulla Non Accettata : Un risultato non significativo non implica l'accettazione di H0, ma solo che non ci sono prove sufficienti per rifiutarla.

Dimensione Dell’Effetto E Significatività

● Interpretazione : Un risultato significativo non implica necessariamente un effetto importante. La dimensione dell'effetto deve essere valutata in base al contesto e alla quantità di dati disponibili.

Test Per La Verifica Di Ipotesi Sulla Media μ

● Regione Di Rifiuto : R = {X < c1 ∪ X > c2}, dove P(X ∈ R sotto H0) = α. ● Approccio Del P-Value : Se il valore osservato della statistica test è tale che p-value

α, non ci sono evidenze sufficienti per rifiutare H0.

Esempi Di Test Sulla Media Di Una Popolazione

● Varianza Nota : Se la varianza è nota, si utilizza una normale standardizzata. ● Varianza Non Nota : Se la varianza non è nota, si utilizza la varianza campionaria corretta.

Test Sulla Proporzione

● Distribuzione Bernoulli : La variabile casuale X è dicotomica e segue una distribuzione Bernoulli di parametro π. ● Esempi : ○ Test Bilaterale : Lanci di una moneta per verificare se è truccata. ○ Test Unilaterale : Verifica dell'efficacia di un farmaco rispetto a un'affermazione dell'industria farmaceutica.