





















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
riassunto esame statistica san raffaele
Tipologia: Schemi e mappe concettuali
1 / 29
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!






















La statistica è uno strumento che ci permette di regolare, utilizzando strumenti di controllo (i dati ), nel mondo della preparazione, fisica, atletica, tattica e strategica delle squadre o dei singoli atleti.
Lo studio approfondito dei dati statistici può anche tradursi in fattori predittivi di risultati futuri. Ma la statistica si occupa anche di studiare gli errori per tentare di comprendere le evenienze e dove e quando accadono. Lo scopo della statistica è, dunque, quello di raccogliere dati che poi ci permettono, per esempio, di comprendere la natura di alcuni fenomeni, di confrontarli In modo da poter guidare, attraverso un’analisi attenta, il processo di allenamento o di una gara di una squadra o un individuo. In genere si raccolgono dati numerici. Quando raccogliamo dati bisogna tenere conto di alcuni criteri e precauzioni x la completezza delle informazioni raccolte:
È anche la somma dell’errore sistematico e dell’errore casuale. Una misura si dice attendibile quando l’errore totale non è significativo. L’attendibilità è la somma tra l’errore sistematico e l’errore casuale. PRECISIONE ED ACCURATEZZA
all’interno della distribuzione; quindi, è fondamentale che nella classificazione si comprendano tutti i valori assunti della variabile, siano essi modalità o i valori assunti dalla classe.
ciò che accade in poche migliaia di persone. Questa parte della demoscopia permette di fare dei ragionamenti generalizzabili a scenari probabili. L’obbiettivo tecnico del campionamento è quello di stimare alcuni parametri nella popolazione, che possiamo andare a trovare direttamente in un campione più piccolo, quindi rappresentativo, della popolazione stessa. Spesso, per esempio si utilizza la media : si va a stimare se la media campionaria è vicina alla media della popolazione stessa, cioè alla vera media che probabilmente appartiene a una popolazione superiore. La distinzione tra media campionaria e media espressa teoricamente dalla popolazione intera, sono rappresentate da una diversa notazione -> la media campionaria di indica con la lettera M, mentre quella della popolazione viene indicata con la lettera greca mi****. LA STIMA La stima è esattamente quello che ci aspettiamo da un buon modello, non corrisponde alla concretezza assoluta. Le tecniche di stima, sono basate su indici di stimatori , cioè quella categoria di osservazione che ci permette di identificare nella moltitudine delle variabilità quei concetti fortemente correlabili alla realtà stessa. Quindi, uno stimatore può essere corretto se il suo valore medio corrisponde al valore del parametro della popolazione, oppure distorto, se si discosta da esso. METODI X SELEZIONARE UN CAMPIONE Esistono principalmente due tipi di campionamento: **1) Campionamento probabilistico
Questo metodo garantisce una forte rappresentatività del campione rispetto alla popolazione di studio e i risultati ottenuti nella elaborazione delle variabili raccolte possono essere applicati ( inferiti ) all’intera popolazione, con un alto grado di probabilità di corrispondenza tra i valori trovati nel campione e quelli della popolazione. Tale grado di corrispondenza dipende fortemente dalla numerosità campionaria e dalla variabilità del parametro studiato. Generazione di numeri casuali tramite excel : funzione CASUALE.TRA Scrivo sulla barra in alto denominata “fx” : =casuale.tra(intervallo di tempo min;intervallo di tempo maggiore) MISURE DI TENDENZA E DISPERSIONE Alcune delle formule statistiche e matematiche più semplici sono i calcoli della tendenza centrale e della dispersione dei dati raccolti che forniscono una serie di indici di sintesi in grado di rappresentare efficacemente una moltitudine di dati. Gli indici più usati per esprimere la misura della tendenza centrale sono:
**- La Media
La devianza si calcola sottraendo ad ogni valore la media (di tutti i valori, che in questo caso è 4) ed elevando al quadrato; dopodiché si sommano tutti i risultati dei valori trovati. (Vedi immagine a sx). Se si raddoppia il numero di dati, anche la devianza raddoppia nonostante la variabilità dei dati si mantenga costante. Da qui viene la necessità di creare un altro indice di dispersione che sia indipendente dalla numerosità dei dati. Quindi un indice normalizzato rispetto alla numerosità del campione o della popolazione: la varianza. VARIANZA È un altro indice di dispersione, legato al concetto di devianza. In effetti la varianza è la devianza media rapportata al num delle osservazioni o del campione o della popolazione. La varianza ha due elementi critici:
A questo punto entra in gioco il COEFFICIENTE DI VARIAZIONE: è un indice di dispersione indipendente dall’unità di misura. Esso consente una misurazione della variabilità indipendentemente dalla grandezza e dalla scala di misura dei dati. È un indice di distribuzione percentuale ed è pari al rapporto tra la deviazione standard e la media moltiplicato per 100. RIASSUMENDO DISTRIBUZIONI DI FREQUENZA E PROBABILITÀ Una distribuzione di frequenza osservata è ricostruita a partire dai dati. Una distribuzione teorica di probabilità è definita da una funzione matematica di cui si conoscono le caratteristiche e che permette il calcolo della probabilità associata a ciascun valore o intervallo di valori. Distribuzione teorica discreta di probabilità -> La funzione è definita dalla probabilità che la variabile assuma un certo valore. Distribuzione uniforme discreta di probabilità -> se i possibili valori sono n, allora ognuno di questi ha la stessa probabilità di verificarsi e non dipende dal valore stesso. Distribuzione non uniforme discreta di probabilità -> se i possibili valori sono n, allora ognuno di questi non ha la stessa probabilità di verificarsi e dipende dal valore stesso. Distribuzione teorica continua di probabilità per variabili di tipo continuo -> La funzione è una distribuzione di densità di probabilità (una probabilità divisa per un intervallo). DISTRIBUZIONE NORMALE O GAUSSIANA È una delle distribuzioni continue più utilizzate. Essa è definita interamente tra 2 parametri, la media e la varianza. Sono valori veri, riscontrabili nella popolazione. La media ne definisce la posizione; mentre la varianza la forma. La caratteristica fondamentale è la simmetria (è una distribuzione simmetrica, ha infatti una tipica forma a Campana). Altre proprietà:
indipendente (le due variabili sono trattate in modo simultaneo ma come due distribuzioni indipendenti);
Le distribuzione bivariate considerate finora sono di tipo assoluto ; ovviamente da esse è possibile costruire una tabella a doppia entrata con distribuzione relativa. Si dividono i valori per la dimensione del campione e si moltiplica per 100. In tal modo si ottiene la seguente tabella delle distribuzioni bivariate relative percentuali. DISTRIBUZIONE BIVARIATA CONDIZIONATA Si costruiscono fissando una variabile e studiando la distribuzione dell’altra variabile. Frequenze relative di tipo percentuale : si ottengono dalle frequenze assolute dividendo i valori presenti nelle singole celle per il tot che abbiamo indicato. RELAZIONE TRA 2 VARIABILI In una distribuzione bivariata (multipla), su un’unità statistica campionaria è possibile osservare due (o più variabili) simultaneamente. Per studiare la relazione tra due caratteri o variabili X e Y di un campione, occorre tenere presente: ➢ La natura delle variabili in gioco (qualitativa, quantitativa, etc.) ➢ Il tipo di relazione che si vuole rilevare tra le variabili stesse. Esistono due tipologie di dipendenza:
La dipendenza in media, a differenza della dipendenza assoluta, non è una relazione simmetrica, nel senso che può esserci una dipendenza in media di un carattere rispetto all’altro ma non è detto il viceversa. Per misurare la dipendenza in media si ricorre al rapporto di correlazione o all’indice eta quadrato di Pearson. INDICE DI PEARSON -> Per definirlo abbiamo bisogno del concetto di devianza. La devianza di una variabile Y rispetto all’altra variabile X si può scomporre in devianza interna ed esterna. NB ni.=frequenza marginale. n.j =distribuzione marginale. CALCOLO DELL INDICE DI PEARSON Note le definizione di devianza interna, esterna e tot, possiamo definire l’indice di eta quadrato di Y (cioè l’indice di Pearson di Y) che è uguale al rapporto tra la devianza esterna e la devianza totale ( indice di Pearson =dev interna/ dev tot). Questa quantità è uguale ad 1 meno il rapporto tra la devianza interna e quella totale.
INTERVALLO DI CONFIDENZA: è quella regione che conterrà il vero valore della media della popolazione. (z= valore critico). Qualsiasi test statistico è contraddistinto da un insieme di elementi comuni e da un analogo processo decisionale:
A questo punto si arriva alla decisione: