Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica inferenziale e bivariata, Dispense di Statistica Sociale

Si tratta di una dispensa dalla probabilità in poi,con appunti su statistica bivariata e inferenziale

Tipologia: Dispense

2025/2026

Caricato il 05/02/2026

martina-cracchiolo
martina-cracchiolo 🇮🇹

2 documenti

1 / 81

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
PROBABILITÀ
Fin ora abbiamo osservato fenomeni reali e come rappresentarli.Se ci muoviamo entriamo
nel mondo del possibile, non di quello che è ma di quello che potrebbe essere.Questi
elementi servono per sviluppare alcuni concetti che rientrano nell’ambito dell’inferenza
statistica ossia procedimenti che entrano in gioco quando si utilizzano informazioni
campionarie anziché quelle riferite a un’intera popolazione di riferimento.
Innanzitutto, bisogna distinguere la dicotomia fra situazione deterministica e situazione
casuale.
Nel caso della situazione deterministica, rappresentiamo come causa l’insieme delle
circostanze che a sua volta determinano un certo risultato(detto EVENTO e indicato con E).
SITUAZIONE DETERMINISTICA
Una situazione deterministica si verifica quando è noto l’intero insieme di circostanze che
determinano E. In questo caso, E è prevedibile a priori con certezza.
SITUAZIONE CASUALE
Ci si trova in una situazione casuale quando l’insieme di circostanze che determinano E è
noto solo parzialmente. In questo caso E non è prevedibile a priori con certezza.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51

Anteprima parziale del testo

Scarica Statistica inferenziale e bivariata e più Dispense in PDF di Statistica Sociale solo su Docsity!

PROBABILITÀ

Fin ora abbiamo osservato fenomeni reali e come rappresentarli.Se ci muoviamo entriamo nel mondo del possibile, non di quello che è ma di quello che potrebbe essere.Questi elementi servono per sviluppare alcuni concetti che rientrano nell’ambito dell’inferenza statistica ossia procedimenti che entrano in gioco quando si utilizzano informazioni campionarie anziché quelle riferite a un’intera popolazione di riferimento. Innanzitutto, bisogna distinguere la dicotomia fra situazione deterministica e situazione casuale. Nel caso della situazione deterministica, rappresentiamo come causa l’insieme delle circostanze che a sua volta determinano un certo risultato(detto EVENTO e indicato con E). SITUAZIONE DETERMINISTICA Una situazione deterministica si verifica quando è noto l’intero insieme di circostanze che determinano E. In questo caso, E è prevedibile a priori con certezza. SITUAZIONE CASUALE Ci si trova in una situazione casuale quando l’insieme di circostanze che determinano E è noto solo parzialmente. In questo caso E non è prevedibile a priori con certezza.

Infatti il caso è quella parte di circostanze ignote che impediscono di prevedere a priori con certezza il risultato. L’ evento è il possibile esito di un esperimento. Quando si parla di probabilità fondamentalmente entrano in gioco esperimenti ed eventi. Esperimento casuale : è un esperimento condotto sotto l’effetto del caso, cioè quando è nota solo una parte delle circostanze che consentirebbero di prevederne il risultato con certezza a priori, cioè prima di effettuare fisicamente l’esperimento. Di un esperimento casuale è possibile solo elencare a priori l’insieme dei possibili esiti. I giochi d’azzardo (con monete, dadi, carte, estrazioni del lotto, roulette e tutto il resto), eseguiti regolarmente senza barare, sono esempi perfetti di esperimenti casuali. Esperimento o prova casuale è un esperimento il cui esito è incerto prima della sua completa realizzazione.Es:lancio della monetaEsito incerto ma io dovrei essere in grado di esplicitare tutti i risultati possibili. Ciascuna possibilità dell’esperimento è un evento finché non diventa un risultato. Evento elementare: È ciascuno dei possibili esiti di un esperimento casuale.(Qualcuno lo chiama singoletto dall’inglese Singleton.) Per introdurre il concetto di probabilità bisogna fare riferimento a una prova casuale e tale prova è composta da una serie di risultati che fanno riferimento agli eventi che definiscono la prova.L’insieme di tutti questi eventi rappresenta la prova casuale o lo spazio campionario(totalità di tutti i casi possibili).L’evento è la singola manifestazione. Spazio campionario : È l’insieme di tutti i possibili esiti di un esperimento casuale, quindi l’insieme di tutti gli eventi elementari elencabili a priori. Lo spazio campionario o prova casuale viene indicato con la lettera omega Ω. Evento casuale : è un qualunque evento sottoinsieme dello spazio campionario Ω. Quindi, distinguiamo l’evento casuale dall’evento elementare. Il concetto di evento casuale è più generale del concetto di evento elementare.un evento elementare è un singolo elemento di Ω.Un evento casuale è un sottoinsieme di Ω, cioè un insieme di eventi elementari che può contenerne molti, alcuni, tutti, una solo o anche nessuno. Gli elementi dell’evento casuale E sono eventi elementari; un evento elementare (che contenuto in Ω per definizione) può appartenere o non appartenere a E.Gli elementi dell’insieme vengono messi tra parentesi graffe

-È necessario contare sia il numero dei casi favorevoli sia il numero dei casi possibili. La definizione classica spesso non funziona quando si cerca di calcolare la probabilità di eventi diversi e più complessi. Secondo la definizione classica, la probabilità P(E) è il rapporto fra il numero di casi favorevoli a E e il numero di tutti i casi possibili, posto che possano ritenersi tutti ugualmente possibili. La probabilità è l’orientamento verso una specifica modalità. La probabilità si muove tra due casi estremi: l’evento impossibile e l’evento certo. Usando la definizione classica di probabilità è facile vedere qual è la probabilità degli eventi estremi. La probabilità infatti è un numero compreso tra 0 e 1.

0 ≤ P(E)≤

Dopo l’inizio dell’Ottocento per rispondere a nuove esigenze si viene a formare una

nuova definizione di probabilità basata sull’osservazione e su grandi

casistiche.Questa definizione riferisce alla cosiddetta legge empirica del caso,cioè

una regola che non si può dimostrare empiricamente ma che si osserva

sistematicamente nella pratica.La definizione frequentista o statistica si basa su

questa legge empirica e stabilisce che la probabilità di E è proprio quel valore

intorno al quale tende a stabilizzarsi la frequenza relativa dopo un numero

sufficientemente grande di prove.

La definizione frequentista di probabilità è più ampia di quella classica:ci permette

di considerare spazi campionari virtualmente infiniti e di calcolare la probabilità di

eventi anche quando i casi possibili non sono tutti ugualmente possibili.Un esempio

è il lancio di una moneta truccata che pesa di più dalla parte della “testa”:la

definizione classica non è più applicabile perché i casi testa o croce non sono

ugualmente possibili,quindi la legge empirica del caso metterà in evidenza che

P(testa)>P(croce) e la definizione frequentista si può applicare.Anche la definizione

frequentista di probabilità ha però i suoi problemi.Fra questi i più intuitivi sono:

-la ripetibilità delle prove effettuate tutte nelle stesse condizioni;

-che cosa significa esattamente un gran numero di prove?quando è

sufficientemente grande?

Può capitare che gli eventi siano a loro volta composti da altri eventi.Eventi composti da eventi elementari si distinguono in: ● Compatibili/incompatibili:due eventi sono incompatibili quando non si possono verificare insieme; ● Dipendenti/indipendenti:indipendenti quando il verificarsi di un evento non modifica la probabilità del verificarsi dell’altro. Secondo la natura dell’evento di riferimento,per valutare la compatibilità si possono usare due metodi: ● la regola della somma /teorema della probabilità totale:si verifica A o B (si indica con il simbolo dell’unione) ossia la somma della probabilità dei singoli eventi. Se gli eventi sono compatibili:Somma della probabilità di A e della probabilità di B meno la parte di intersezione. Se sono incompatibili solo la somma. Oppure per gli eventi dipendenti/indipendenti( ossia la probabilità dell’intersezione di A o B)si utilizza: ● La teoria del prodotto/teorema della probabilità composta

  • Se gli eventi sono indipendenti la probabilità che si verificano entrambi (l’uno e l’altro) è uguale al prodotto dei singoli eventi.
  • Se gli eventi non sono indipendenti la probabilità di A si è modificata per effetto di B. Se sono dipendenti allora prodotto della probabilità di uno per la probabilità dell’altro modificata. La probabilità di A dato B è uguale alla probabilità di A/probabilità di B.

Le variabili casuale non vengono descritte da distribuzioni di frequenze ma da DISTRIBUZIONI DI PROBABILITÀ (pi), cioè la probabilità degli eventi di verificarsi. Quindi x e P(X), cioè P di x. distribuzione di probabilità di una variabile casuale Assegno alla variabile casuale 1 all’evento testa, 0 all’evento croce.Rappresento omega con due sole modalità.

La variabile casuale è una variabile di tipo numerico proprio perché viene generata attraverso l’immagine di omega in R.La variabile casuale si inserisce in omega, cioè l’insieme di tutti i possibili risultati.

  • Nel caso delle variabili discrete prendiamo in considerazione la variabile X indicatrici di un evento di parametro p(probabilità di successo).
  • La variabile casuale continua può assumere un numero infinito di valori e viene caratterizzata dalla funzione di densità di probabilità. Se volessimo trovare i casi possibili della variabile continua sono infiniti quindi sarebbe un numero /infinito che tende a 0. Se la variabile è continua non possiamo calcolare la probabilità che insiste su un’unica modalità della variabile.Possiamo calcolare la probabilità che insiste su in intervallo.Se la variabile casuale è continua l’analogo della distribuzione di frequenza ma la funzione della densità di probabilità.La probabilità è tutta l’area sottostante alla curva nel grafico. In entrambi i casi si parla di funzione di ripartizione,detta anche funzione di distribuzione o funzione di probabilità cumulativa.È la probabilità che la variabile casuale X assuma valori minori o uguali a un generico valore x.Per le variabili casuali si possono individuare le stesse grandezze che troviamo per le variabili statistiche.È una misura analoga alla frequenza cumulata che esprime la probabilità sino a una certa soglia:FUNZIONE DI RIPARTIZIONE. F(x)=Prob(X≤x) che rappresenta la probabilità che la variabile casuale X assuma un valore non superiore a x.F(x) corrisponde alla probabilità sino a x (in analogia alle frequenze cumulate). Le variabili casuali si descrivono attraverso misure di sintesi e grafici, allo stesso modo di quanto fatto con le variabili statistiche.Per cui avremo:
    • Funzione di ripartizione : è la probabilità che la v.c. X assuma valori minori o uguali a una certa soglia, P(Xx). − Nel discreto significa fare la somma delle probabilità fino a quella soglia. − Nel continuo, invece, l’area sino a quella soglia - Media di una variabile casuale :E(X)= μ, è uguale alla sommatoria delle modalità per P(X=x), cioè la probabilità che la v.c. X assuma il valore x.

Una variabile con due sole modalità è una variabile indicatrice di un evento.È una particolare v.c. discreta.Serve per modellare situazioni casuali che hanno 3 caratteristiche:

  1. L’esperimento casuale consiste nell’esecuzione di un certo numero di passi in sequenza, chiamati prove.Queste prove debbono essere fra loro indipendenti, cioè l’esito di ciascuna prova non influenza l’esito della prova successiva e a sua volta non è influenzato dall’esito della prova precedente
  2. Ciascuna prova può avere come esito uno è soltanto 1 / 2 eventi fra loro contrari ed esaustivi. Per intenderci, chiamiamo questi eventi successo e insuccesso. In questo modo si possono modellare i fenomeni dicotomici , cioè i fenomeni statistici che si manifestano con due sole, modalità contrarie ed esaustive per esempio sì/no,vero/falso etc.
  3. In ciascuna prova, la probabilità del successo, che denotiamo con p, è nota ed è costante.Poiché P è una probabilità,è un numero compreso fra 0 e 1 e conseguentemente è nota anche la probabilità dell’insuccesso. P(successo)=p 0
    Per le variabili continue prendiamo in considerazione:
  • V.c. Normale di parametri μ,ơ^ 2 X ~ N(μ,ơ 2 )
  • V.c normale standardizzata di parametri μ= 0 ,ơ 2 = 1 Z ~ N( 0 , 1 )con 𝑍=(x-μ)/ơ Quella che useremo è la variabile casuale normale di cui si utilizzano specialmente media e varianza.Si rappresenta attraverso la curva normale o funzione di Gauss,meno è variabile più i valori si accentrano intorno la media. VARIABILE CASUALE NORMALE Le variabili casuali sono variabili numeriche.Ci sono delle variabili casuali la cui distribuzione è nota,conoscendo i valori dei parametri che caratterizzano questa distribuzione possiamo calcolare la probabilità che insiste sulla distribuzione o gli intervalli.Si parla variabili casuali cosiddette notevoli. Si tratta di variabili la cui funzione di probabilità o di densità è nota a meno del valore dei suoi parametri. La variabile casuale normale la più nota tra le variabili casuali continue ed è anche la più utile nell’inferenza statistica.Molti la chiamano variabile casuale di Gauss poiché è colui che l’ha usata per primo.Normalmente si presta a interpretare un grande insieme di fenomeni statistici continui,quelli interessanti nelle applicazioni di ricerca sociale.
  1. Ciò significa che l’area sottesa alla curva a destra e a sinistra della media , ossia la media,è uguale ed è pari a 0 , 5 perché l’area totale è uno. 5 .Per forma,in quanto la variabile casuale normale ha un solo picco,la media rappresenta anche la moda cioè il valore più probabile.Per simmetria,la media rappresenta anche la mediana di X. Per definizione la mediana è quella modalità che risulta preceduta e seguita dallo stesso numero di termini, per cui l’area sottesa alla curva a destra e a sinistra di è uguale a 0 , 5 (poiché l’area totale è uguale a 1 ), che tradotto in termini statistici significa che X assume valori sotto-media e sopra-media con la stessa probabilità. 6 .La PANCIA della curva è la parte della curva con concavità verso il basso. Le due CODE, invece, quella con concavità verso l’alto. I punti in cui la campana cambia concavità, detti

FLESSI, corrispondono ai punti μ- σ e μ+ σ , cioè una deviazione standard dal valore medio, intorno a cui si concentrano i valori più probabili(nella pancia).

  1. I parametri media μ e varianza σ^2 determinano anche la posizione e la forma.
  • Al variare della media, con costante sigma, la curva modifica la sua posizione sul piano, cioè si sposta il punto in cui si concentrano i valori (traslazioni a destra o a sinistra, cioè sul piano delle ascisse). Il grafico cambia posizione ma non forma.
  • A parità di μ, se varia σ^2 , la curva trasla la sua altezza determinando appiattimenti o innalzamenti della campana che rimane sempre centrata sulla media e con area totale sottostante pari a uno .È un rapporto inversamente proporzionale: quando cresce σ^2 attorno a μ c’è maggiore dispersione per cui l’altezza della curva diminuisce mentre le code diventano più pesanti(curva appiattita); mentre quando diminuisce, i valori sono più concentrati intorno a μ e i flessi si avvicinano fra di loro, per cui la curva si innalza.

La probabilità di un qualunque intervallo (a, b) di valori di X è l’area sottesa alla campana in quell’intervallo. La funzione INV.NORM.N di Excel serve a calcolare il valore di per una data probabilità in una distribuzione normale non standardizzata (cioè con media e deviazione standard diverse da e ). =INV.NORM.N (probabilità; media; deviazione standard) STANDARDIZZAZIONE DI UNA VARIABILE CASUALE

Standardizzare=rendere uguale, eliminare la fonte di diversità Standardizzare una quantità statistica significa operare una trasformazione con lo scopo di depurarla da una unità di misura e ordine di grandezza, rendendola confrontabile con altri dati standardizzati perché tutti riferibili a un’unica situazione standard.

  • No unità di misura
  • Media nulla
  • Varianza= deviazione standard= 1 VARIABILE CASUALE NORMALE STANDARDIZZATA: La funzione INV.NORM.S di Excel calcola l'inverso della distribuzione normale standard cumulativa. In pratica, dato un valore di probabilità, restituisce il valore 𝑧 corrispondente per una distribuzione normale standard con una media di 0 e una deviazione standard di 1.
  • V.c normale standardizzata di parametri μ= 0 ,ơ 2 = 1 Z ~ N( 0 , 1 )con 𝑍=(x-μ)/ơ LA STIMA Introdurre alla stima significa dare risposte alle seguenti domande:
  • Cosa significa stimare?
  • Cosa si stima?
  • Come si stima? Stimare significa attribuire un valore ad un dato incognito poiché Stimare significa esprimere in una certa grandezza qualcosa ma non è detto sia quella vera.“Stimo” qualcosa che non conosco. Quando si parla di stima in statistica ,si stimano i parametri che caratterizzano le variabili in una popolazione attraverso una media o una proporzione.Perciò per esprimere le stime delle variabili ci serviamo di dati a livello campionario o probabilistico.Quindi per poter applicare le procedure dell’inferenza classica dobbiamo avere a che fare con un campione di natura probabilistica ossia le cui unità entrano a far parte del campione per effetto del caso.L’operazione di scelta casuale del campione di n unità statistiche fra le N che compongono l’intera U è chiamata campionamento .Il numero di n che compone il campione è detto numerosità o ampiezza campionaria e di solito è prefissato prima del campionamento,in genere è molto più piccolo di N.L’inferenza statistica si basa infatti su