Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Domande esame statistica - intero programma, Sintesi del corso di Statistica

Domande e risposte alle domande più frequenti per esame di statistica descrittiva, inferenza e probabilità

Tipologia: Sintesi del corso

2022/2023

Caricato il 24/02/2023

fabiana_h._p
fabiana_h._p 🇮🇹

4.6

(26)

7 documenti

1 / 15

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
FILE INTEGRATO
CARATTERI STATISTICI
Come possiamo definire i fenomeni oggetto di studio di un’analisi statistica?
I caratteri sono gli aspetti delle unità statistiche oggetto di studio.
Come si definiscono le possibilità che può presentare un carattere statistico?
Le modalità rappresentano i diversi modi di essere con cui si può presentare un carattere .
Come viene definito un carattere le cui modalità sono espresse attraverso grandezze
misurabili o numerabili?
Un carattere si dice quantitativo se le modalità sono espresse attraverso una grandezza
misurabile o numerabile.
Quand’è che un carattere viene detto qualitativo?
Un carattere si dice qualitativo se le modalità sono espresse mediante espressioni verbali o
attributi.
Come possiamo distinguere un carattere quantitativo nel tempo?
Le modalità di un carattere quantitativo possono essere variabili o costanti.
Quando un carattere qualitativo è rettilineo?
Un carattere qualitativo viene definito rettilineo quando le modalità possiedono un ordinamento
sequenziale, cioè un ordine di successione .
Come viene chiamato quel carattere le cui modalità non presentano un ordine naturale di
successione?
Carattere sconnesso.
Quali sono le caratteristiche di un carattere dicotomico?
Un carattere dicotomico ha la caratteristica di poter assumere solo due modalità.
Che significato assume l’assegnazione di valori numerici alle variabili qualitative?
L’assegnazione di un valore numerico alle variabili qualitative ha il solo significato di
classificazione di esse.
Perché una variabile ordinale è detta ciclica?
Una variabile ordinale è ciclica quando le modalità presentano un ordine naturale di successione
anche se le modalità iniziali e finali si possono fissare solo convenzionalmente
Quale trasformazione è solita fare ai caratteri qualitativi?
Tale trasformazione dei dati va sotto il nome di codifica.
Quali sono i caratteri quantitativi tali che è possibile pensare di cedere tutto o anche una
parte dell’ammontare di un’unità statistica?
I caratteri quantitativi detti trasferibili, ad esempio il reddito di un individuo.
Che dierenza c’è tra carattere quantitativo discreto e carattere quantitativo continuo?
Il carattere quantitativo discreto ha per modalità numeri naturali mentre il carattere quantitativo
continuo ha come modalità Totti i valori compresi in un certo intervallo.
Secondo quale scala è possibile classificare i caratteri quantitativi?
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Anteprima parziale del testo

Scarica Domande esame statistica - intero programma e più Sintesi del corso in PDF di Statistica solo su Docsity!

FILE INTEGRATO

CARATTERI STATISTICI

- Come possiamo definire i fenomeni oggetto di studio di un’analisi statistica? I caratteri sono gli aspetti delle unità statistiche oggetto di studio. - Come si definiscono le possibilità che può presentare un carattere statistico? Le modalità rappresentano i diversi modi di essere con cui si può presentare un carattere. - Come viene definito un carattere le cui modalità sono espresse attraverso grandezze misurabili o numerabili? Un carattere si dice quantitativo se le modalità sono espresse attraverso una grandezza misurabile o numerabile. - Quand’è che un carattere viene detto qualitativo? Un carattere si dice qualitativo se le modalità sono espresse mediante espressioni verbali o attributi. - Come possiamo distinguere un carattere quantitativo nel tempo? Le modalità di un carattere quantitativo possono essere variabili o costanti. - Quando un carattere qualitativo è rettilineo? Un carattere qualitativo viene definito rettilineo quando le modalità possiedono un ordinamento sequenziale, cioè un ordine di successione. - Come viene chiamato quel carattere le cui modalità non presentano un ordine naturale di successione? Carattere sconnesso. - Quali sono le caratteristiche di un carattere dicotomico? Un carattere dicotomico ha la caratteristica di poter assumere solo due modalità. Che significato assume l’assegnazione di valori numerici alle variabili qualitative? L’assegnazione di un valore numerico alle variabili qualitative ha il solo significato di classificazione di esse. Perché una variabile ordinale è detta ciclica? Una variabile ordinale è ciclica quando le modalità presentano un ordine naturale di successione anche se le modalità iniziali e finali si possono fissare solo convenzionalmente Quale trasformazione è solita fare ai caratteri qualitativi? Tale trasformazione dei dati va sotto il nome di codifica. Quali sono i caratteri quantitativi tali che è possibile pensare di cedere tutto o anche una parte dell’ammontare di un’unità statistica? I caratteri quantitativi detti trasferibili, ad esempio il reddito di un individuo. Che differenza c’è tra carattere quantitativo discreto e carattere quantitativo continuo? Il carattere quantitativo discreto ha per modalità numeri naturali mentre il carattere quantitativo continuo ha come modalità Totti i valori compresi in un certo intervallo. Secondo quale scala è possibile classificare i caratteri quantitativi?

Scala intervalli e scala di rapporti. Per quale tipo di classificazione di scala è possibile effettuare tutte le operazioni algebriche Scala di rapporti: + - : x RAPPORTI STATISTICI COSA SI INTENDE PER INDICATORI STATISTICI? Gli indicatori statistici sono strumenti con i quali si può descrivere in modo sintetico un fenomeno statistico e si ottengono operando mediante differenze e rapporti tra i dati statistici raccolti. COSA SONO GLI INDICI ASSOLUTI? gli indici si definiscono assoluti quando sono espressi nella stessa unità di misura del fenomeno. COSA SONO GLI INDICI RELATIVI? Gli indici si definiscono relativi quando non dipendono dall'unità di misura del fenomeno e si ottengono rapportando due misure assolute oppure un indice assoluto al suo massimo. COSA SONO GLI INDICI NORMALIZZATI? Gli indici normalizzati sono indici relativi che assumono valori in un intervallo finito quasi sempre [0,1] oppure [-1,+1]. COSA SONO LE DIFFERENZE ASSOLUTE O VARIAZIONI ASSOLUTE? Considerando due dati statistici X e Y, le differenze/variazioni assolute esprimono quanto la prima quantità sia maggiore o minore della seconda e sono misurate con la stessa unità di misura. COSA SI INTENDE PER RAPPORTI STATISTICI? Un rapporto statistico è un quoziente tra due fenomeni, di cui uno almeno di natura statistica, legati da un certo nesso logico. Quindi il rapporto tra il fenomeno da confrontare e il fenomeno di riferimento. COSA SONO I RAPPORTI DI COMPOSIZIONE I rapporti di composizione sono legati al concetto di frequenza relativa, infatti è il rapporto tra l’intensità o la frequenza di una data modalità di un fenomeno per l’intensità o la frequenza complessiva dello stesso fenomeno. COME SI OTTENGONO I RAPPORTI DI DERIVAZIONE? I rapporti di derivazione si ottengono eseguendo il quoziente tra le intensità o la frequenza di un fenomeno e l’intensità o la frequenza di un altro fenomeno, che ne costituisce il presupposto logico e necessario, detto “ fenomeno generante”. COME SI DETERMINANO I RAPPORTI DI COESISTENZA? I rapporti di coesistenza si determinano calcolando il quoziente tra le intensità di uno stesso fenomeno in due luoghi diversi, o tra le intensità di due fenomeni diversi ma nello stesso luogo. COSA SONO I NUMERI INDICI SEMPLICI? I numeri Indici semplici sono rapporti che consentono il confronto tra le intensità di uno stesso fenomeno in due o più situazioni diverse o in tempi diversi o luoghi diversi.

FREQUENZA e DISTRIBUZIONI

- Cos’è la frequenza? Si definisce frequenza il numero delle unità di un carattere che presentano la stessa modalità

- Nei diagrammi a coordinate cartesiane cosa è posizionato rispettivamente sull’asse delle ascisse e delle ordinate? Sull’asse delle ascisse le Variabili, sulle ordinate le frequenze. - Per quale tipo di distribuzione si utilizza il diagramma di dispersione? Si utilizza per distribuzione doppia di due variabili quantitative - Come viene rappresentato il diagramma di dispersione nel piano cartesiano? Viene rappresentato da una nube di punti - Qual è il vantaggio delle rappresentazioni grafiche rispetto a quelle tabellari? Hanno il vantaggio di essere di rapida intuizione però sono fonti informative meno ricche. - Esiste un strumento che vada a rappresentare i dati tramite indici e nel contempo rappresentarli graficamente? Qual è la sua finalità? Si esiste il c.d. box plot, un ibrido tra rappresentazione tabellare e grafica. Esso è utilizzato se l’insieme dei dati risulta vasto, in modo da rendere le illustrazioni dei risultati più evidenti. - Quali sono gli indici che compongono il box-plot? Gli indici sono: Il valore minimo osservato, Il primo quartile; La mediana; Il terzo quartile; Il valore massimo osservato. - Come si rappresenta graficamente il box-plot? Il box plot è costituito da un rettangolo compreso tra il primo quartile e il terzo quartile, la linea posta all’interno del rettangolo indica la mediana. Due segmenti che uniscono il rettangolo ai baffi, questi si fermano al valore minimo osservato e il valore massimo osservato. - Qual è il difetto del box-plot e come si può ovviare? Il difetto del box plot è che questo è soggetto a valori anomali. Si può ovviare calcolando il limite inferiore e il limite superiore. Il primo si calcola come Q1-1.5(Q3-Q1) Il limite superiore si calcola: Q3+1,5(Q3-Q1) Se il limite inferiore è maggiore del valore minimo osservato si sceglie il limite inferiore; Se il limite superiore è minore del valore massimo osservato si sceglie il limite superiore. - Il box-plot consente a colpo d’occhio di valutare cosa? Il valore della tendenza centrale; La simmetria o l’asimmetria dei dati; La dispersione dei dati, maggiore è l’ampiezza del rettangolo maggiore sarà la dispersione e viceversa.

INDICI DI POSIZIONE

- Definizione di media aritmetica. Si dice media aritmetica semplice di N numeri il numero che si ottiene dividendo la loro somma per N - Come si calcola la media aritmetica ponderata? Si calcola facendo il rapporto tra la somma degli N elementi della distribuzione per il loro peso e la somma di tutti i pesi - Per quali caratteri è possibile calcolare la media aritmetica? Per caratteri quantitativi

- La media aritmetica che tipo di indice è? È un indice di posizione razionale - Data questa distribuzione 18, 23, 31 qual è la media aritmetica? 24 - Considera un collettivo di 20 individui, 5 individui sono alti 1,65cm, 10 individui sono alti 1,75cm e altri 5 individui sono alti 1,70cm. Qual è la media aritmetica pesata? La media aritmetica pesata sarà: (1,65×5) +(1,75×10) +(1,70×5) ÷20 =1. - Definizione della proprietà dell'omogeneità. Se si moltiplica ciascun termine per una costante c la media aritmetica della successione è uguale alla media aritmetica originaria moltiplicata per c - Definizione della proprietà dell'internalità. La Media è un valore interno alla distribuzione - Definizione della proprietà traslativa della media aritmetica. Se aggiungo o sottraggo una costante c la media sarà pari alla media originaria sottratta o aumentata di c - Definizione della proprietà associativa della media aritmetica. Se il mio collettivo è diviso in un sottoinsieme esaustivo e disgiunto, la media generale è pari alle medie di ciascun gruppo pesate per il numero del gruppo stesso. - Interpreta la seguente proprietà della media ∑( 𝑥 𝑖 𝑥 ) = 0. La somma degli scarti della media è zero - A volte la media aritmetica non viene utilizzata, ma vengono preferiti altri indici di posizione come la mediana e la moda, perché? Perché la media aritmetica è notevolmente influenzata dai valori estremi della distribuzione - Come si calcola la media armonica? La media armonica è la somma dei reciproci dei termini. - La media armonica gode della proprietà dell’internalità? Sì, la media armonica gode della proprietà dell’internalità a patto che i termini della distribuzione siano tutti positivi o tutti negativi. - Quale altra proprietà contraddistingue la media armonica? La proprietà dell’omogeneità: moltiplicando per una costante c ∈ 𝑅, i termini di una distribuzione anche la media armonica risulta moltiplicata (o divisa) per la stessa costante c - Che cos’è la mediana? La mediana è un indice statistico che ci permette di sintetizzare il valore centrale di un carattere osservato. - Da che cosa è rappresentata la funzione della mediana di una distribuzione? Da quel valore che suddivide la distribuzione in due parti, lasciando un numero uguale di termini a destra e a sinistra del valore mediano.

piccolo e quello più grande della distribuzione o al massimo potrebbe coincidere con un termine della distribuzione.

- Gli indici di variabilità devono essere necessariamente uguali a 0 nel caso in cui i termini della

distribuzione siano uguali tra di loro.

- Se è presente variabilità nella distribuzione gli indici sono positivi.

- La differenza tra indici di variabilità assoluti e relativi è che quelli assoluti sono espressi nella

stessa misura delle unità statistiche a cui si riferiscono mentre quelli relativi sono indipendenti dall’unità di misura, mentre gli indici di variabilità assoluta non consentono il confronto tra le variabilità di distribuzioni quando queste sono espresse in unità di misura diversa.

- Come possiamo definire il campo di variazione? Il campo di variazione è una misura grossolana, dato dalla differenza tra il valore massimo e quello Minimo della distribuzione - Cos’è lo scostamento Semplice Medio dalla media Aritmetica? È la media aritmetica dei valori assoluti degli scarti dalla media - cos’è lo scostamento quadratico medio o anche detto deviazione standard? È la radice quadrata della media aritmetica dei quadrati degli scarti dalla media - Che cos’è la varianza? La varianza è il quadrato della deviazione standard (scostamento quadratico medio) - Cosa si intende per differenza interquartile? È un indice di variabilità che non tiene conto della distribuzione, dato dalla differenza tra terzo e primo quartile. - Cosa possiamo calcolare attraverso il campo di variazione? Il campo di variazione è usato nelle industrie per controllare la qualità del prodotto o ad esempio per indicare la minima e massima temperatura in una data località. - A quanto è pari la differenza media senza ripetizione (delta) quando tutti i termini della distribuzione sono uguali? Quando tutti i termini della distribuzione sono uguali a zero allora la differenza media senza ripetizione (delta) è pari a zero.

• Le differenze medie possono essere di due tipologie. Quali?

Le differenze medie possono essere con ripetizione e senza ripetizione.

• In che modo si possono definire le differenze medie?

La differenza media di un insieme di dati è la media aritmetica di tutte le differenze di ogni dato con gli altri.

- Cos’è lo scostamento Semplice Medio dalla media Aritmetica? È la media aritmetica dei valori assoluti degli scarti dalla media. - La devianza è il numeratore di cosa? E come si calcola (distribuzione per unità)? La devianza è il numeratore della varianza e si calcola: 𝐷𝑒𝑣(𝑋) = ∑𝑛 (𝑥 − 𝑀) 2 𝑖=1 𝑖 - Secondo una delle proprietà della varianza, la varianza stessa è invariante rispetto a cosa?

La varianza è invariante rispetto all’aggiunta di una costante a tutti i dati.

- Quale formula ci mostra la relazione tra lo scarto quadratico medio (sigma) e la differenza media quadratica (2DeltaR)? Tale relazione è espressa dalla formula: 2 ∆𝑅= 𝜎√ 2

- La devianza viene scomposta in due quantità: DEV(W) cioè la devianza entro i gruppi e DEV(B)

cioè la devianza tra i gruppi

- La deviazione standard è la somma degli scarti al quadrato di ciascun dato della media.

La differenza media quadratica è la somma degli scarti al quadrato di ciascun dato rispetto tutti gli altri.

- La Concentrazione è nulla se intensità totale è ripartita in modo uguale fra la n unità, si ha così

equidistribuzione.

- La Concentrazione è massima se intensità totale è posseduta da una sola unità delle n unità,

si ha così concentrazione massima.

- LA CURVA DI LORENZ : Detta anche curva di concentrazione, ha lo scopo di rappresentare

graficamente il grado di concentrazione di una variabile statistica.

- RAPPORTO DI CONCENTRAZIONE : Il rapporto di concentrazione R è uguale al rapporto fra la

somma dei segmenti di distanza del segmento di equidistribuzione dalla spezzata e la somma delle ascisse della retta, esclusa l’ultima.

- INDICE DI ETEROGENEITÀ DI GINI: È un indice di eterogeneità per variabili qualitative. Esso

offre una misura della eterogeneità (omogeneità) di una distribuzione statistica a partire dai valori delle frequenze relative associate alle k modalità di una generica variabile X.

STATISTICA BIVARIATA

- Da quale rapporto è dato l’indice di correlazione? l’indice di correlazione è dato dal rapporto tra la covarianza e la deviazione standard di.x - Qual’è il modo per calcolare la correlazione senza basarsi su altri parametri? Esiste un modo per calcolare la correlazione senza basarsi sul altri parametri tramite l’indice di Spearman che è un indice per definizione non parametrico - Quali sono le limitazioni nell’uso della correlazione? L’indice di correlazione può essere utilizzato solo con relazioni lineari, non va associata alle due variabili una relazione causa effetto, e infine le due variabili devono essere distribuite normalmente ad ogni valore di x e y deve seguire una distribuzione normale. - Con quale tipologia di variabili può essere applicata la correlazione? La correlazione così come la regressione è applicata con 2 variabili quantitative - Quali sono i valori che può assumere l’indice di correlazione? L’indice di correlazione varia tra -1 e 1 in base alla relazione tra le due variabili - Se l’indice R Square (siamo nella regressione) è pari ad 1 cosa vuol dire? Se l’indice è pari ad uno vorrà dire che la devianza totale e quella di regressione sono uguali quindi la retta sarà perfettamente coincidente con i punti osservati

  • Dati 2 eventi, la probabilità totale studia la probabilità che si verifichi uno dei due eventi
  • Due eventi possono essere tra loro dipendenti o indipendenti - Due eventi sono indipendenti se non si influenzano a vicenda, ovvero se non modificano la probabilità di verificarsi - Due eventi sono dipendenti se: il verificarsi di uno, modifica la probabilità che si verifichi il secondo - Il teorema di Bayes deriva da due teoremi fondamentali delle probabilità, che sono: il teorema della probabilità composta e il teorema della probabilità totale. - l teorema di Bayes viene utilizzato in un determinato esperimento per calcolare la probabilità che esso sia avvenuto per una certa causa. - Come si definisce la distribuzione di Bernoulli? Una v.c. ha distribuzione di Bernoulli con parametro p compreso nell’intervallo (0,1) se e soltanto se la distribuzione di probabilità è data da P(X=x)= p^x (1-p)^1-x per x=0, - A quali risultati è associata la distribuzione di Bernoulli? La distribuzione di Bernoulli è associata a un esperimento casuale i cui risultati sono divisi in due categorie: successo e insuccesso - Quali valori si assegnano al successo e all’insuccesso? Al risultato “successo” si assegna valore 1; al risultato “insuccesso” si assegna valore 0 - Le condizioni di applicazione della distribuzione di Bernoulli sono: la presenza di solo due risultati incompatibili e conoscere la probabilità p di uno dei due risultati - La funzione di densità Uniforme è definita come f(x)=1/(b-a) se a≤x≤b - la variabile uniforme continua è una variabile discreta - quali caratteristiche presenta la variabile uniforme continua? E(X)=(a+b)/2 Var(X)=(b-a)2/ - COS’È LA DISTRIBUZIONE DI POISSON? La distribuzione di Poisson è una distribuzione casuale discreta che si utilizza per calcolare la probabilità che un certo evento si manifesti esattamente X volte in una certa unità spazio - temporale. - QUALI SONO LE CARATTERISTICHE DELLA DISTRIBUZIONE DI POISSON? Caratteristica principale di questa distribuzione è l’uguaglianza del valore medio con la varianza. - COS’È LA FUNZIONE DI DENSITÀ DELLA DISTRIBUZIONE DI POISSON? La funzione di densità per la variabile X di Poisson rappresenta la probabilità di avere un certo numero k di successi in un determinato intervallo di tempo. - Quando è utilizzata la variabile casuale uniforme discreta? È utilizzata per simulare estrazioni casuali e per ricavare variabili casuali più complesse. Si ha in tutti i casi in cui gli eventi sono considerati equiprobabili e mutuamente escludentisi. - Valore atteso e Varianza? E(X)=b+a/2 ; Var(X)=(b-a+1)2-1/ - Com’è definita la distribuzione binomiale?

Una v.c. X ha distribuzione binomiale con parametri n e p (0≤p≤1) se se soltanto se la sua distribuzione di probabilità è data da: P(X=x)= (n x) p^x (1-p)^n-x

- Quando si applica la distribuzione binomiale? La distribuzione binomiale si applica per eventi dicotomici, probabilità di successo p costante in tutte le prove ed esperimento ripetuto n (finito) di volte indipendenti e con le stesse condizioni. - Quali sono le caratteristiche della distribuzione binomiale? E(X)= np e Var(X)=npq Quando è simmetrica la distribuzione binomiale? La distribuzione binomiale è simmetrica quando p=q=0, - Come si definisce la distribuzione ipergeometrica? Una v.c. Ha distribuzione ipergeometrica con parametri, n, k, N se la sua distribuzione di probabilità è data da: P(X=x)=(k n)(N-k n-x)/(N n);x=0,1,2,...,n;k mag= 0;x compreso tra max[0,n-(N-k)] e min(n,k) - Qual è il valore atteso della distribuzione ipergeometrica? Il suo valore atteso è pari a nk/N=np - Qual è la varianza distribuzione ipergeometrica? La varianza della distribuzione ipergeometrica è uguale a: np(1-p)•(N-n)/N- - Quando la varianza ipergeometrica coincide con quella binomiale? La varianza della distribuzione ipergeometrica Coincide con quella della Distribuzione binomiale per n=1 ed anche per N-> infinito

DISTRIBUZIONE DI PROB NORMALE

• Una variabile casuale è definita normale se è rappresentata da una distribuzione uniforme

sull’intervallo (a,b)

  • La funzione di densità (f(x)) è pari a 0 se x<a
  • La funzione di densità (f(x)) è pari a 0 se x>b
  • La funzione di densità (f(x) ) è pari a 1/(b-a) se x è compreso tra a e b
  • Il valore atteso della distribuzione è mu
  • La varianza è sigma quadro
  • Una v.c. normale ha una forma campanulare
  • Al variare di mu cambia la posizione della curva sull’asse delle ascisse
  • Al variare di sigma quadro cambia la forma della curva
  • Al crescere di sigma quadro, la curva si appiattisce
  • Al decrescere di sigma quadro, la curva si allunga
  • La media coincide proprio con la moda e la mediana
  • La moda è uguale alla media, e quindi alla mediana
  • La mediana è pari alla moda, e quindi alla media
  • Una v.c. X può essere soggetta al processo di standardizzazione
  • La standardizzazione consiste nella traslazione degli assi di riferimento, nonché al cambiamento delle unità di misura
  • Con la lettera Z si definisce una variabile casuale standard
  • Con la lettera Z si definisce una variabile casuale che segue una distribuzione normale standardizzata
  • Una variabile che si distribuisce come una normale standard ha media 0 e varianza 1
  • Z si distribuisce con media 0 e var 1
  • Il valore atteso di Z è 0

stimatore T=t(X1,....,Xn ) è detto sufficiente se e solo se o la distribuzion econdizionata di X1,….,Xn dato T=t non dipende da Θ per ogni T=t(X1,....,Xn ).

**- Consistenza quadratica:

  • Consistenza semplice:
  • Quando uno stimatore è asintoticamente non distorto**
  • Considerando stimatori differenti il più efficiente tra loro è quello con varianza più piccola.
  • La bontà di uno stimatore è valutata sulla base di proprietà quali la correttezza asintotica, la consistenza e l’efficienza che sono legate a tale scostamento media.

INTERVALLI DI CONFIDENZA E STIMA PUNTUALE-INTERVALLARE

  • cos’è la stima = Si definisce stima t=t (x1,....,xn) il valore assunto dallo stimatore per un dato campione (x1,....,xn) di ampiezza n
  • cos’è uno stimatore puntuale : Uno stimatore puntuale è una statistica (cioè una funzione dei dati campionari) che viene definita allo scopo di fornire una sintesi su un parametro di interesse
  • cos’è una stima puntuale: La stima puntuale è lo specifico valore assunto da una statistica, calcolata in corrispondenza dei dati campionari e che viene utilizzata per stimare il vero valore non noto di un parametro di una popolazione
  • cos’è uno stimatore per intervallo: Uno stimatore per intervallo è un intervallo costruito attorno allo stimatore puntuale, in modo tale che sia nota e fissata la probabilità che il parametro appartenga all’intervallo stesso
  • il livello di confidenz a è indicato di solito come (1-alfa)%
  • il livello di confidenza è il grado di fiducia che l’intervallo possa contenere effettivamente il parametro di interesse
  • valore critico: Il valore Zα/2 di Z che viene scelto per costruire un intervallo di confidenza è chiamato valore critico.
  • errore di campionamento : La differenza tra la media campionaria e la media della popolazione, indicata con e, prende il nome di errore di campionamento

REGRESSIONE

  • La regressione è impiegata per lo studio di variabili quantitative tra cui si presume intercorra una relazione asimmetrica.
  • La retta di regressione è utile per fare ricostruzioni o previsioni, rispettivamente nel caso di valori compresi o non nel campo di rilevazione del campione.
  • Il coefficiente di regressione esprime di quanto la variabile dipendente vari a seguito di variazioni unitarie di quella indipendente.
  • La codevianza è la somma dei prodotti degli scarti di ciascuna variabile dalla media, positiva se il coefficiente angolare della retta di regressione è positivo.
  • La distanza intercorrente tra l’ordinata empirica e la media delle ordinate osservate è scomponibile in due differenze: quella tra ordinata osservata e teorica e quella tra ordinata teorica e media aritmetica delle ordinate osservate.
  • Il coefficiente di determinazione non può eccedere 1, poichè rapporta la quota di devianza spiegata dal modello alla devianza totale. Se è 1, tutti i punti osservati appartengono alla retta di regressione.
  • Gli stimatori impiegati per stimare i coefficienti di regressione, parametri incogniti della popolazione, sono centrati.
  • Sarebbe ottimale, al fine di minimizzare la variabilità, selezionare valori di X tali che S_xx è alta, piochè la varianza dello stimatore B_1 è decrescente in S_xx.
  • Lo stimatore SSE* è distorto, in quanto il suo valore atteso, per n maggiore di 3, eccede il parametro per cui si effettua la stima (varianza della popolazione)
  • E’ possibile-sotto le ipotesi di varianza costante ed errori indipendenti- pervenire ad uno stimatore corretto della varianza dividendo il SSE per (n-2).

TEST D’IPOTESI

  • L’errore di primo tipo consiste nel rifiutare H 0 (ipotesi nulla) quando essa è vera.
  • L’errore di secondo tipo consiste nell’accettare H 0 (ipotesi nulla) quando essa è falsa.
  • Il p-value fornisce informazioni circa la significatività che supporta l’ipotesi alternativa.
  • Se il p-value è minore di 1%, c’è una estrema evidenza statistica a supporto dell’ipotesi alternativa.
  • Se il p-value è compreso tra 1% e 5%, c’è una forte evidenza statistica a supporto dell’ipotesi alternativa.
  • Se il p-value è compreso tra 5% e 10%, c’è una debole evidenza statistica a supporto dell’ipotesi alternativa.
  • Se il p-value è maggiore del 10%, non c’è evidenza statistica a supporto dell’ipotesi alternativa.
  • La potenza del test 1-β rappresenta la probabilità di rifiutare H 0 (ipotesi nulla) quando essa è falsa.
  • La distribuzione t di Student è unimodale e simmetrica attorno allo zero.
  • La regione di rifiuto è un range di valori.
  • Accettiamo l’ipotesi nulla se il valore della statistica test non cade nell’area di rifiuto
  • Le ipotesi semplici sono quelle in cui si specifica in modo unico la distribuzione della popolazione nel concetto di rilevazione
  • Le ipotesi composte sono quelle che si specificano diversi valori del parametro e si dividono in unidirezionali e bidirezionali
  • Il p-value del test è la probabilità associata al test statistico
  • La varianza campionaria corretta S^ è uno stimatore corretto consistente ed efficiente di gamma quadro
  • Quando la popolazione campionaria si distribuisce in modo normale la statistica T si distribuisce come una T di Student con n-1 gradi di libertà
  • I gradi di libertà sono in funzione della numerosità del campione
  • La statica T di Student si approssima ad una distribuzione normale con n> 30 si approssima ad una normale
  • Quando non si conosce S (varianza incognita) nel calcolo delle ipotesi sulla media della popolazione la statistica Z è sostituita dalla statistica T
  • Quando la popolazione è caratterizzata da variabili quantitative possiamo fare inferenza solo sulla frequenza di un attributo nella popolazione
  • La problematica della verifica delle ipotesi passa attraverso tre fasi : 1 formulazione delle ipotesi campionarie , 2 risultati campionari , 3 decisione sull’ipotesi formulata.
  • Un’ipotesi statistica è un’affermazione relativa ai parametri della distribuzione di una o più