Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Glossario Esame Statistica, Formulari di Statistica

statistica descrittiva statistica inferenziale

Tipologia: Formulari

2020/2021

In vendita dal 15/06/2021

claudia-barcelli
claudia-barcelli 🇮🇹

3.7

(3)

10 documenti

1 / 5

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
VARIANZA ² - Media di tutti gli scarti dalla media al quadrato
- È sempre non negativa
- Indice di variabilità che valuta lo scostamento
- Più la varianza è alta, più il fenomeno è variabile
- Se il carattere è costante la varianza è nulla.
- se i dati sono trasformati a, la varianza rimane
identica a quella calcolata sui dati originari.
- Se invece i valori vengono moltiplicati per una
costante b, la nuova varianza risulterà
moltiplicata per b²
- La varianza residua è la media di tutti gli scarti
dalla media al quadrato dei valori teorici di Y dato
X nella retta di regressione
- Varianza = varianza residua -> R² = 0
SCOSTAMENTO QUADRATICO
MEDIO
- Scostamento delle osservazioni dalla rispettiva
media, alla stessa unità del fenomeno osservato
- Indice di variabilità (stima la variabilità di una
popolazione di dati di una variabile causale)
- Esprime la dispersione dei dati intorno alla media
- Più lo SQM è alto, più il fenomeno è variabile
- Se il carattere è costante lo SQM è nullo.
COEFFICIENTE DI VARIAZIONE CV - Indice di variabilità relativa
- Mi serve per confrontare la variabilità di due o
più fenomeni depurandoli dalla dimensione del
fenomeno e dalla loro unità di misura (più dati
osservo più probabilmente il fenomeno è
variabile)
- Più è alto il valore del coefficiente di variazione
più il fenomeno è variabile
- Maggiore è questo indice e minore è
l’attendibilità della media in quanto i singoli valori
saranno più distanziati rispetto alla media stessa.
INDICE DEL CHI² ² - Indice di adattamento
- Deve essere non negativo
- Misura l’esistenza di una dipendenza tra X e Y
- valuta il grado di adattamento di una
certa distribuzione teorica a una osservata; valuta
se le differenze fra una distribuzione effettiva,
osservata, e la corrispondente distribuzione
desunta da un'ipotesi teorica siano dovute al caso
oppure siano significative.
- Chi² = 0 -> indipendenza
- Chi² > 0 -> dipendenza
INDICE DI CRAMER V - Indice relativo di dipendenza
- Non negativo
- Misura il grado di associazione tra due variabili
nominali
- V = 0 -> indipendenza
- 0<V<1 -> dipendenza ma non si sa di quale grado
- V = 1 -> massima dipendenza
COVARIANZA COV - La covarianza di due variabili aleatorie è il valore
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Glossario Esame Statistica e più Formulari in PDF di Statistica solo su Docsity!

VARIANZA ² - Media di tutti gli scarti dalla media al quadrato

  • È sempre non negativa
  • Indice di variabilità che valuta lo scostamento
  • Più la varianza è alta, più il fenomeno è variabile
  • Se il carattere è costante la varianza è nulla.
  • se i dati sono trasformati  a, la varianza rimane identica a quella calcolata sui dati originari.
  • Se invece i valori vengono moltiplicati per una costante b, la nuova varianza risulterà moltiplicata per b²
  • La varianza residua è la media di tutti gli scarti dalla media al quadrato dei valori teorici di Y dato X nella retta di regressione
  • Varianza = varianza residua -> R² = 0 SCOSTAMENTO QUADRATICO MEDIO  (^) - Scostamento delle osservazioni dalla rispettiva media, alla stessa unità del fenomeno osservato
  • Indice di variabilità (stima la variabilità di una popolazione di dati di una variabile causale)
  • Esprime la dispersione dei dati intorno alla media
  • Più lo SQM è alto, più il fenomeno è variabile
  • Se il carattere è costante lo SQM è nullo. COEFFICIENTE DI VARIAZIONE CV - Indice di variabilità relativa
  • Mi serve per confrontare la variabilità di due o più fenomeni depurandoli dalla dimensione del fenomeno e dalla loro unità di misura (più dati osservo più probabilmente il fenomeno è variabile)
  • Più è alto il valore del coefficiente di variazione più il fenomeno è variabile
  • Maggiore è questo indice e minore è l’attendibilità della media in quanto i singoli valori saranno più distanziati rispetto alla media stessa. INDICE DEL CHI² ² - Indice di adattamento
  • Deve essere non negativo
  • Misura l’esistenza di una dipendenza tra X e Y
  • valuta il grado di adattamento di una certa distribuzione teorica a una osservata; valuta se le differenze fra una distribuzione effettiva, osservata, e la corrispondente distribuzione desunta da un'ipotesi teorica siano dovute al caso oppure siano significative.
  • Chi² = 0 -> indipendenza
  • Chi² > 0 -> dipendenza INDICE DI CRAMER V - Indice relativo di dipendenza
  • Non negativo
  • Misura il grado di associazione tra due variabili nominali
  • V = 0 -> indipendenza
  • 0<V<1 -> dipendenza ma non si sa di quale grado
  • V = 1 -> massima dipendenza COVARIANZA COV - La covarianza di due variabili aleatorie è il valore

atteso dei prodotti delle loro distanze dalla media

  • Indice di variabilità congiunta
  • fornisce una misura di quanto X e Y varino assieme, ovvero della loro dipendenza
  • +COV -> Concordi (ai valori più piccoli di X corrispondono i valori più piccoli di Y e ai valori più grandi di X corrispondono i valori più grandi di Y)
  • -COV -> discordi (ai valori più piccoli di X corrispondono i più grandi di Y e viceversa)
  • COV = 0 -> X e Y sono incorrelati COEFFICIENTE DI CORRELAZIONE ^ - indice che esprime un'eventuale relazione di linearità tra 2 variabili, ma non ne definisce la direzione
  •  = 1 relazione lineare diretta tra X e Y
  •  = 0 X e Y incorrelate
  •  = -1 relazione lineare indiretta tra X e Y COEFFICIENTE DI DETERMINAZIONE R² - Indice che esprime la bontà di adattamento espressa dalla retta di regressione
  • Indica quanta parte di Y è spiegata dalla varianza di regressione
  • Esprime quanto la retta di regressione riesce a descrivere i dati osservati
  • Per avere un grado di accostamento accettabile deve essere superiore a 0.
  • Non negativo
  • 0<R²<
  • R² = 0 -> la regressione non spiega nulla dei valori osservati
  • R² = 1 -> la regressione spiega perfettamente i punti osservati VARIABILE CAUSALE DISCRETA - È una funzione variabile di X che assume più risultati e ad ogni risultato è associata una probabilità di verificarsi.
  • La X può assumere valori in un insieme al più numerabile VARIABILE CAUSALE CONTINUA - È una funzione variabile di X che assume più risultati e ad ogni risultato è associata una probabilità di verificarsi.
  • La X può assumere un qualunque valore all’interno di un certo intervallo VARIABILE CAUSALE BINOMIALE - È rappresentata dal numero dei successi VARIABILE CAUSALE NORMALE - Approssima varie distribuzioni discrete
  • È caratterizzata da una funzione di densità che presenta un aspetto campanulare NORMALE STANDARDIZZATA - Il passaggio da X a Z permette di calcolare in maniera immediata la probabilità
  • È un caso particolare di trasformazione lineare
  • = 0 e ²= 1
  • Ogni variabile X può essere trasformata in una normale standardizzata tramite l’operazione di standardizzazione

vengono fornite le devianze e varianze utili alla regressione: devianza di regressione, devianza residua, devianza totale. Inoltre viene calcolato il test sulla bontà di adattamento F.

    1. Coefficienti del modello: In questa terza sezione vengono date le stime puntuali, e le stime per intervallo dei coefficienti di regressione.
    1. Analisi dei residui: Infine vengono forniti alcuni dati aggiuntivi sui residui, in tabella come valori e in grafico di dispersione, rispetto alla variabile esplicativa X =DISTRIB.BINOM - e restituisce i valori della probabilità, una volta forniti i valori di n, k e p
  • Cumulativo = VERO fornisce la somma delle probabilità da i=0 a i=k
  • Cumulativo = FALSO si calcolano invece le singole probabilità per ciascun successo specificato singolarmente. NORMALE EXCEL - 4 versioni
  • =DISTRIB.NORM.ST.: che fornisce le probabilità della curva normale standardizzata;
  • =INV.NORM.ST.: che permette, data la probabilità di ricavarsi il valore z (uso indiretto della Normale);
  • =DISTRIB.NORM: che fornisce le probabilità di una curva normale qualsiasi (in questo caso tra gli argomenti figurano anche media e varianza);
  • =INV.NORM.: che permette, data la probabilità di ricavarsi il valore della x. GRAFICO A RETTANGOLI - Qualitativi sconnessi/qualitativi ordinati (in corrispondenza di ciascuna modalità con altezza proporzionale alle frequenze) GRAFICO A TORTA - Qualitativi sconnessi GRAFICO A FIGURE - Qualitativi sconnessi ( figura per rappresentare l’unità di misura e si rappresentano le modalità riportando il numero di figure proporzionale alle frequenze osservate) GRAFICO A BARRE - Quantitativi discreti ISTOGRAMMA - Quantitativi continui (base= ampiezza dell’intervallo, altezza= densità di frequenza) BOX PLOT/GRAFICO A SCATOLA - Rappresenta la variabilità della distribuzione sugli indici di variabilità di posizione GRAFICO DI DISPERSIONE - Regressione lineare CAMPIONAMENTO CASUALE SEMPLICE
  • Bisogna associare ad ogni unità della popolazione una pallina numerata ed estrarre a caso, da un’urna, una per volta e senza riporla, tante palline quante sono le unità che si vogliono campionare.
  • Semplice
  • Minima conoscenza a priori delle caratteristiche della popolazione
  • Poco utilizzato
  • Stime poco precise
  • Costi di rilevazione alti CAMPIONAMENTO CASUALE STRATIFICATO
  • Consiste nel suddividere la popolazione di partenza in k gruppi, ciascuno con elementi il più possibile omogenei tra loro, ed estraendo quindi un campione casuale di opportune classi.
  • È conveniente quando la distribuzione statistica della variabile da rilevare è asimmetrica
  • Aumenta la precisione delle stime a parità di campione rispetto al campionamento casuale semplice
  • Se la stratificazione è errata si possono ottenere risultati fuorvianti
  • Può risultare molto costosa se non si hanno sufficienti informazioni a priori CAMPIONAMENTO SISTEMATICO - Dopo aver ordinato e numerato a partire da 1 le unità della popolazione, si sceglie una unità campionaria ogni k unità della popolazione.
  • Facile, rapido ed efficiente
  • Le stime si considerano corrette con un campione superiore a 50
  • L’efficienza del campione dipende dal valore k e dalla relazione tra k e il periodo di oscillazione CAMPIONAMENTO A GRAPPOLO - Formazione di gruppi (grappoli) di unità statistiche e estrazione di un campione. Una volta estratto il grappolo, si estraggono tutte le unità al suo interno.
  • Non richiede l’elenco di tutte le unità della popolazione
  • Perdita di efficacia quando le unità del grappolo sono simili
  • Ogni unità deve essere assegnata ad un solo grappolo CAMPIONAMENTO A DUE O PIU’ STADI
  • Individuazione di unità primarie di rilevazione e di unità secondarie
  • In questo caso ogni grappolo non viene esplorato esaustivamente, ma mediante successivo campionamento