Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


statistica cos'è e concetti base, Appunti di Statistica

concetti base della statistica, variabili, campionamento, distribuzione dati e misure di variabilità

Tipologia: Appunti

2020/2021

Caricato il 17/06/2021

elisa-caffar
elisa-caffar 🇮🇹

4.3

(4)

9 documenti

1 / 9

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Capitolo 1
Statistica → scienza che si occupa di raccoglie dati e trarre da essi
conoscenze/informazioni
→ insieme dei metodi per :
1. progettare: pianificare come ottenere dati
2. descrivere: sintetizzare dati
3. inferire: formulare previsioni basate sui dati raccolti
dati = osservazioni raccolte → aiutare a capire i fenomeni
database → raccolte dei dati contenute in archivi
fasi di un’ analisi statistica:
formulare una domanda
individuare o raccogliere dati
organizzare o guardare e sintetizzare dati
formulare un modello probabilistico che possa spiegare i dati
-Statistica descrittiva → per sintetizzare le info raccolte in un’indagine
strumenti: grafici, tabelle e sintesi numeriche
obiettivo: sintetizzare i dati in formati semplici e leggibili limitando
distorsione
-Statistica inferenziale → serve per formulare previsioni riferite all’intera
popolazione facendo uso di dati campionari
popolazione → costituita da tot dei soggetti d’interesse in uno studio
3 tipi:
1. reale/finita → n soggetti (nell’applicaz dei metodi inferenziali)
2. concettuale → popolaz che non esiste realmente ma è ipotetica
3. inifinita
campione → sottoinsieme della popolazione di riferimento
dimensione campione non determina la mia rappresentatività
campione rappresentativo → è n sottoinsieme della popolaz che ne riflette
le caratteristiche. (una versione in miniatura della popolaz)
un campione non rappresentativo non consente generalizzazioni
parametro= è una sintesi numerica delle caratteristiche della popolazione
statistica = è una sintesi numerica dei dati campionari
metodi statistici trovano un facile impiego attraverso uso del software
statistico
tipi indagine → censimento,indagini campionarie e analisi dati già raccolti
pf3
pf4
pf5
pf8
pf9

Anteprima parziale del testo

Scarica statistica cos'è e concetti base e più Appunti in PDF di Statistica solo su Docsity!

Capitolo 1

Statistica → scienza che si occupa di raccoglie dati e trarre da essi conoscenze/informazioni → insieme dei metodi per :

  1. progettare: pianificare come ottenere dati
  2. descrivere: sintetizzare dati
  3. inferire: formulare previsioni basate sui dati raccolti dati = osservazioni raccolte → aiutare a capire i fenomeni database → raccolte dei dati contenute in archivi fasi di un’ analisi statistica:
  • formulare una domanda
  • individuare o raccogliere dati
  • organizzare o guardare e sintetizzare dati
  • formulare un modello probabilistico che possa spiegare i dati -Statistica descrittiva → per sintetizzare le info raccolte in un’indagine strumenti: grafici, tabelle e sintesi numeriche obiettivo: sintetizzare i dati in formati semplici e leggibili limitando distorsione -Statistica inferenziale → serve per formulare previsioni riferite all’intera popolazione facendo uso di dati campionari popolazione → costituita da tot dei soggetti d’interesse in uno studio 3 tipi:
  1. reale/finita → n soggetti (nell’applicaz dei metodi inferenziali)
  2. concettuale → popolaz che non esiste realmente ma è ipotetica
  3. inifinita campione → sottoinsieme della popolazione di riferimento → dimensione campione non determina la mia rappresentatività campione rappresentativo → è n sottoinsieme della popolaz che ne riflette le caratteristiche. (una versione in miniatura della popolaz) un campione non rappresentativo non consente generalizzazioni parametro = è una sintesi numerica delle caratteristiche della popolazione statistica = è una sintesi numerica dei dati campionari metodi statistici trovano un facile impiego attraverso uso del software statistico tipi indagine → censimento,indagini campionarie e analisi dati già raccolti

Capitolo 2

un dato statistico è il risultato della rilevaz di un qualche carattere su un’unità statistica appartenente a una popolaz.

  • Unità statistica: il caso individuale componete del collettivo statistico
  • carattere (o variabile): ogni aspetto elementare oggetto di rilevaz nelle unità statistiche del collettivo
  • modalità di un carattere: i diversi modi con cui questo si presenta nelle unità statistiche del collettivo
  • supporto: insieme teorico delle modalità di un carattere variabili = caratteri → caratteristica che assume diversi valori traini soggetti di 1 campione o popolazione es: reddito, sesso… 2 tipi di variabili: 1 .variabile quantitativa → valori sono numeri → utilizzo media
  • variabile discreta conteggio possibili valori formano un insieme di numeri distinti (0,1,3…) Unità di misura di base che non è divisibile
  • variabile continua → misurazioni → è un intervallo limitato o illimitato. Può assumere come valori ogni possibile numero reale (fino l’infinito) possiamo avere variabili discrete : a. Rapportabili → es: quante volte sei stato al cinema in 1 anno? b. Non rapportabili → es: in che anno sei nato? possiamo avere variabili continue: a. Rapportabile → qual è la tua altezza? b. Non rapportabile → temperatura esterna
  • una variabile è intervallare se ha senso fare differenza tra valori ma non c’è uno zero naturale e non ha senso fare rapporti
  • una variabile è rapportabile se ha ha senso fare rapporti tra valori (c’è uno zero naturale)
  1. variabile categoriale (o qualitative ) → valori sono insieme di categorie.
  • Variabile nominali → variabili con categorie non ordinate (qual è genere letterario preferisci? -romantico; -storico; -altro)
  • variabile ordinali → variabili con categorie ordinate (mai,raramente,sesso…)
  • (?) Dicotomica → si-no; vero-falso
  • campione stratificato → popolaz divisa in strati di unità statistiche simili. Si prende un campione causale semplice (css) da ogni strato possono essere proporzionali o non proporzionali.
  • campione a grappoli → popola divisa in gruppi. Si seleziona poi un campione di questi grappoli e si impiegano nello studio tt i soggetti contenuti nel grappolo
  • campione a + stadi → prima si prende un css di grappoli, poi un css da ciascun grappolo campionamento non-probabilistico → inferenza non è affidabile → risultati subiscono una distorsione campionaria
  • campionamento volontario → metodo di campionamento non- probabilistico soggetti decidono volontariamente di essere inclusi nel campione

Capitolo 3

centro dei dati → valore tipico variabilità dei dati → dispersione dei valori intorno al centro frequenza assoluta → è il numero di volte che si verifica un evento a prescindere dal numero totale delle prove. frequenza relativa → è la proporzione o percentuale di osservazioni che ricade in una categoria proporzione = n osservazioni / n tot osservazioni percentuale → proporzione moltiplicata per 100 distribuzione di frequenza → sintetizza i conteggi x i possibili valori o intervalli di valori di una variabile → lista di tutti i possibili valori di una variabile a ciascuno dei quali è associato un numero che rappresenta quante volte quel valore viene osservato nei dati in esame. distribuzione relativa → tale info utilizzando percentuali o proporzioni → elenca i possibili valori della variabile con le loro rispettive proporzioni e percentuali per ottenere una + completa percezione delle info quantitative di una distribuzione è utile rappresentare graficamente le frequenze relative.

  • Grafico a barre → per variabili qualitative (categoriali)
  • Grafico a torta → sia variabili quantitative e qualitative → solo quando si ha 1 n limitato di modalità
  • istogramma → per variabili continue (quantità) per distribuz discrete che assumono un n limitato di valori → riporta una barra per ciascun valore della distribuzione Per distribuz continue o discrete con → elevato n di valori → dividere i possibili valori in intervalli
  • diagramma a ramo-e-foglie → per variabile quantitativa valore registrato nei dati è rappresentato a una o + cifre “principali” e da una cifra ”finale”; principali cifre formano → ramo cifre finali formano → foglie
  • box plot → rappresenta i quartilli →sintetizza sia centro e sia variabilità
  • è il punto di equilibrio con pesi uguali, tutti valori di una distribuzione
  • per le distribuz asimmetriche è spostata nella direzine dell’asimmetria → cioè verso la coda + lunga media ponderata FORMULA: Il denominatore è l’ ampiezza campionaria tot 2. Mediana = è il valore della variabile centrale del campione ordinato. Se ampiezza → n è dispari → abbiamo una sola osservaz centrale → n+ 2 Se ampiezza → n è pari → si ha 2 osservaz centrai e la mediana è il valore centrale tra i 2 → n+1 + (n+1) 2 proprietà:
  • per variabili quantitative e ordinali
    • utilizzata per distribuz asimmetriche
  • non è influenzata dagli outlier dati binari → dati che assumono solo 2 valori come o oppure 1. la mediana è pari al valore che viene osservato con > frequenza ma non ci fornisce info sulla frequenza relativa.

Quando le osservaz assumono solo i valori 0 o 1, la media è pari

alla proporzione di osservaz che assumono valore 1.

3. Moda = è il valore osservato nella distribuzione con > frequenza utilizzata per sintetizzare distribuz estremamente discrete come quelle che si hanno con i dati categoriali proprietà: - applicabile a dati misurati in qualunque scala → nominale, ordinale e di intervalli bimodale → distribuz di frequenza se osserviamo 2 picchi nell’ istogramma della distribuzione → osservate per variabili riferite a misure attitudinali media moda e mediana sono identiche se → distribuz è unimodale e simmetrica → come la distribuz campanulare

MISURE DI VARIABILITA’

1. Campo di variazione = è la differenza tra il valore più alto e quello più basso della distribuzione 2. varianza = è la media degli scarti al quadrato fra ogni osservaz e la media della distribuzione (s) → sua radice quadrata è la deviaz standard

  1. deviazione standard somma delle deviazioni al quadrato ampiezza campionaria - -la deviaz è positiva quando l osservaz ha un valore al di sopra della media somma di tt le deviazioni della media → è 0 -uso dei valori assoluti proprietà:
    • uguale a 0 - = 0 tt le osservaz hanno lo stesso valore - se sui dati viene effettuata una trasformaz di scala → anche le deviazioni standard vengono trasformate regola per interpretare la grandezza di deviz standard: Regola empirica: se l’istogramma delle distribuz ha una forma approssimativamente campanulare, allora 1. circa il 60% delle osservazioni assume valori compresi tra 2. circa 95% delle osservazioni assume valori compresi tra 3. la quasi totalità delle osservazioni assume valori compresi tra altro modo per descrivere una distribuz è attraverso le misure di posizioni 2 misure di posizione → massimi e minimi mediana appartiene ai percentili p-esimo percentile = è valore nella distribuz al di sotto del quale ricade il p% delle oservaz e al di sopra del quale ricade (100-p)% delle osservazioni primo quartile → 25-esimo quartile → è la mediana per le osservaz che ricadono al di sotto della mediana,cioè prima metà delle osservaz terzo quartile → 75-esimo quartile → è la mediana per le osservaz che ricadono al di sopra della mediana, per la seconda metà delle osservaz disegno: