Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica descrittiva, Appunti di Statistica

Definizione di statistica,devianza,varianza

Tipologia: Appunti

2023/2024

Caricato il 08/01/2025

angela-paolino-4
angela-paolino-4 🇮🇹

2 documenti

1 / 4

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA.
Per statistica si intende l’insieme di metodi adatti alla raccolta, presentazione ed elaborazione delle
informazioni. E’ uno strumento indispensabile alla ricerca in quanto consente la formulare di un’ipotesi
sperimentale e organizzazione di un esperimento. All’interno della statistica la morfologia statistica affronta
le difficoltà che incontriamo in una sperimentazione che riguarda: - l’errore sperimentale cioè variazione
indotta da fattori non considerando l’esperimento. -confusione con altre cause non incluse nel modello
sperimentale. -complessità degli effetti studiati. La maggior parte delle definizioni riguardante la statistica in
alcuni passaggi:
1. Scelta dei criteri per la raccolta dei dati esempio come effettuare il campionamento dei dati
sperimentali
2. Scelta del metodo di analisi più adatto tipo valutazione ed elaborazione statistica più adeguata alle
caratteristiche dei dati
3. Interpretazione critica dei risultati sperimentali
4. Decisione obiettiva
Statistica descrittiva è l’insieme delle procedure per la tabulazione, rappresentazione grafica e sintesi
delle informazioni fornite da un insieme dati.
Statistica inferenziale insieme di procedure che consentono la stima delle caratteristiche di una
popolazione sulla base di dati campionari.
VARIABILE: ogni caratteristica di un individuo/popolazione che può essere misurata o categorizzata, si
dividono in quantitative e qualitative. Variabile quantitativa, sono misure numeriche e si prestano ad
essere oggetto di operazioni matematiche. Variabili qualitative descrivono attributo o caratteristica della
popolazione/individuo e possiamo classificarla in:
-Genere: variabile qualitativa poiché ci consente di classificare le piante non si applicano operazioni
numeriche.
-Temperatura: variazione qualitativa e possono essere applicate operazione numeriche
-Numero di geni: di una pianta è una variabile numerica a cui vengono applicate operazioni aritmetiche
fornendo informazioni importanti
-Cap: variabile qualitativa poiché classifica un luogo, codice numerico ma non si presta ad operazioni
numeriche
Variabile discreta se il numero di testa croce che si ottiene lanciando in aria una moneta, i valori possibili
che questa variabile può assumere sono numeri interi 0,1,2,3,4 e 5. L’altezza di una pianta rappresenta
variabile continua in quanto rappresentano valori misurati
Con il termine popolazione intendiamo l’intero gruppo di individui oggetti di studio, per campione invece un
sottoinsieme della popolazione, per individuo persona/oggetto membro della popolazione-
Il campione è RAPPRESENTATIVO quando le caratteristiche degli individui del campione rappresentano le
caratteristiche degli individui della popolazione. Campione CASUALITA’ scelta degli individui basata su essa.
Il campione di grandezza n è ottenuto attraverso un campionamento casuale semplice da una popolazione
di grandezza N se ogni possibile campione di grandezza n ha la probabilità di essere selezionato. Si assegna
una numerazione agli N individui della popolazione e si estrae casualmente n individui dalla popolazione
servendosi della numerazione N della popolazione infine si valuta il carattere della popolazione attraverso il
campione estratto
pf3
pf4

Anteprima parziale del testo

Scarica Statistica descrittiva e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA.

Per statistica si intende l’insieme di metodi adatti alla raccolta, presentazione ed elaborazione delle informazioni. E’ uno strumento indispensabile alla ricerca in quanto consente la formulare di un’ipotesi sperimentale e organizzazione di un esperimento. All’interno della statistica la morfologia statistica affronta le difficoltà che incontriamo in una sperimentazione che riguarda: - l’errore sperimentale cioè variazione indotta da fattori non considerando l’esperimento. -confusione con altre cause non incluse nel modello sperimentale. -complessità degli effetti studiati. La maggior parte delle definizioni riguardante la statistica in alcuni passaggi:

  1. Scelta dei criteri per la raccolta dei dati esempio come effettuare il campionamento dei dati sperimentali
  2. Scelta del metodo di analisi più adatto tipo valutazione ed elaborazione statistica più adeguata alle caratteristiche dei dati
  3. Interpretazione critica dei risultati sperimentali
  4. Decisione obiettiva Statistica descrittiva è l’insieme delle procedure per la tabulazione, rappresentazione grafica e sintesi delle informazioni fornite da un insieme dati. Statistica inferenziale insieme di procedure che consentono la stima delle caratteristiche di una popolazione sulla base di dati campionari. VARIABILE: ogni caratteristica di un individuo/popolazione che può essere misurata o categorizzata, si dividono in quantitative e qualitative. Variabile quantitativa, sono misure numeriche e si prestano ad essere oggetto di operazioni matematiche. Variabili qualitative descrivono attributo o caratteristica della popolazione/individuo e possiamo classificarla in: -Genere: variabile qualitativa poiché ci consente di classificare le piante non si applicano operazioni numeriche. -Temperatura: variazione qualitativa e possono essere applicate operazione numeriche -Numero di geni: di una pianta è una variabile numerica a cui vengono applicate operazioni aritmetiche fornendo informazioni importanti -Cap: variabile qualitativa poiché classifica un luogo, codice numerico ma non si presta ad operazioni numeriche Variabile discreta se il numero di testa croce che si ottiene lanciando in aria una moneta, i valori possibili che questa variabile può assumere sono numeri interi 0,1,2,3,4 e 5. L’altezza di una pianta rappresenta variabile continua in quanto rappresentano valori misurati Con il termine popolazione intendiamo l’intero gruppo di individui oggetti di studio, per campione invece un sottoinsieme della popolazione, per individuo persona/oggetto membro della popolazione- Il campione è RAPPRESENTATIVO quando le caratteristiche degli individui del campione rappresentano le caratteristiche degli individui della popolazione. Campione CASUALITA’ scelta degli individui basata su essa. Il campione di grandezza n è ottenuto attraverso un campionamento casuale semplice da una popolazione di grandezza N se ogni possibile campione di grandezza n ha la probabilità di essere selezionato. Si assegna una numerazione agli N individui della popolazione e si estrae casualmente n individui dalla popolazione servendosi della numerazione N della popolazione infine si valuta il carattere della popolazione attraverso il campione estratto

CAMPIONAMENTO SISTEMATICO si utilizzano individui già elencati tipo banche, si ottiene selezionando ogni K-esimo individui da una popolazione, il primo individuo corrisponde a un numero casuale compreso tra 1 e k, possiamo fare un’indagine ogni k=8 individui selezionati da una banca dati già esistente, poi selezioniamo un numero compreso tra 1 e 8 tipo il 5 che includeremo nel campione il quinto, il tredicesimo (5+8), il 21 esimo 13+8,, il 29 esimo e cosi via. MEDIA ARITMETICA: di una variabile si calcola sommando tutti i valori della variabile e dividendo per il numero di osservazioni. Possibile distinguere la media aritmetica di una popolazione (mu) u. MEDIA CAMPIONARIA se x1.x2.x3 sono le osservazioni del campione alla si intende riferirsi alla media campionaria x (x con trattino su cioè x soprassegnata) MEDIA PESATA di una variabile si ottiene moltiplicando ciascun valore della variabile per il corrispondente peso sommando questi prodotti e dividendo il risultato per la sommo dei pesi MEDIANA: M rappresenta valore che occupa la posizione centrale di una distribuzione ordinata in senso crescente. 1.ORDINARE I DATI IN SENSO CRESCENTE, 2.DETERMINARE IL NUMERO DI OSSERVAZIONI n,3.DETERMINARE L’OSSERVAZIONE CHE OCCUPA LA POSIZIONE CENTRALE DEI DATI. Qual è la misura più appropriata tra media e mediana? Dipende dalla distribuzione dei dati MODA: è l’osservazione che si presenta all’interno della distribuzione dei dati con frequenza elevata INTERVALLO DI VARIAZIONE O RANGE è dato dalla differenza fra l’intensità più grande e più piccola LA VARIANZA di un possibile campione è la somma al quadrato delle scarti della media divido in numero di osservazioni La quantità n-1 è definita grado di libertà perché le prime n-1 osservazioni sono libere di assumere qualsiasi valore, a differenza della n-esima osservazione che deve assumere quel valore che consente di porre pari a zero la somma delle osservazioni. DEVIANZA: somma degli scarti della media indicata con acronimo SQ O SS DEVIAZIONE STANDARD di una popolazione si ottiene ponendo sotto radice quadrata la varianza della popolazione, quanto è maggiore la deviazione standard tanto maggiore è la dispersione di una distribuzione. ERRORE STANDARD: indicato con es misura la dispersione delle medie calcolate su n dati COEFFCIENTE VARIAZIONE indice di precisione indipendente dalla scala di misura usata per la variabile, espressa come % della media. STANDARDIZZAZIONE DEI DATI per confrontare due popolazioni I QUARTILI: dividono una distribuzione in quattro parti uguali. IL PRIMO QUARTILE divide il 25% dei dati più bassi dal restante 75% , IL SECONDO QUARTILE corrisponde alla mediana e al 50 percentile, TERZO QUARTILE divide il 73% di dati del restante 25%. La differenza tra Q3 e Q1 si chiama intervallo di quartile ASSIMETRIA A DESTRA: valori si allontanano dalla media e sono più elevati successione è moda, media , mediana ASSIMETRIA A SINISTRA: Media, moda, mediana Per valutare l’asimmetria si possono usare misure asimmetria assoluta e relativa. Asimmetria assoluta si esprimono con le distanze tra media, moda e mediana, una usata frequentemente è la differenza tra moda

della Varianza, indicata con l’acronimo ANOVA (ANalysis Of VArinace) che permette il confronto simultaneo tra le medie, mantenendo invariata la probabilità α complessiva prefissata. L'ipotesi nulla H0 e l'ipotesi alternativa H1 assumono una formulazione più generale. H0 afferma che le medie delle popolazioni dalle quali sono estratti casualmente i vari campioni sono tra loro tutte uguali, H1 è solamente bilaterale: le medie non sono tra loro tutte uguali. La fonte o causa delle variazioni dei dati viene chiamata fattore sperimentale, che rappresenta la fonte di variabilità il cui effetto si vuole verificare durante l’esperimento, livelli del fattore ogni fattore può agire con due o più modalità, i trattamenti sperimentali si intende il livello del fattore sperimentale e combinazioni di livelli di più fattori, replicazioni osservazioni relative allo stesso trattamento SQ (tot)= SQ (e)+ SQ (tra) La varianza tra gruppi misura le differenze di osservazioni di gruppi sperimentali diversi, La varianza entro gruppi misura, invece, le differenze di osservazioni nello stesso gruppo e quindi una misura degli “effetti accidentali”, Gli effetti accidentali in realtà si ripercuotono su tutte le osservazioni Il valore critico di F (p=0.05; p=5%) che deve essere superato per rigettare Ho (medie diverse), può essere trovato mediante i valori tabulari della distribuzione F. Sulle tavole di F sono riportati i valori critici (di solito p=5% e p=1%) in funzione dei gradi di libertà