


Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Definizione di statistica,devianza,varianza
Tipologia: Appunti
1 / 4
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!



Per statistica si intende l’insieme di metodi adatti alla raccolta, presentazione ed elaborazione delle informazioni. E’ uno strumento indispensabile alla ricerca in quanto consente la formulare di un’ipotesi sperimentale e organizzazione di un esperimento. All’interno della statistica la morfologia statistica affronta le difficoltà che incontriamo in una sperimentazione che riguarda: - l’errore sperimentale cioè variazione indotta da fattori non considerando l’esperimento. -confusione con altre cause non incluse nel modello sperimentale. -complessità degli effetti studiati. La maggior parte delle definizioni riguardante la statistica in alcuni passaggi:
CAMPIONAMENTO SISTEMATICO si utilizzano individui già elencati tipo banche, si ottiene selezionando ogni K-esimo individui da una popolazione, il primo individuo corrisponde a un numero casuale compreso tra 1 e k, possiamo fare un’indagine ogni k=8 individui selezionati da una banca dati già esistente, poi selezioniamo un numero compreso tra 1 e 8 tipo il 5 che includeremo nel campione il quinto, il tredicesimo (5+8), il 21 esimo 13+8,, il 29 esimo e cosi via. MEDIA ARITMETICA: di una variabile si calcola sommando tutti i valori della variabile e dividendo per il numero di osservazioni. Possibile distinguere la media aritmetica di una popolazione (mu) u. MEDIA CAMPIONARIA se x1.x2.x3 sono le osservazioni del campione alla si intende riferirsi alla media campionaria x (x con trattino su cioè x soprassegnata) MEDIA PESATA di una variabile si ottiene moltiplicando ciascun valore della variabile per il corrispondente peso sommando questi prodotti e dividendo il risultato per la sommo dei pesi MEDIANA: M rappresenta valore che occupa la posizione centrale di una distribuzione ordinata in senso crescente. 1.ORDINARE I DATI IN SENSO CRESCENTE, 2.DETERMINARE IL NUMERO DI OSSERVAZIONI n,3.DETERMINARE L’OSSERVAZIONE CHE OCCUPA LA POSIZIONE CENTRALE DEI DATI. Qual è la misura più appropriata tra media e mediana? Dipende dalla distribuzione dei dati MODA: è l’osservazione che si presenta all’interno della distribuzione dei dati con frequenza elevata INTERVALLO DI VARIAZIONE O RANGE è dato dalla differenza fra l’intensità più grande e più piccola LA VARIANZA di un possibile campione è la somma al quadrato delle scarti della media divido in numero di osservazioni La quantità n-1 è definita grado di libertà perché le prime n-1 osservazioni sono libere di assumere qualsiasi valore, a differenza della n-esima osservazione che deve assumere quel valore che consente di porre pari a zero la somma delle osservazioni. DEVIANZA: somma degli scarti della media indicata con acronimo SQ O SS DEVIAZIONE STANDARD di una popolazione si ottiene ponendo sotto radice quadrata la varianza della popolazione, quanto è maggiore la deviazione standard tanto maggiore è la dispersione di una distribuzione. ERRORE STANDARD: indicato con es misura la dispersione delle medie calcolate su n dati COEFFCIENTE VARIAZIONE indice di precisione indipendente dalla scala di misura usata per la variabile, espressa come % della media. STANDARDIZZAZIONE DEI DATI per confrontare due popolazioni I QUARTILI: dividono una distribuzione in quattro parti uguali. IL PRIMO QUARTILE divide il 25% dei dati più bassi dal restante 75% , IL SECONDO QUARTILE corrisponde alla mediana e al 50 percentile, TERZO QUARTILE divide il 73% di dati del restante 25%. La differenza tra Q3 e Q1 si chiama intervallo di quartile ASSIMETRIA A DESTRA: valori si allontanano dalla media e sono più elevati successione è moda, media , mediana ASSIMETRIA A SINISTRA: Media, moda, mediana Per valutare l’asimmetria si possono usare misure asimmetria assoluta e relativa. Asimmetria assoluta si esprimono con le distanze tra media, moda e mediana, una usata frequentemente è la differenza tra moda
della Varianza, indicata con l’acronimo ANOVA (ANalysis Of VArinace) che permette il confronto simultaneo tra le medie, mantenendo invariata la probabilità α complessiva prefissata. L'ipotesi nulla H0 e l'ipotesi alternativa H1 assumono una formulazione più generale. H0 afferma che le medie delle popolazioni dalle quali sono estratti casualmente i vari campioni sono tra loro tutte uguali, H1 è solamente bilaterale: le medie non sono tra loro tutte uguali. La fonte o causa delle variazioni dei dati viene chiamata fattore sperimentale, che rappresenta la fonte di variabilità il cui effetto si vuole verificare durante l’esperimento, livelli del fattore ogni fattore può agire con due o più modalità, i trattamenti sperimentali si intende il livello del fattore sperimentale e combinazioni di livelli di più fattori, replicazioni osservazioni relative allo stesso trattamento SQ (tot)= SQ (e)+ SQ (tra) La varianza tra gruppi misura le differenze di osservazioni di gruppi sperimentali diversi, La varianza entro gruppi misura, invece, le differenze di osservazioni nello stesso gruppo e quindi una misura degli “effetti accidentali”, Gli effetti accidentali in realtà si ripercuotono su tutte le osservazioni Il valore critico di F (p=0.05; p=5%) che deve essere superato per rigettare Ho (medie diverse), può essere trovato mediante i valori tabulari della distribuzione F. Sulle tavole di F sono riportati i valori critici (di solito p=5% e p=1%) in funzione dei gradi di libertà