Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Comandi Excel per esame, Schemi e mappe concettuali di Statistica Sociale

Schema riassuntivo comandi per esame di statistica

Tipologia: Schemi e mappe concettuali

2021/2022
In offerta
30 Punti
Discount

Offerta a tempo limitato


Caricato il 05/05/2023

desy-messina
desy-messina 🇮🇹

5

(4)

4 documenti

1 / 11

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
COMANDI EXCEL:
STATISTICA DESCRITTIVA UNIVARIATA
COME TRASFORMARE UN FI LE C VS (CON VALORI SEPARATI D A VIRGOLE) IN UN
DATASET EXCEL
1. Selezionare la colonna (la lettera in alto per tutta la riga) (A:A)
2. Selezionare “dati” e
3. Cliccare su “testo in colonne” (si trova sulla dx)
4. Selezionare “delimitato”
5. Cliccare “avanti”
6. Spuntare la cella “virgola”
7. Cliccare “avanti”
8. Cliccare “fine”
DISTRIBUZIONE DI FR EQ UE NZ E ASSOLUTE CON TABE LL A PIVOT (*1)
1. Selezionare una colonna cliccando sulla lettera in alto (A:A)
2. Cliccare su “inserisci”
3. Cliccare su “tabella pivot”
4. Cliccare su “nuovo foglio” (per creare una prima tabella) o su “foglio già esistente” (per
le tabelle successive)
5. Cliccare “ok”
6. Scegliere una porzione di foglio col cursore dove inserire la tabella nuova
7. Comparirà nella tabella solo la variabile selezionata
8. Trasportare dal menù a dx la variabile prima in “righe/asse” poi su “valori”
FREQUENZE RELATIV E PE RC EN TUALI (*2)
1. Stessi 8 passaggi di *1
2. Cliccare nel menù a dx
3. Cliccare su “mostra valori come”
4. Cliccare “% del tot complessivo”
FREQUENZE ASSOLUTE CU MU LATE
1. Compiuti i passaggi di *1
2. Nella cella accanto inserisco il primo valore
3. Nella cella sotto scrivo “=” (attiva le funzioni di calcolo)
4. Clicco sul secondo valore accanto il simbolo di uguale
5. Scrivo il simbolo “+”
6. E sommo con il primo valore cliccando invio
7. Nella cella sotto scrivo “=”,
8. Clicco sul terzo valore
9. Scrivo il simbolo “+”
10.Clicco il valore ottenuto dalla somma dei precedenti (nella cella sopra)
11. Ripetere per tutti i valori
FREQUENZE RELATIV E PE RC EN TUALI CUMULATE
1. Completati i passaggi di *1 e *2
2. Copiare i valori che ci sono all’interno della tabella in celle vicine
3. Spostarsi nella cella vicina
pf3
pf4
pf5
pf8
pf9
pfa
Discount

In offerta

Anteprima parziale del testo

Scarica Comandi Excel per esame e più Schemi e mappe concettuali in PDF di Statistica Sociale solo su Docsity!

COMANDI EXCEL:

STATISTICA DESCRITTIVA UNIVARIATA

COME TRASFORMARE UN FILE CVS (CON VALORI SEPARATI DA VIRGOLE) IN UN

DATASET EXCEL

  1. Selezionare la colonna (la lettera in alto per tutta la riga) (A:A)
  2. Selezionare “dati” e
  3. Cliccare su “testo in colonne” (si trova sulla dx)
  4. Selezionare “delimitato”
  5. Cliccare “avanti”
  6. Spuntare la cella “virgola”
  7. Cliccare “avanti”
  8. Cliccare “fine” DISTRIBUZIONE DI FREQUENZE ASSOLUTE CON TABELLA PIVOT (*1)
  9. Selezionare una colonna cliccando sulla lettera in alto (A:A)
  10. Cliccare su “inserisci”
  11. Cliccare su “tabella pivot”
  12. Cliccare su “nuovo foglio” (per creare una prima tabella) o su “foglio già esistente” (per le tabelle successive)
  13. Cliccare “ok”
  14. Scegliere una porzione di foglio col cursore dove inserire la tabella nuova
  15. Comparirà nella tabella solo la variabile selezionata
  16. Trasportare dal menù a dx la variabile prima in “righe/asse” poi su “valori” FREQUENZE RELATIVE PERCENTUALI (*2)
  17. Stessi 8 passaggi di *
  18. Cliccare nel menù a dx
  19. Cliccare su “mostra valori come”
  20. Cliccare “% del tot complessivo” FREQUENZE ASSOLUTE CUMULATE
  21. Compiuti i passaggi di *
  22. Nella cella accanto inserisco il primo valore
  23. Nella cella sotto scrivo “=” (attiva le funzioni di calcolo)
  24. Clicco sul secondo valore accanto il simbolo di uguale
  25. Scrivo il simbolo “+”
  26. E sommo con il primo valore cliccando invio
  27. Nella cella sotto scrivo “=”,
  28. Clicco sul terzo valore
  29. Scrivo il simbolo “+” 10.Clicco il valore ottenuto dalla somma dei precedenti (nella cella sopra)
  30. Ripetere per tutti i valori FREQUENZE RELATIVE PERCENTUALI CUMULATE
  31. Completati i passaggi di *1 e *
  32. Copiare i valori che ci sono all’interno della tabella in celle vicine
  33. Spostarsi nella cella vicina
  1. Inserire “=”
  2. Riscrivo il primo valore accanto il simbolo di uguale
  3. Scrivo il simbolo “+”
  4. Sommo con il secondo valore cliccando invio
  5. Nella cella sotto scrivo “=”, e sommo il valore che ho ottenuto con il valore successivo
  6. Ripetere per tutti i valori DISTRIBUZIONI IN CLASSI DI VALORI
  7. Decidere quali sono le classi (se sono uguali o differenti)
  8. Calcolare il minimo con “=MIN(A:A)”
  9. Calcolare il massimo con “=MAX(A:A)”
  10. Creare una colonna con gli estremi inferiori
  11. Creare una colonna con gli estremi superiori
  12. Calcolare la frequenza con il comando “=FREQUENZA(matrice dati; matrice bin)” (A:A; stremi superiori)
  13. Clicchi invio MEDIA Inserire nella cella “=MEDIA(matrice dati)” (A:A) MEDIA SCOMPOSTA (PROPRIETÀ DELLA SCOMPONIBILITÀ)
  14. Scegli come dividere il gruppo di dati
  15. Con il filtro, copia e incolla in un'altra pagina i dati scelti (voti delle femmine) (voti dei maschi) (voti altro)
  16. Usare la funzione “=CONTA.NUMERI(A:A)” per conoscere il totale dei nuovi gruppi creati
  17. Calcola la media dei nuovi gruppi con la funzione “=MEDIA(A:A)”
  18. Calcola la media generale con la formula:

X 1 ∗ n 1 + X 2 ∗ n 2 + X 3 ∗ n 3 + …

n 1 + n 2 + n 3 + …

MEDIANA

Inserire nella cella “=MEDIANA(matrice dati)” (A:A) MODA Inserire nella cella “=MODA(matrice dati)” (A:A) QUARTILI Inserire nella cella “=INC.QUARTILE (matrice dati;N) (A:A;N)” PERCENTILI Inserire nella cella “=INC.PERCENTILE (matrice dati;N) (A:A;N)” N: tra 0 e 1 CODIFICA NUMERICA (ESEMPIO LAVORO): FUNZIONE “SE”

  1. Nuova cella
  2. Decidiamo il nuovo ordinamento:” no”, “part-time”, “a tempo pieno”
  3. Scrivo sulla cella “=SE(cella da verificare=”condizione cella”; valore se vera; valore se falsa)” “=SE(A2=”no”;1;0) Sapere il minimo e il massimo ci aiuta a organizzare le classi di valori. Clicchi sul primo numero e scorri lungo la colonna degli estremi superiori Dove X1 è la media del primo gruppo, X2 la media del secondo… N1 è il totale del primo gruppo, N2 il totale del secondo… 0 : MINIMO 1 : 1°QUARTILE O 25° PERCENTILE (0.25) 2 : 2° QUARTILE O 50° PERCENTILE O MEDIANA (0.50) 3 : 3° QUARTILE O 75° PERCENTILE (0.75) 4 : MASSIMO

La varianza

  1. Scegli la cella
  2. Scrivi “=DEV.ST.P(A:A)”
  3. Ti sposti in una nuova cella

4. Scrivi “=(cella σ )^2”

BOX PLOT

  1. Selezioni i dati della matrice (A:A)
  2. Clicca su “inserisci”
  3. Clicca su “grafici consigliati”
  4. Clicca su “tutti i grafici”
  5. Clicca su “scatola e baffi”
  6. Clicca su “ok” Grafico con più dati (sesso, età, famiglia)
  7. Metti vicine le tre colonne
  8. Col cursore segnale tutte e tre
  9. Passaggi dal 2 al 6 già fatti prima GRAFICI Alcuni grafici richiedono prima la tabella pivot come: grafici a barre, grafici a colonne, l’istogramma e grafici a torta
  10. Creare la tabella pivot in un foglio nuovo
  11. Segnare tutta la tabella col cursore
  12. Cliccare su “inserisci”
  13. Cliccare su “grafici consigliati”
  14. Scegli il grafico
  15. Clicchi su “ok” ISTOGRAMMA
  16. Selezionare la colonna
  17. Clicca su “inserisci”
  18. Clicca su “grafici consigliati”
  19. Clicca su “tutti i grafici”
  20. E scegliamo istogramma Excel, in questo modo, ha deciso autonomamente in quante classi di valori suddividere i dati e da dove cominciano e finiscono. Lui produce casi di ampiezza uguale, dopo di che posso agire su quanti classi produce; quindi, quanti rettangolini adiacenti io mi ritroverò.
  21. Cliccare con il tasto destro l’asse
  22. Cliccare “formato asse”
  23. Cliccare “formato serie di dati” A questo punto spunta un pannello e: possiamo decidere l’ampiezza delle classi o di dirgli quante ne voglio; quindi gestiamo la larghezza dei Bin –classi di valori nei quali si organizza la variabile -(parola inglese che indica il rettangolo). GRAFICO ANDAMENTO TEMPORALE (PIÙ VARIABILI)
  24. Segni i dati (es anni, numero studenti corso)
  25. Clicca su “inserisci”
  26. Clicca su “grafici consigliati”
  1. Clicca su “grafico a linee”
  2. Clicco il tasto desto sul grafico
  3. Clicco su “seleziona dati”
  4. Clicco su “etichette assi”
  5. Le modifico a mio piacimento STATISTICA BIVARIATA DISTRIBUZIONI DOPPIE DI FREQUENZA ELABORAZIONI a) Seleziona le due colonne assieme (delle due variabili ‘lavoro’ e ‘mi manca l’aula reale’) b) Clicca su “ inserisci tabella pivot ”, la mettiamo sullo stesso foglio; c) Ci chiederà di fare una scelta che consiste nello scegliere quale variabile mettere sulle righe e quale sulle colonne. In particolare, se c’è modo di pensare che una variabile influenzi l’altra, la variabile che gioca il ruolo della x, si tende a mettere sulle righe, mentre quella che gioca il ruolo della y si mette sulle colonne. e) Stiamo attenti che venga fuori il conteggio e non la somma o altro. Una volta creata la tabella, possiamo notare come il totale complessivo sia formato da 249 e non 319, questo perché ogni volta che c’è un mancante tra le viabili l’incrocio non si può determinare e quindi viene omesso. Questo è il motivo per cui, a volte, la numerosità n che compare in tabella è minore dell’ampiezza complessiva del dataset. f) Vediamo anche che ci sono delle celle vuote , poiché non c’è nessuno nel collettivo che ad esempio, come possiamo vedere in tabella, lavora a tempo pieno a cui non manca l’aula reale. Ora cosa possiamo fare su questa tabella? Possiamo commentare i numeri e per lavorarci sopra, possiamo fare due cose:
  6. Possiamo copiarcela sotto, facendo “ incolla speciale valori ” in modo da non essere vincolati dai legami interni che ci sono in una tabella a doppia entrata
  7. Oppure possiamo ragionare sul modo in cui vogliamo che Excel ci presenti i risultati. g) Adesso, cliccando il tasto destro sulla tabella e cliccando su “ mostra elenco campi” , possiamo andare su “ conteggio” , impostazioni del campo valori, clicchiamo su “ mostra valori come ” e apriamo la finestra, abbiamo molte più opzioni, poiché questa volta stiamo lavorando su una tabella a doppia entrata: -Possiamo ad esempio dirgli che vogliamo vedere le percentuali del totale complessiva e quindi excel rapporterà ogni frequenza al totale generale, ottenendo le frequenze relative congiunte -Oppure possiamo dirgli che li vogliamo espresse come percentuale del totale di colonna , vedendo le frequenze condizionate al percentuale di colonna -Oppure possiamo cliccare sul percentuale del totale di riga. h) Adesso per lavorare sui lavori ci incolliamo i valori della tabella sotto, così da avere sia i valori su cui lavorare sia la tabella a disposizione. (con l’opzione “incolla speciali valori”) i) Dopo aver ricopiato in basso la tabella con “ incolla speciali valori “, che ci consente di vedere il numero, possiamo andare sempre con il tasto destro a “ mostra elenco campi ”, andare su conteggio e fare “ impostazioni del campo valore ” dopo cliccare su “ mostra valori come ” e scegliamo la prima cioè “ percentuale del totale complessivo ”.
  1. poi blocchiamo la cella in modo da poter trascinare la formula (=C2-$G$3).
  2. trasciniamo così verso giu ripetendo lo stesso calcolo su tutte le y.
  • Se il calcolo è giusto il totale della colonna sarà 0, quindi somma della colonna x’=x- media = 0; somma della colonna y’=y-media = 0.
  • A questo punto non ci resta che fare il diagramma di dispersione su queste due nuove variabili scarto dalla media:
  1. quindi selezioniamo le colonne.
  2. clicchiamo ‘inserisci’
  3. clicchiamo il primo ‘grafico di dispersione’ ed otteniamo lo stesso grafico di prima ma ri centrato in termini di scarti. Gli assi passano per lo zero, la nuvola è la stessa della precedente, ma i valori sono diversi. ➢ Per sistemare il secondo grafico (in quanto le etichette degli assi si sovrappongono ai punti):
  4. clicchiamo sul grafico
  5. tasto destro
  6. formato asse
  7. mettiamo etichette dell’asse in basso all’asse, così che i numeri vadano in basso. CI SONO DEI COMANDI DI EXCEL CHE CALCOLANO DIRETTAMENTE LA COVARIANZA E IL COEFFICIENTE DI CORRELAZIONE LINEARE E LA VARIANZA: “=COVARIANZA.P (selezionare due colonne dati x e y)” COV= “=CORRELAZIONE (selezionare le due colonne)” Per calcolare la varianza ci sono due metodi:
  8. Possiamo fare il quadrato di DEV.ST.P, ottenendo il sigma, prendendone il quadrato.
  9. Oppure direttamente c’è la funzione =VAR.P (selezioniamo le due colonne). REGRESSIONE LINEARE
  10. Diagramma dispersione (grafico)
  11. selezionano quindi le due colone (dati X, che influenza e Y, che viene influenzato)
  12. Un modo facile per proceder e, è mettersi sui punti e cliccare il tasto destro del mouse, poi cliccare su “ aggiungi linea di tendenza ” e si aprirà un pannello che propone diverse forme funzionali. L’opzione che bisogna scegliere è “l ineare ” poiché studiamo questa nel nostro corso.
  13. Dopodiché, essendo sempre nel pannello “aggiungi in linea di tendenza”, scorrendo verso il basso possiamo inserire l’opzione per visualizzare l’ equazione sul grafico e anche il coefficiente di determinazione ( R^2 ).
  14. Esiste un comando su Excel =REGR.LIN (colonna che rappresenta la Y ; colonna che rappresenta la X ; VERO; VERO) che ci dà una tabella con le seguenti informazioni (I “VALORI” sono cose che non abbiamo fatto) BETA 1 BETA 0 VALORE VALORE COEFFICIENTE DETERMINAZIONE R^

VALORE

VALORE VALORE

VALORE VALORE

STATISTICA INFERENZIALE

AREA SOTTEESA ALLA CURVA NORMALE

  1. La prima funzione è =DISTRIB.NORM.N (x; media; dev_standard; cumulativo) e ci calcola il valore della funzione di ripartizione sotto una variabile normale, la probabilità sotto una curva normale fino al valore x che fissiamo, però dobbiamo fornire alcune informazioni fino a che punto calcolare l’integrale cioè dove si deve fermare; la media; sigma. Quindi è come se facesse una cumulata delle frequenze relativa, dove la frequenza relativa l’analogo logico della probabilità.
  2. L’altra funzione sfrutta la funzione introdotta precedentemente. Quindi utilizzando quella funzione, che ci dà l’area fino al punto, possiamo trovare le aree sottese a specifici intervalli. Questa funzione si chiama =INV.NORM.N , essa ci risolve il problema inverso, cioè mentre prima dicevamo qual era il valore di x e volevamo sapere l’area alla sinistra di x; quindi, volevamo trovare la cumulata delle probabilità fino a x, il problema inverso consiste nel dire qual è il valore che stacca sotto la curva esattamente quest’area che vogliamo trovare , che poi è quello che facevamo quando calcolavamo i percentili, quartili ecc.

Con la funzione =DISTRIB.NORM.N(X; MEDIA( μ ); SIGMA(σ), CUMULATIVO) trova il

valore della funzione di ripartizione sotto una variabile normale ovvero la probabilità sotto la curva fino al valore x (area alla sx della curva in cui troviamo la probabilità di trovare un punto fino al massimo di x, ovvero da -∞ ad x ); restituisce l’integrale, il valore detto a (l’area); è come se facesse una cumulata delle frequenze relative. Sapere l’area e trovare il valore di X che stacca quella determinata porzione dell’area sotto la

curva si risolve con la funzione di Excel INV.NORM.N(a; μ ; σ), in cui la parola inv sta a

sottolineare che si tratta di un problema inverso. Questo è un comando utile in molti contesti, uno fra i quali quello di calcolare i percentili in una distribuzione normale. MARGINE DI ERRORE =CONFIDENZA.NORM(alpha; sigma; n) =CONFIDENZA.T(alpha; stima di sigma; n) COME SI ARRIVA A UNA STIMA INTERVALLARE PARTENDO DA UNA PUNTUALE?

PROPORZIONE

 se l’ipot esi è monodirezionale sinistra  Ci costruiamo il valore empirico del test Ze. a) Se Ze>0 accettiamo H 0 b) Se Ze<0 calcoliamo la probabilità cumulata fino a Ze, quindi mettiamo a confronto il pvalue con a attraverso la funzione =DISTRIB.NORM.ST.N(Ze;VERO) e se pvalue<a allora rifiutiamo H 0  se l’ipotesi è monodirezionale destra  Ci costruiamo il valore empirico del test Ze a) Se Ze<0 accettiamo H 0 b) Se Ze>0 calcoliamo la probabilità sottesa alla curva oltre Ze, quindi mettiamo a confronto il pvalue con la funzione =1-DISTRIB.NORM.ST.N(Ze;VERO) e se pvalue<a rifiutiamo H 0.  se l’ipotesi è bidirezionale  Calcoliamo il valore empirico del test Ze a) Dobbiamo guardare entrambe le code quindi la probabilità di avere valori estremi: applichiamo la funzione =1-DISTRIB.NORM.ST.N(Ze;VERO) per ottenere una coda e poi prendiamo il risultato e lo moltiplichiamo per 2 (perché le due code sono simmetriche). Se il pvalue<a rifiutiamo H0.