Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica Descrittiva: Concetti Fondamentali e Applicazioni, Appunti di Analisi Statistica

Una panoramica completa dei concetti fondamentali della statistica descrittiva, esplorando le diverse tipologie di variabili, le scale di misura e i metodi di analisi dei dati. L'importanza della statistica descrittiva per comprendere e interpretare i dati, fornendo esempi concreti di applicazioni in diversi campi, come la psicologia e le neuroscienze.

Tipologia: Appunti

2023/2024

Caricato il 07/02/2025

AuroraLN
AuroraLN 🇮🇹

27 documenti

1 / 30

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Per l’esame : le tabelle di verità, la teoria riguardante i dati e la
misurazione in psicologia.
SOFTWARE E ANALISI STATISTICA
PRIMA LEZIONE : Il concetto di software. Una breve introduzione al calcolatore
universale
Software = indica l’insieme delle componenti intangibili di elaborazione. Non si
riferisce agli aspetti elettronici (o meccanici) della macchina, ma alla componente
che permette l’elaborazione dei dati, attraverso le istruzioni per specifici compiti
date in linguaggio macchina.
Si contrappone al concetto di “hardware” che corrisponde alla parte
materiale/tangibile/fisica dello stesso sistema.
Il calcolatore è una macchina di calcolo in grado di eseguire calcoli matematici ed è
infatti formato da 2 parti : il software (parte logica composta dai programmi di
calcolo) e l’hardware ( parte meccanica/elettronica/elettrica).
I software nel campo psicologico possono avere 2 compiti :
A. Somministrare esperimenti (online/offline)
B. Analizzare i dati
Ogni cosa che visualizziamo sul nostro pc o dispositivo è originata dal codice
sorgente, che scritto in linguaggio macchina consente di elaborare le informazioni e
generarne altre e produrre un’interfaccia grafica.
Codice sorgente = è il testo di un algoritmo di un programma scritto in un
determinato linguaggio macchina di programmazione .
1.1 Breve storia del calcolatore universale
A. Gottfried Wilhelm von Leibniz (1646-1716)
+ Figlio di un docente universitario di filosofia morale, ottenne il titolo di
«baccelliere» sia in filosofia che in giurisprudenza.
+ Sognò di creare un alfabeto speciale in cui i simboli non stessero per suoni, ma per
concetti = calcoli matematici consentirebbero di trovare ogni soluzione a problemi di
natura logico-concettuale
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e

Anteprima parziale del testo

Scarica Introduzione alla Statistica Descrittiva: Concetti Fondamentali e Applicazioni e più Appunti in PDF di Analisi Statistica solo su Docsity!

Per l’esame : le tabelle di verità, la teoria riguardante i dati e la

misurazione in psicologia.

SOFTWARE E ANALISI STATISTICA

PRIMA LEZIONE : Il concetto di software. Una breve introduzione al calcolatore universale Software = indica l’insieme delle componenti intangibili di elaborazione. Non si riferisce agli aspetti elettronici (o meccanici) della macchina, ma alla componente che permette l’elaborazione dei dati, attraverso le istruzioni per specifici compiti date in linguaggio macchina. Si contrappone al concetto di “hardware” che corrisponde alla parte materiale/tangibile/fisica dello stesso sistema. Il calcolatore è una macchina di calcolo in grado di eseguire calcoli matematici ed è infatti formato da 2 parti : il software ( parte logica composta dai programmi di calcolo) e l’hardware ( parte meccanica/elettronica/elettrica ). I software nel campo psicologico possono avere 2 compiti : A. Somministrare esperimenti (online/offline) B. Analizzare i dati Ogni cosa che visualizziamo sul nostro pc o dispositivo è originata dal codice sorgente , che scritto in linguaggio macchina consente di elaborare le informazioni e generarne altre e produrre un’i nterfaccia grafica. Codice sorgente = è il testo di un algoritmo di un programma scritto in un determinato linguaggio macchina di programmazione. 1.1 Breve storia del calcolatore universale A. Gottfried Wilhelm von Leibniz (1646-1716)

  • Figlio di un docente universitario di filosofia morale, ottenne il titolo di «baccelliere» sia in filosofia che in giurisprudenza.
  • Sognò di creare un alfabeto speciale in cui i simboli non stessero per suoni, ma per concetti = calcoli matematici consentirebbero di trovare ogni soluzione a problemi di natura logico-concettuale
  • Inventò una macchina per il calcolo che grazie alla «ruota di Leibniz» consentiva di fare automaticamente tutte le 4 operazioni (La «Pascalina» di Pascal consentiva di fare solo somma e sottrazione).
  • Fu uno dei più importanti matematici del suo tempo: elaborò le proprietà di integrazione e derivazione da cui è tratto il calcolo infinitesimale (lo stava facendo nello stesso momento anche Newton!). Il carattere universale: questo linguaggio simbolico sopra il quale sarebbe stato possibile fare delle operazioni di calcolo ratiocinator (logica simbolica) doveva abbracciare tutti i ragionamenti dello scibile umano ( logica + linguaggio + matematica). Calculus ratiocinator

Dire che B è in L o che L contiene B è lo stesso che dire che L può essere fatto coincidere con una pluralità di termini assunti insieme, uno dei quali è B === B ⊕ N = L ⊕ è Simbolo di somma logica che indica l’insieme di B e N che nella loro totalità creano L È diverso dalla somma algebrica perché in algebra 2+2 = 4 Mentre nel calcolo ratiocinator A ⊕ A = A

B. George Boole (1815-1864)

  • Figlio di un calzolaio Inglese che a stento riusciva a sfare tutti i 4 figli, ma con la passione per l’astronomia.
  • Divenne famoso a 14 anni perché una sua rivista pubblicò una sua traduzione dal Greco di Melagro.
  • Studiò da autodidatta Greco, Latino, Francese e Tedesco, divenne insegnante a 16 anni e aprì a 19 anni una sua scuola a Lincoln.
  • L’insegnamento gli consentì di avere per le mani molti libri di matematica da cui partì per studiarla, pubblicare articoli fino a diventare professore al Queen’s College di Cork.
  • Si rifà ad un enunciato logico aristotelico : (premessa maggiore) Tutti gli uomini sono mortali (premessa minore) Tutti i greci sono uomini (conclusione) Tutti i greci sono mortali

 L(1-T) = 0

 T = 0

 SG = 1

 SGN (1-A) = 0

 N = 1

C. Gottlob Frege (1848-1925)

  • Ottenne a Göttingen il dottorato in matematica , fu Professore a Jena dove restò per tutta la carriera professore associato senza ottenere l’ordinariato perché il suo lavoro non piaceva ai colleghi.

  • A lui dobbiamo la sistematizzazione del linguaggio simbolico per i concetti sognato da Leibniz.

  • Crea un nuovo linguaggio introducendo :

  1. Il quantificatore universale ∀ = tutti
  2. Il quantificatore esistenziale ∃ = identificare l’esistenza di caratteristiche specifiche
  3. Ragionamento sempre impostato con il criterio “ se … allora” = ⊃

Esercizio di Boole con i simboli di Frege :

  1. Alan Turing (1912-1954)
  • Matematico e don all’Università di Cambridge, teorizzò nel suo “On computable numbers” (1937) i primi passi del suo metodo di calcolo universale.
  • Decise di porsi al di fuori delle problematiche di dimostrabilità matematica per indicare un metodo di computazione algoritmica automatica.
  • Durante la seconda Guerra mondiale le sue macchine “bomba” consentirono di decodificare i messaggi cifrati dalla macchina tedesca Enigma e di consentire agli alleati una strategia militare di successo.
  • Le macchine di Turing Sono il risultato di un’interazione tra aspetti di hardware e software e consentono di computare algoritmi = qualsiasi operazioni di computo
  • Turing pensava che a partire da queste macchine, fornendo regole di base sempre più ampie le macchine sarebbero potute arrivare ad affrontare i compiti più complessi effettuati dall’essere umano, come una partita di scacchi.
  • Il suo prototipo di calcolatore universale, dopo la guerra, l’ACE era l’unico a impostare un numero così ampio di funzioni di base (a partire dalle 4 operazioni) da consentire di eseguire con agilità molti tipi di computazioni.
  • Turing era convinto nella possibilità di un calcolatore universale perché riteneva che la mente umana approcciasse proprio così i problemi, partendo da serie di operazioni di base che integrate consentono di risolvere qualsiasi problema e di giungere a deduzioni. Come funzionavano?
  • La macchina analizza il nastro una cella per volta , iniziando da quella che contiene il simbolo più a sinistra nel nastro.
  • La macchina deve creare uno spazio vuoto e far slittare l’ultimo numero a destra prima di computare la successiva operazione.
  • Dando alcune regole di base la macchina computa ogni calcolo Esempio = La macchina deve dire se il numero 943 è pari o dispari. Noi guarderemmo l’ultima cifra e concluderemmo che se l’ultimo numero è 1-3-5-7- allora è disperi e se mai è pari. La macchina non può fare così perché vede prima i numeri a sinistra e arriva a quello su cui focalizzarsi per ultimo.
  • Ci sono 4 stati per la macchina : Q, O, E, F Es : 943
  • Stato Q → Se Q = 9 leggi il numero e cancellalo, vai a E = 43
  • Stato E→ Se E = 4 leggi il numero e cancellalo, vai a F = 3
  • Operazionalizzare: definire le domande e i metodi di misura che ci consentono di cogliere la più ampia gamma di aspetti che definisce un costrutto psicologico.
  • Costrutto psicologico: entità ipotetica non direttamente misurabile ma che si può cogliere tramite la misurazione di variabili che lo rappresentano. Si riferisce a stati mentali, aspetti cognitivi e tutti i concetti psicologici.
  • Scaling: consente di stabilire il metodo di misurazione di una variabile→ decidere con che scala e gradazione quella parte di costrutto verrà misurato Le variabili possono essere : qualitative VS quantitative Le variabili possono essere : discrete VS continue  Variabili qualitative : i suoi valori non sono valori ma modalità (es. lo stato civile , il genere , il titolo di studi , il colore preferito ecc … )  Variabili quantitative : i suoi valori sono espressi tramite valori numerici ( es. reddito , numero di figli , il voto di un esame , l’altezza)  Variabili discrete : variabili che possono assumere un numero finito di valori e hanno numeri interi ( es. accuratezza , numero di bambini in una classe ecc …)  Variabili continue : variabili che possono assumere un numero infinito di valori diversi tra loro e con la virgola o non interi (es. secondi , temperatura , peso ecc … ) Le scale di misura possono essere :
  • Scala nominale: l’unica proprietà dei numeri che si può trasferire è l'unicità: ogni numero è unico e pertanto attribuisce un’etichetta diversa agli oggetti/soggetti con intensità diverse di una proprietà e/o qualità misurata. → Etichetta! Es.: il numero di registro di uno studente
  • Scala ordinale: Le scale ordinali, infatti, hanno a che fare con le relazioni ordinali tra i numeri. → Ordine! Es.: I, II, III classificato
  • Scala a intervalli: Le scale ad intervalli sono quelle in cui è possibile fissare un'unità di misura arbitraria ed uno zero arbitrario, condizioni necessarie per trasferire la proprietà additiva dei numeri. Affinché ciò sia possibile, è necessario che i numeri assegnati alle intensità osservate del fenomeno siano numeri cardinali. → tra -5 e 0, c’è la stessa distanza che tra 0 e 5. Es.: Temperatura in gradi Celsius
  • Scala a rapporti: Rispetto alla scala a intervalli, la scala di rapporti in più possiede uno zero assoluto, ossia un valore della scala sotto il quale non si può scendere. Solo grazie alla presenza dello zero assoluto le operazioni di moltiplicazione e divisione tra le misure sono ammissibili. Es.: N° di volte in cui siete andati in palestra. Logica delle scale di misura :
  • Scala nominale:
  1. ogni classe deve essere non vuota (esaustività);
  2. classi diverse devono essere disgiunte (distinte);
  3. ogni unità deve appartenere ad una e una sola classe (reciprocamente esclusive);
  4. tutte le unità incluse in una stessa classe sono equivalenti: ossia se A e B appartengono alla stessa classe, allora A e B sono equivalenti. A=B e B=C ⇒ A=C
  • Scala ordinale: Considerati due qualsiasi elementi, A e B, appartenenti a classi diverse, la scala ordinale consente di stabilire se A precede B (A ≺ B ), o se B precede A ( B ≺ A); oppure, invertendo la direzione dell’ordinamento se A segue B (A; B) o B segue A (B ; A) → Ordine!
  • Scala a intervalli:
  1. se x = y , non è vero che x < y e non è vero che y < x ;
  2. se x = y e x z <⇒< zy ;
  3. se x = y se non è vero che x < z , non è vero neppure che y < z TERZA LEZIONE : Cosa sono i dati?
  • I dati sono rappresentazioni grezze, cioè non interpretate, di un fenomeno, evento, o fatto, o parte di esso.
  • I dati sono codificati attraverso attraverso simboli o combinazioni di simboli.
  • Solo quando elaborati e combinati ci consentono di ottenere una informazione. 3.1 I dati in informatica
  • qualsiasi entità che può essere elaborata o trasformata da un computer ( o più in generale da un automa ) per mezzo dell'esecuzione di un algoritmo.
  • Booleani
  • un ID cookie*;
  • l’identificativo pubblicitario del proprio telefono;
  • i dati conservati in un ospedale o da un medico, che possono essere un simbolo che identifica univocamente una persona. Protezione dei dati
  • In Italia, come a livello Europeo, i dati personali sono protetti dal garante per la protezione dei dati personali e dal Regolamento Generale UE per la protezione dei dati GDPR 2016/679 (Aggiornato il 23 maggio 2018).
  • La legge GDPR regola il trattamento e la protezione dei dati.
  • Indica cioè a coloro (aziende, istituti clinici, ricercatori, ecc…) che raccolgono e utilizzano dati quali sono i principi generali e specifici a cui si devono attenere:
  1. Liceità, correttezza e trasparenza
  2. Limitazione della finalità
  3. Minimizzazione dei dati
  4. Esattezza
  5. Limitazione della conservazione
  6. Integrità e riservatezza
  7. Liceità, correttezza e trasparenza Le organizzazioni devono assicurarsi che le loro attività di raccolta dei dati personali degli utenti non infrangano la legge e che non nascondano nulla agli interessati → mettere a disposizione del pubblico l’informativa sulla privacy
  8. Limitazione della finalità Le aziende dovrebbero raccogliere i dati personali solamente per uno scopo preciso, scopo che va indicato in modo chiaro nell’informativa sulla privacy. Inoltre, tali dati vanno tenuti solo per il tempo necessario a completare lo scopo per cui sono stati raccolti.
  9. Minimizzazione dei dati Le organizzazioni possono elaborare solo i dati personali necessari al raggiungimento della finalità per i quali sono trattati.
  10. Esattezza

Devono essere adottate tutte le misure ragionevoli per cancellare o rettificare tempestivamente i dati inesatti. Una volta che il titolare o il responsabile del trattamento ha ricevuto tale richiesta da parte dell’interessato, ha 30 giorni di tempo per eseguirla.

  1. Limitazione della conservazione Le organizzazioni devono eliminare i dati personali quando non sono più necessari ai propri scopi.
  2. Integrità e riservatezza I dati personali devono essere “trattati in maniera da garantire un’adeguata sicurezza dei dati personali, compresa la protezione, mediante misure tecniche e organizzative adeguate, da trattamenti non autorizzati o illeciti e dalla perdita, dalla distruzione o dal danno accidentali”. 3.4 I dati in psicologia e neuroscienze  Riguardano sempre e comunque la persona.
  • Non si limitano solo ai dati personali indicati in precedenza.
  • Rispettano la legge sul trattamento dei dati.
    • Sono trattati in maniera anonima e aggregata: non vengono registrati con il nome e cognome del partecipante e vengono fatte analisi riguardanti tutto il campione e non il singolo individuo. → Lo scopo non è una restituzione clinica (se non prevista dal progetto di ricerca)

Che cos’è un CAMPIONE? E’ un sottoinsieme di unità (persone nel nostro caso) estratto da una più ampia popolazione di riferimento di cui deve essere rappresentativo. Esempi di dati in neuroscienze e in psicologia

  • Dati anagrafici (età, genere, scolarità, professione);
  • Risposte a questionari e domande scritte o fatte a voce;
  • Indici di prestazione (es. L’accuratezza in test di performance o i tempi di reazione)
  • Dati di Neuroimaging (TAC, MRI, fMRI, PET)
  • Tracciati EEG

Pulizia dei dati, è il processo di standardizzazione dei dati. Include la gestione dei dati mancanti, la correzione di errori di dati e la rimozione di eventuali valori anomali.

  • E – Esplorazione dei dati L'esplorazione dei dati è un'analisi preliminare dei dati che viene utilizzata per pianificare ulteriori strategie di modellazione dei dati.
  • M – Modellamento dei dati Gli algoritmi software e di machine learning vengono utilizzati per ottenere informazioni più dettagliate, prevedere i risultati e prescrivere la serie di operazioni più adeguata. Vengono applicate tecniche di machine learning come l'associazione, la classificazione e il clustering. Molto spesso la mole di dati richiede l’applicazione di soluzioni per i BIG DATA.
  • N – Interpretazione dei risultati I data scientist collaborano con analisti e aziende per convertire le informazioni dettagliate sui dati in operazioni. Creano diagrammi, grafici e diagrammi per rappresentare tendenze e previsioni. La sintesi dei dati aiuta le parti interessate a comprendere e implementare i risultati in modo efficace. Processi del metodo scientifico DOMANDA ESAME I processi del metodo scientifico:
  • Ipotesi Formulazione di domande di ricerca e di specifiche predizioni sulla base di come si Ipotizza che uno specifico fenomeno funzioni, in base a quanto già noto in letteratura.
  • Test sperimentale Elaborazioni di uno o più compiti sperimentali (es. un task oppure un questionario da compilare) e pianificazione della loro modalità di somministrazione.
  • Raccolta dati Raccolta dei dati, cioè somministrazione della prova a un campione precedentemente identificato.
  • Scoring

Conversione dei dati dal formato di raccolta (cartaceo/computerizzato) in un dataset organizzato per l’analisi dei dati, contenente tutte le variabili associate a ogni caso appropriatamente codificate.

  • Esplorazione dei dati Tramite statistiche descrittive e grafici per esplorarne la distribuzione e il grado di varianza.
  • Modellamento dei datiANALISI STATISTICA Analisi dei dati tramite metodi Statistici Frequentisti, Bayesiani o di Machine Learning.
  • Interpretazione dei risultati Discussione dei risultati sulla base delle ipotesi e della letteratura.

  • Il nostro cervello elabora in continuazione dati che provengono dalla realtà che ci circonda e li trasforma in informazioni che la nostra mente utilizza per prendere decisioni o fare considerazioni sul mondo.
  • Il grande lavoro sull’Intelligenza Artificiale degli ultimi anni cerca proprio di riprodurre questo processo. QUARTA LEZIONE : L’algebra delle relazioni logiche Enunciato logico aristotelico:
  • (premessa maggiore) Tutti gli uomini sono mortali
  • (premessa minore) Tutti i greci sono uomini
  • (conclusione) Tutti i greci sono mortali Boole comprende che ‘uomini’ e ‘mortali’ sono «classi» che possono essere rappresentati da lettere o numeri (operatori), che possono essere messi in relazione mediante proprietà algebriche. Esempio: La combinazione di tutti gli x e y è espressa con xy
  • x = uomini mortali
  • y = greci
  • xy = uomini mortali che sono anche greci ---La logica Booleana
  1. Il prodotto fra due o più variabili fornisce il valore 1 solo se tutte le variabili assumono il valore di 1. Si scrive = xy Esempio pratico: Se x = Uomini Mortali Se y = Greci xy = uomini greci mortali Perché uomini = greci & mortali = greci
  2. La somma fra due o più variabili fornisce il valore 1 solo se una delle due variabili assume il valore di 1.

Come si scrive = x + y ; x or y Esempio pratico: Se x = Donne mortali Se y = Uomini mortali x or y = uomini o donne mortali

PER VEDERE COME FUNZION SU EXCEL GUARDA DIRETTAMENTE LE SLIDES

QUINTA LEZIONE : Excel e l’organizzazione di un database Un database è formato da colonne (C) e da righe (R). All’interno delle celle vengono inserite delle matrici. L’insieme di colonne , righe e dati forma il database o data frame. SCORING DEI DATI : formazione di una matrice grazie all’inserimento di dati nel database == Ho dati grezzi , che devo trasformare in punteggi (standardizzazione) Datamakeup vs scoring ( datamakeup = Database = ogni riga corrisponde a un soggetto e ogni colonna ad una variabile Caratteristiche dei database = cose da avere : info demografiche utili per ritrovare il partecipante , SESTA LEZIONE : Statistiche descrittive e grafici riassuntivi Che cos’è la statistica descrittiva? E’ quella parte del lavoro statistica che si occupa di riassumere e classificare i dati ottenuti fornendo:

  1. Ordinato cronologicamente : i dati e le variabili in tabella sono ordinati in ordine cronologico.
  2. Ordinato per frequenza : i dati e le variabili sono ordinati dal più frequente al meno frequente.
  3. Rappresentazione percentuale : i dati vengono ordinati secondo un criterio di frequenza , che viene espressa anche tramite percentuali.
  4. Frequenze e percentuali cumulate : data una tabella con variabili e dati annessi , ogni variabile viene aggiunta alla precedente per formare un nuovo dato , anche sotto forma di percentuale.

Le frequenze e le percentuali sono visualizzabili anche tramite grafici a barre , grafici a torta e diagrammi.

Grafici a barre

Grafico a torta

Diagramma

  • Tabelle di contingenza
  • Servono quando vogliamo incrociare le frequenze provenienti da due variabili nominali: Variabile 1 : righe Variabile 2 : colonne
  • Variabili quantitative e analisi descrittive