Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


DATA ANALYSIS - DELLA BEFFA IULM, Appunti di Analisi Dei Dati

riassunto data analysis preparazione esame. laurea magistrale in marketing consumi e comunicazione

Tipologia: Appunti

2020/2021

In vendita dal 08/02/2021

giuliacall
giuliacall 🇮🇹

4.7

(9)

17 documenti

1 / 3

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Angelica Limongelli 1021675
Domanda 1:
- In entrambi i formati, l’ANOVA è significativa poiché p-value < 0.05;
-R-quadro è il quadrato del coefficiente di correlazione r tra x e y, detto ciò si osserva che
nel formato A, R-quadro è uguale a 0,455 che approssimativamente presenta una soglia
‘’bassa’’. Anche nel formato B, l’R-quadro è 0.42 e presenta una soglia ‘’bassa’’;
Per la regressione multipla si preferisce valutare R-quadro corretto: esso valuta la ‘’bontà di
approssimazione’’ ed è utile nel confronto fra modelli ed è sempre più piccolo di R-quadro
ed ha lo scopo di penalizzare variabili indipendenti poco importanti cioè che non
influenzano in alcun modo la variabile dipendente. Nel formato A, R-quadro corretto è 0.44
e nel formato B è di 0.41 quindi i predittori nell’insieme stimano discretamente l’intention
to Buy.
- Nel formato A, gli attributi che influenzano significativamente la nostra variabile
dipendente sono: ‘’è innovativo’’, ‘’è trendy’’ e ‘’ha una forma inconfondibile’’. Questi
attributi hanno un impatto significativo sull’intention to Buy poiché < 0.05. Gli attributi
rimanenti non influenzano l’intention to Buy poiché > 0.005 (soglia convenzionale).
- Nel formato B, gli attributi che influenzano significativamente la variabile dipendente sono
‘’è elegante’’, ‘’è attraente’’ e ‘’ha una forma inconfondibile’’ poiché < 0.05. Tutti gli altri
attributi, essendo >0.05 non hanno alcun impatto significativo sulla variabile dipendente;
E’ possibile anche valutare se i coefficienti influenzano positivamente (segno +) la dipendente e
quindi che la variabile dipendente cresce, in media, al crescere del predittore; In caso contrario, se
il coefficiente è negativo, esso influenza negativamente la variabile dipendente.
Domanda 2:
L’analisi fattoriale è un insieme di tecniche statistiche utilizzate per ricercare l’esistenza di variabili
latenti a partire una serie di variabili osservate.
L’obiettivo dell’analisi fattoriale è capire se queste variabili misurabili sono effettivamente adatte a
spiegare un determinato concetto che per sua natura non può essere direttamente misurato.
Quindi gli obiettivi e le principali applicazioni dell’analisi consistono nel trovare un numero
relativamente piccolo di costrutti che possano riassumere e spiegare in maniera adeguata un
numero più ampio di variabili, in modo da ridurre il numero delle variabili e individuare strutture
nelle relazioni tra le variabili, ovvero classificare le variabili.
i “primi” fattori estratti sono facilmente interpretabili mentre gli “ultimi”, soprattutto se ne sono
stati estratti molti o se la matrice delle correlazioni iniziale fra le variabili contiene molti valori
bassi, sono spesso difficilmente interpretabili o saturi di una sola variabile e quindi fattori specifici
di quella variabile.
L’interpretazione delle componenti si basa sulla matrice di struttura che rappresenta la relazione
tra variabili e componenti. Se si estraggono tutte le componenti si produce esattamente la
varianza della matrice dei dati, con meno componenti si sintetizza maggiormente il fenomeno e
infine con più componenti se ne spiega una percentuale maggiore.
Per esempio: Il fattore 1 è quello che sintetizza maggiormente la “qualità” di tutte le componenti.
Nel fattore 2 andiamo ad individuare le componenti principali con i pesi più alti (in valore assoluto)
dando un nome che sintetizzi le componenti prese in considerazione e così via per gli altri fattori..
pf3

Anteprima parziale del testo

Scarica DATA ANALYSIS - DELLA BEFFA IULM e più Appunti in PDF di Analisi Dei Dati solo su Docsity!

Angelica Limongelli 1021675 Domanda 1:

  • In entrambi i formati, l’ANOVA è significativa poiché p-value < 0.05;
  • R-quadro è il quadrato del coefficiente di correlazione r tra x e y, detto ciò si osserva che nel formato A, R-quadro è uguale a 0,455 che approssimativamente presenta una soglia ‘’bassa’’. Anche nel formato B, l’R-quadro è 0.42 e presenta una soglia ‘’bassa’’; Per la regressione multipla si preferisce valutare R-quadro corretto: esso valuta la ‘’bontà di approssimazione’’ ed è utile nel confronto fra modelli ed è sempre più piccolo di R-quadro ed ha lo scopo di penalizzare variabili indipendenti poco importanti cioè che non influenzano in alcun modo la variabile dipendente. Nel formato A, R-quadro corretto è 0. e nel formato B è di 0.41 quindi i predittori nell’insieme stimano discretamente l’intention to Buy.
  • Nel formato A, gli attributi che influenzano significativamente la nostra variabile dipendente sono: ‘’è innovativo’’, ‘’è trendy’’ e ‘’ha una forma inconfondibile’’. Questi attributi hanno un impatto significativo sull’intention to Buy poiché < 0.05. Gli attributi rimanenti non influenzano l’intention to Buy poiché > 0.005 (soglia convenzionale).
  • Nel formato B, gli attributi che influenzano significativamente la variabile dipendente sono ‘’è elegante’’, ‘’è attraente’’ e ‘’ha una forma inconfondibile’’ poiché < 0.05. Tutti gli altri attributi, essendo >0.05 non hanno alcun impatto significativo sulla variabile dipendente; E’ possibile anche valutare se i coefficienti influenzano positivamente (segno +) la dipendente e quindi che la variabile dipendente cresce, in media, al crescere del predittore; In caso contrario, se il coefficiente è negativo, esso influenza negativamente la variabile dipendente. Domanda 2: L’analisi fattoriale è un insieme di tecniche statistiche utilizzate per ricercare l’esistenza di variabili latenti a partire una serie di variabili osservate. L’obiettivo dell’analisi fattoriale è capire se queste variabili misurabili sono effettivamente adatte a spiegare un determinato concetto che per sua natura non può essere direttamente misurato. Quindi gli obiettivi e le principali applicazioni dell’analisi consistono nel trovare un numero relativamente piccolo di costrutti che possano riassumere e spiegare in maniera adeguata un numero più ampio di variabili, in modo da ridurre il numero delle variabili e individuare strutture nelle relazioni tra le variabili, ovvero classificare le variabili. i “primi” fattori estratti sono facilmente interpretabili mentre gli “ultimi”, soprattutto se ne sono stati estratti molti o se la matrice delle correlazioni iniziale fra le variabili contiene molti valori bassi, sono spesso difficilmente interpretabili o saturi di una sola variabile e quindi fattori specifici di quella variabile. L’interpretazione delle componenti si basa sulla matrice di struttura che rappresenta la relazione tra variabili e componenti. Se si estraggono tutte le componenti si produce esattamente la varianza della matrice dei dati, con meno componenti si sintetizza maggiormente il fenomeno e infine con più componenti se ne spiega una percentuale maggiore. Per esempio: Il fattore 1 è quello che sintetizza maggiormente la “qualità” di tutte le componenti. Nel fattore 2 andiamo ad individuare le componenti principali con i pesi più alti (in valore assoluto) dando un nome che sintetizzi le componenti prese in considerazione e così via per gli altri fattori..

Per svolgere quindi un’analisi fattoriale bisogna:

  1. Identificare la matrice sulla quale si svolgerà l’analisi. Solitamente si considera la matrice di correlazione R o la matrice di varianze e covarianze
  2. Stabilire il numero di fattori da estrarre
  3. Definire il criterio di estrazione dei fattori
  4. Determinare il criterio di rotazione degli assi ortogonali trovati.
  5. Calcolare i punteggi fattoriali, valore che una unità statistica ha sul fattore, valutare e interpretare i fattori. Domanda 3: I riferimenti sono uno strumento importante per sfruttare al meglio le funzioni excel, per utilizzarne a pieno il potenziale occorre soffermarsi sulle differenze fra indirizzi relativi e assoluti. Si definisce riferimento relativo un riferimento che cambia durante le operazioni di copia formula. Il copia formula è uno strumento di Excel che permette di risparmiare tempo nel caso in cui una moltitudine di celle deve essere riempita con la stessa formula. Quindi il riferimento relativo è un riferimento che indica la posizione di una cella in funzione della cella che lo contiene. Riferimenti perché si riferiscono al contenuto delle celle, relativi perché non indicano una cella precisa del foglio, ma la distanza dalla cella in cui si trova la formula. Cambiando la cella della formula cambia il nome del riferimento relativo, ma non la distanza. Esempio: Nella cella A1 è inserita la formula =A2+B2. Si esegue un’operazione di copia formula orizzontale nelle celle B1 e C1. Trattandosi A2 e B2 di riferimenti relativi, nelle celle B1 e C cambierà la colonna di riferimento. Nella cella B1 si visualizzerà: =B2+C2; mentre nella cella C1 si visualizzerà =C2+D2. I riferimenti relativi sono quelli più utilizzati nelle formule, perché permettono di copiare le formule in molte righe. Ci sono però dei casi nei quali il riferimento ad una cella deve essere costante (cioè "assoluto") indipendentemente dalla posizione della cella in cui viene copiato. Un riferimento assoluto, quindi, è un riferimento che non cambia durante le operazioni di copia formula. Per rendere assoluto un riferimento si utilizza il simbolo $ e questo significa utilizzare i riferimenti assoluti. A differenza dei relativi, utilizzando i riferimenti assoluti nelle formule, si indica ad Excel di memorizzare proprio il nome della cella, non la distanza. Ritornando all’esempio precedente: Nella cella A1 è inserita la formula =$A$2+$B$2. Si esegue un’operazione di copia formula orizzontale nelle celle B1 e C1. Questa volta per, dato che A2 e B2 sono stati resi riferimenti assoluti, nelle celle B1 e C1 non cambierà nulla. Pertanto in queste due celle visualizzeremo =$A$2+$B$2. Concludendo possiamo dire che i riferimenti relativi memorizzano la distanza dalla cella della formula, il nome della cella cambia a seconda di dove si copia la formula, sono cioè relativi alla