Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Data mining - DATA MINIG, Appunti di Strategia d'impresa

PRIMO ANNO appunti di varie materie tipo strategia ,data mining, economia industriale corso avanzato

Tipologia: Appunti

2020/2021

Caricato il 28/04/2021

melisa-ceku
melisa-ceku 🇮🇹

5

(1)

1 documento

1 / 17

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
DOMANDE SU RICHIAMI GENERALI
1) Un versore è:
a) una matrice di dimensione unitaria
ok) un vettore di norma (o modulo) unitaria
c) nessuno dei precedenti
2) Un versore è:
a) una matrice di dimensione unitaria
b) un vettore di dimensione unitaria
ok) nessuno dei precedenti
3) Un vettore nullo è:
ok) Un vettore di modulo 0
4) L’affermazione “la somma tra due vettori ha come risultato un vettore” è:
ok) vera
b) falsa
c) vera solo se i vettori sono non nulli
5) La somma di due vettori è:
ok) Un altro vettore
6) L’affermazione “la somma tra due vettori ha come risultato una matrice è:
a) vera
ok) falsa
c) vera solo se i vettori sono non nulli
7) Siano A una matrice, k uno scalare ed u un vettore non nullo. L’equazione Au=ku ha soluzione
se:
a) tr(A – kI) = 0
b) tr(A- kI) diverso da 0
ok) nessuno dei precedenti
8) Una matrice diagonale è caratterizzata dal fatto che:
a) sono nulli tutti gli elementi lungo la diagonale principale
ok) sono nulli tutti gli elementi fuori la diagonale principale
c) nessuno dei precedenti
9) Le matrici di distanza sono:
a) matrici unità-variabile
ok) matrici unità-unità
c) matrici variabile-variabile
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Anteprima parziale del testo

Scarica Data mining - DATA MINIG e più Appunti in PDF di Strategia d'impresa solo su Docsity!

DOMANDE SU RICHIAMI GENERALI

  1. Un versore è: a) una matrice di dimensione unitaria ok) un vettore di norma (o modulo) unitaria c) nessuno dei precedenti
  2. Un versore è: a) una matrice di dimensione unitaria b) un vettore di dimensione unitaria ok) nessuno dei precedenti
  3. Un vettore nullo è: ok) Un vettore di modulo 0
  4. L’affermazione “la somma tra due vettori ha come risultato un vettore” è: ok) vera b) falsa c) vera solo se i vettori sono non nulli
  5. La somma di due vettori è: ok) Un altro vettore
  6. L’affermazione “ la somma tra due vettori ha come risultato una matrice è: a) vera ok) falsa c) vera solo se i vettori sono non nulli
  7. Siano A una matrice, k uno scalare ed u un vettore non nullo. L’equazione Au=ku ha soluzione se: a) tr(A – kI) = 0 b) tr(A- kI) diverso da 0 ok) nessuno dei precedenti
  8. Una matrice diagonale è caratterizzata dal fatto che: a) sono nulli tutti gli elementi lungo la diagonale principale ok) sono nulli tutti gli elementi fuori la diagonale principale c) nessuno dei precedenti
  9. Le matrici di distanza sono: a) matrici unità-variabile ok) matrici unità-unità c) matrici variabile-variabile
  1. Una matrice scalare k è: a) una matrice in cui tutti gli elementi sono uguali a k ok) una matrice diagonale con elementi uguali a k c) non esiste la matrice scalare
  2. Le matrici di intensità sono: ok) matrici unità-variabile b) matrici unità-unità c) matrici variabile-variabile
  3. La matrice di varianza-covarianza è: a) matrice unità-variabile b) matrice unità-unità ok) matrice variabile-variabile
  4. La matrice dei dati centrati si calcola perché: a) si vuole tenere conto del diverso ordine di grandezze b) si vuole eliminare l’unità di misura ok) nessuna delle precedenti
  5. Una matrice quadrata A di dimensione k si dice idempotente se : ok) AxA = A b) AxA = A² c) nessuna delle precedenti
  6. Una matrice rettangolare A di dimensione (k,r) si dice idempotente se: ok) AxA = A b) AxA = A² c) nessuna delle precedenti
  7. Il determinante di una matrice A di dimensione 4x6 è: a) uguale al prodotto dei suoi autovalori b) uguale alla somma dei suoi autovalori ok) il determinante non è definito per le matrici rettangolari (devo trasformarla in matrice quadrata per calcolare il suo determinante)
  8. Il determinante di una matrice quadrata è: ok) uguale al prodotto dei suoi autovalori b) uguale alla somma dei suoi autovalori c) uguale alla somma dei suoi autovettori
  9. Uno spazio vettoriale è un insieme di punti (vettori) per i quali: ok) è definita l’operazione di somma di vettori e di moltiplicazione di un vettore per un numero reale b) è definita l’operazione di somma di vettori

a) una matrice ok) uno scalare c) un vettore

  1. Se il prodotto scalare tra due vettori è pari a 1 significa che: a) i vettori sono ortogonali b) almeno uno dei due vettori è nullo ok) nessuna delle precedenti
  2. La covarianza tra le variabili X e Y: a) è un numero puro b) ha come unità di misura il prodotto delle unità di misura di X e Y ok) nessuna delle precedenti
  3. Se ho una matrice quadrata di grado n, come sarà il grado dell’equazione caratteristica : a) N b) N – 1 ok) Non posso dirlo a priori
  4. La traccia di una matrice è: Uguale alla somma dei suoi autovalori
  5. La traccia di AxB è: Uguale a quella di BxA e in particolare se le dimensioni delle matrici sono An,q e Bq,n
  6. Dati due vettori v e w, il coseno dell’angolo θ (teta) che essi formano è pari a: ok) cos(ⱷ) = <v. w> / (||v||. ||w||) b) cos(ⱷ) = ||v||. ||w|| / (<v. w> ) c) nessuno dei precedenti
  7. Una base è costituita da: a) un insieme di vettori applicati nello stesso punto b) un insieme di vettori linearmente indipendenti ok) un insieme di vettori linearmente indipendenti applicati nello stesso punto
  8. Il prodotto tra un vettore colonna e m produce: a) un numero ok) una matrice c) un vettore
  9. Il prodotto tra un vettore riga (1xn) e un vettore colonna (nx1) è: ok) Un numero
  10. Data una matrice A e un vettore x, il sistema omogeneo ammette soluzioni se: ok) il determinante di A è nullo

b) il determinante di A è diverso da 0 c) il determinante di Ax è nullo

  1. Sia A una matrice (n,q) e sia B una matrice (q,n). Quale delle seguenti affermazioni è vera: a) tr(AB) = tr(BA) b) det(AB) = det(A). det(B) ok) entrambe le affermazioni precedenti sono corrette
  2. La forma bilineare è: ok) un numero b) un vettore c) una matrice
  3. La forma quadratica è: ok) Uno scalare
  4. Quale delle seguenti affermazioni sulla distanza tra due punti è falsa: ok) la distanza non dipende dall’ordine con cui si prendono i due punti b) la distanza è un numero positivo c) la distanza tra due punti è una funzione del prodotto scalare tra due vettori
  5. Siano A e B due matrici di dimensioni appropriate. Quali delle seguenti affermazioni è corretta? a) il determinante della somma di A e B è uguale alla somma dei determinanti b) il determinante della somma di A e B è uguale al prodotto dei determinanti ok) nessuna delle precedenti
  6. Il rango di una matrice è: a) L’ordine della sub-matrice quadrata più grande avente determinante diverso da zero b) il numero massimo di righe o di colonne linearmente indipendenti ok) entrambe le affermazioni precedenti sono corrette
  7. Le tabelle di preferenze sono: ok) matrici unità-variabile b) matrici unità-unità c) matrici variabile-variabile

DOMANDE SULL’ACP

  1. Nell’ACP effettuata nello spazio degli individui, la matrice da diagonalizzare è: a) la matrice di varianze-covarianze b) la matrice di correlazione

b) 11,76% della variabilità totale ok) non ci sono elementi sufficienti per rispondere alla domanda

  1. L’affermazione “a partire dalla matrice di correlazione è possibile risalire alla matrice di varianza-covarianza è: a) vera ok) falsa c) vera solo se le variabili sono tra loro indipendenti
  2. L’affermazione “a partire dalla matrice di varianze e covarianze è possibile risalire alla matrice di correlazione” è: a) vera ok) falsa c) vera solo se le variabili sono tra loro indipendenti
  3. Nell'ACP il tasso di inerzia di un asse fattoriale è una: ok) quota di varianza spiegata da quel particolare asse fattoriale b) il prodotto tra l'autovalore associato a quel particolare asse e la somma di tutti gli autovalori c) entrambe le affermazioni sono vere
  4. L’ inerzia riprodotta dall’alfesima componente principale è data da: a) alfesimo autovalore della matrice da diagonalizzare b) alfesimo autovettore della matrice da diagonalizzare ok) Nessuna delle precedenti

DOMANDE SULL’AC

  1. L’ obiettivo dell’AC è: a) studiare la dipendenza tra 2 caratteri statistici ok) studiare la struttura dell’interconnessione tra le modalità di 2 caratteri statistici c) nessuno dei precedenti
  2. Nell’AC il primo autovalore della matrice da diagonalizzare è: ok) 1 b) 0 c) dipende da come sono strutturati i profili riga e colonnna
  3. Nell’AC il secondo autovalore della matrice da diagonalizzare è: a) 1 b) 0 ok) nessuno dei precedenti
  4. Nell’AC effettuata nello spazio dei profili colonna, la matrice dei pesi contiene:

ok) totali marginali di colonna rapportati al totale generale b) totali marginali di riga rapportati al totale generale c) nessuno dei precedenti

  1. Sapendo che Pc è la matrice dei profili colonna, che Pr è la matrice dei profili riga e che M è la metrica, nell’AC effettuata nello spazio dei punti profilo-riga (spazio degli individui), la matrice da diagonalizzare è: a) PcPr ok) P’rPc c) PcMPr
  2. Si ipotizzi di avere effettuato una AC e di aver trovato i seguenti autovalori: λ1=1; λ2=0,3; λ3=0,2; λ4=0,15. Il tasso di inerzia del piano fattoriale (due assi) è pari a: ok) circa il 46% 0.3/0. b) circa il 77% c) circa il 18%
  3. Si ipotizzi di avere effettuato una AC e di aver trovato i seguenti autovalori: λ1=1; λ2=0,3; λ3=0,2; λ4=0,15. Il tasso di inerzia della prima dimensione fattoriale è pari a: a) circa il 46% ok) circa il 77% 0.5/0. c) circa il 18%
  4. Nell’AC è opportuno ricorrere alla metrica : a) della matrice identità b) della distanza euclidea ok) del chi quadro
  5. Nell’AC l’esistenza del valore banale è dovuta a: a) alla particolare metrica usata b) alla particolare matrice di ponderazione usata c) nessuno dei precedenti
  6. Nell’AC il valore del chi-quadro relativo è pari a: a) 16. b) 0. ok) non ci sono elementi sufficienti per rispondere alla domanda
  7. Nell’AC la traccia della matrice da fattorizzare è data da: a) x^2 + 1 b) (x^2 / n) + 1 ok) dipende se l’analisi è fatta sui profili riga o sui profili colonna
  8. Nell'AC la traccia della matrice da fattorizzare è data da:
  1. Nel modello generale dell’analisi fattoriale effettuato sui punti variabile con una matrice data dalla matrice simmetrica M e un sistema di ponderazione dato dalla matrice simmetrica A, si diagonalizza: a) MXAX’ ok) XAX’M c) nessuno dei precedenti
  2. Nel modello generale dell’analisi fattoriale effettuato sui punti variabile con una matrice data dalla matrice simmetrica M e un sistema di ponderazione dato dalla matrice simmetrica A, si diagonalizza: a) AXMX’ b) XMX’A ok) nessuno dei precedenti

DOMANDE SULLA CLUSTER

  1. L’ algoritmo che usa il metodo del legame completo è: a) un algoritmo gerarchico scissorio ok) un algoritmo gerarchico aggregativo c) un algoritmo non gerarchico
  2. L’ algoritmo che usa il metodo del legame singolo è: ok) un algoritmo gerarchico aggregativo b) un algoritmo gerarchico scissorio c) un algoritmo non gerarchico
  3. L’ algoritmo k-medie è: a) un algoritmo gerarchico aggregativo b) un algoritmo gerarchico scissorio ok) un algoritmo non gerarchico
  4. L’ algoritmo di Edwards e Cavalli Sforza è: a) un algoritmo gerarchico aggregativo ok) un algoritmo gerarchico scissorio
  5. un algoritmo non gerarchico
  6. Sapendo che w è la matrice di varianze-covarianze interna, l' algoritmo di Edwards e Cavalli Sforza cerca la partizione che: a) massimizza il det(W) ok) minimizza traccia(W) c) nessuna delle precedenti
  7. Il Teorema di Huygens (scomposizione dell’inerzia) afferma che: a) l’inerzia interna è pari all’inerzia totale meno l’inerzia esterna

b) l’inerzia complessiva è pari alla somma dell’inerzia interna e di quella esterna ok) le affermazioni precedenti, essendo equivalenti, sono entrambe vere

  1. Il Teorema di Huygens afferma che: ok) L’inerzia interna è uguale a quella totale meno l’inerzia esterna ; ed anche che ok ) L’inerzia complessiva è pari all’inerzia interna più quella esterna (entrambe vere).
  2. Il dendrogramma è una rappresentazione grafica adatta a: ok) un algoritmo gerarchico aggregativo b) un algoritmo gerarchico scissorio c) un algoritmo non gerarchico
  3. Nel processo di classificazione è necessario conciliare: ok) la massimizzazione dell’omogeneità interna dei gruppi con un numero ridotto di gruppi b) la massimizzazione dell’omogeneità interna dei gruppi con un numero elevato di gruppi c) la massimizzazione dell’omogeneità esterna dei gruppi con un numero ridotto di gruppi
  4. La formula di Lance e Williams serve per: a) calcolare la distanza tra nuclei in algoritmi scissori b) calcolare la distanza tra nuclei in algoritmi non gerarchci ok) nessuna delle precedenti : serve per calcolare la distanza in un metodo gerarchico di tipo agglomerativo
  5. L’ algoritmo di Lance e Williams è di tipo: a) non gerarchico b) gerarchico scissorio ok) nessuna delle precedenti : gerarchico agglomerativo
  6. L’ algoritmo di Lance e Williams è di tipo: ok) gerarchico aggregativo
  7. La distanza di Mahalanobis : ok) è appropriata allorché si vuole tenere conto della correlazione tra variabili b) è appropriata per variabili qualitative c) nessuna delle precedenti
  8. Quando uso la distanza di Mahalanobis : a) quando i dati sono incorrelati b) quando ho dati qualitativi ok) nessuna delle precedenti : dati quantitativi molto correlati tra loro
  9. La distanza di Minkowsky : a) è appropriata allorché si vuole tenere conto della correlazione tra variabili b) è appropriata per variabili qualitative

a) 1/(• 2 Π) exp (- ½ Z) ok) 1/(• 2 Π) exp (- ½ Z²) c) 1/(• 2 Π) exp ( ½ Z²)

  1. Nella regressione locale, quale delle seguenti espressioni identifica il nucleo normale : a) 15/16 (1- z²) ok) 15/16 (1 - z²)² c) 16/15 (1 - z²)²
  2. Nel modello di regressione lineare il grafico Q-Q consente di: ok) controllare se i residui seguono una distribuzione normale b) controllare se i residui sono omoschedastici (hanno stessa varianza) c) nessuna delle precedenti
  3. Il QQ plot si utilizza per: ok) verificare che gli errori siano normali b) verificare che gli errori abbiam varianza costante c) nessuna delle precedenti
  4. La multicollinearità è un problema che riguarda: a) la presenza di forte correlazione tra la variabile dipendente (Y) e le esplicative (X) b) la presenza di correlazione debole tra la variabile dipendente (Y) e le esplicative (X) ok ) la presenza di forte correlazione tra le variabili esplicative (X)
  5. Data la retta di regressione Y= 2 + X, qual delle seguenti è l’unica alternativa possibile: a) X= 0,3 + 0,6Y b) X= 1 + 0,6Y ok) Entrambe precedenti [Si guarda il coefficiente angolare della x (+1) e quello delle rette che la prof ci da (x=0,3+0,6y; x01+0,6y) e si moltiplicano. Sappiamo che deve essere positivo perché b retta= +1, sapendo che r2= cov(xy)/var(x) moltiplicato per cov(x,y)/var(y), vado a moltiplicare 1 per 0,6 e ottengo che entrambe le risposte sono corrette.]
  6. Data la retta di regressione Y= 2 + 3X, qual delle seguenti è l’unica alternativa possibile: a) X= 1 – 0,1Y b) X= 1 + 0,6Y ok) Nessuna delle precedenti
  7. Data la retta di regressione Y= 2 + 3X, quale delle seguenti è l'unica alternativa possibile: a) X= 1 + 0,5Y ok) X= 1 + 0,1Y c) nessuna delle precedenti
  1. Sapendo che la retta di regressione di Y/X spiega il 36% della variabilità totale di Y, il coefficiente di correlazione tra X e Y è pari a: ok) +- 0, b) + - 0, c) nessuno dei precedenti
  2. Sapendo che la retta di regressione di Y/X spiega l'81% della variabilità totale di Y, il coefficiente di correlazione tra X e Y è: a) + - 0, b) + - 0, ok) nessuna delle precedenti
  3. Sapendo che la retta di regressione di Y/X spiega il 90% della variabilità totale di Y, il coefficiente di correlazione tra X e Y è pari a: a) +\ - 0, b) +- 0, ok) nessuno dei precedenti
  4. Sapendo che la retta di regressione di Y/X spiega il 63% della variabilità totale di Y, il coefficiente di correlazione tra X e Y è pari a: a) ≠ 0, b) ≠ 0, ok) nessuno dei precedenti
  5. Quanto vale il coefficiente angolare della retta di regressione Ẍ = α + βY, sapendo che la Y, sapendo che la matrice di varianza e covarianza è la seguente X Y X 4 - 6 Y 9 ok) – 2 = -6/ b) - c) non ci sono elementi sufficienti per il calcolo
  6. Quanto vale l'intercetta della retta di regressione Ȳ = α + βY, sapendo che la X, sapendo che la matrice di varianza-covarianza è la seguente: X Y X 4 - 6 Y 9 a) - 2

Rispondere alle domande seguenti a partire dall’appropriato output di R:

inserire tabella

  1. Le variabili esplicative utilizzate nel modello di regressione lineare sono: a) 2 ok) 3 c) 4
  2. L’affermazione “nel modello di regressione vi è un grave problema di muticollinearità” è: a) vera ok) falsa c) non ci sono elementi sufficienti per rispondere alla domanda
  3. Nella cluster gerarchica, quanti gruppi si possono identificare in corrispondenza di un taglio fatto ad una altezza pari a 40: a) 2 b) 3 c) non ci sono elementi sufficienti per rispondere alla domanda
  4. Sapendo che nella cluster analysis sono state utilizzate 3 variabili, quale era la dimensione della matrice dei dati originaria: ok) 43x b) 34x c) non ci sono elementi sufficienti per rispondere alla domanda
  5. Nell’AC i primi due assi fattoriali spiegano: a) l’87, b) l ’ 11,76% c) nessuno dei precedenti
  6. Nell’AC il punto meglio rappresentato nella seconda dimensione fattoriale è: a) Senior Managers b) Junior Managers c) Senior Employees
  7. Nell’AC il punto (profilo riga o colonna) peggio rappresentato nella seconda dimensione fattoriale è: a) Senior Managers ok ) Senior Employees c) nessuno dei precedenti
  8. Nell’AC è possibile affermare che i punti “none” e “senior employees” sono: a) quasi sovrapposti b) piuttosto vicini nella prima dimensione

c) non possiamo fare alcun tipo di valutazione

  1. L’algoritmo di clustering utilizzato, restituisce a) 2 gruppi b) 3 gruppi ok) dipende dall'altezza alla quale si esegue il taglio 133)L’affermazione “i residui del modello di regressione lineare sono normali” è: a) vera b) falsa c) non ci sono elementi sufficienti per rispondere
  2. La bontà di adattamento del modello di regressione è: a) eccellente ok) scarsa c) non ci sono elementi sufficienti per rispondere alla domanda [La risposta dipende da R²: R² vicino ad 1= buon adattamento R² vicino a 0= pessimo modello]