Scarica DOMANDE DATA MINING AGGIORNATE 2022 - crocette e risposte aperte e più Prove d'esame in PDF di Analisi Dei Dati solo su Docsity!
DOMANDE APERTE
- Il candidato dimostri come si perviene alla stima dei parametri in un modello di regressione lineare semplice Metodo dei Minimi quadrati: Deriviamo per α e β: Derivata rispetto ad α: Derivata rispetto a β: Sostituisco il valore di α trovato prima, in modo di avere tutto in β Risultati:
- Si consideri la seguente funzione f(x,y) = Σ(xi-yi)^4 dove x ed y sono due vettori (punti) definiti in Rp. Dopo avere definito la distanza tra due punti, si discuta se f(x,y) sia una distanza o meno La distanza d(A,B) tra due punti qualunque definiti nello spazio Rp è una funzione che ha come dominio Rp e come codominio R (un numero reale) (Rp R) e che gode delle seguenti proprietà:
- NON NEGATIVITÀ: d(A,B) ≥ 0 Significa che è uguale a 0 o positiva quindi è una quantità non negativa (es. distanza Battipaglia- Salerno non può essere negativa così anche qui)
- SIMMETRIA: d(A,B) = d(B,A) cioè la distanza tra A e B è uguale a quella tra B e A;
- IDENTITÀ: A=B d(A,B) = 0 quindi se la distanza è 0, A=B
- DISUGUAGLIANZA TRIANGOLARE: d(A,B) ≤ d(A,C) + d(B,C) Considerando la prima proprietà, la non negatività, è possibile dimostrare che: la funzione in questione è una distanza in quanto, essendo elevata alla quarta, è per forza positiva.
- Si consideri la seguente funzione f(x,y) = Σ(xi-yi)^3 dove x ed y sono due vettori (punti) definiti in Rp. Dopo avere definito la distanza tra due punti, si discuta se f(x,y) sia una distanza o meno [vedi domanda precedente] Considerando la prima proprietà (la non negatività): non è possibile affermare con certezza che la seguente funzione è una distanza, in quanto l’elevazione al cubo non assicura la positività della funzione in questione.
Derivata rispetto a u1: Qui la soluzione è γ = 0 Andiamo a sostituire γ nella prima equazione: Conclusione: Le soluzioni proprie (cioè diverse da quella banale u=0) si hanno uguagliando a zero il determinante di (X’X - λI) e ricercando le p soluzioni λi dell’equazione caratteristica Il sottospazio ottimo è identificato dall’autovettore associato a λ2 che è il secondo autovalore più grande di X’X
- Dimostrare come si previene alla identificazione dei sottospazi ottimi in un modello di analisi fattoriale con metrica e pesi dati dalla matrice identità. Effettuare la dimostrazione privilegiando la lettura di riga (analisi punti variabile) [Vedi domanda 4] Per i punti variabile il procedimento è lo stesso, ma utilizziamo: Stesso procedimento della Domanda 4… Ciò equivale a risolvere l’equazione caratteristica che si origina ponendo pari a zero il determinante della matrice
Le uniche cosa che cambiano sono:
- Il trasposto sulla X, che si sposta dalla prima (X’X) alla seconda (XX’)
- Utilizzare “v” al posto di “u”
- Utilizzare “γ” al posto di “λ” Il secondo sottospazio ottimo si ottiene, come prima, risolvendo il problema di massimizzazione vincolata seguente:
- Il candidato dia la definizione di base ortogonale La base Ortogonale è una base i cui vettori appartengono a direzioni poste a 90 gradi
- Il candidato dia la definizione di base ortonormale La base Ortonormale è una base ortogonale i cui vettori sono versori
- Teorema di Huygens Siano dati n punti in uno spazio a p dimensioni e sia xi l’i-simo punto avente massa mi Ipotizziamo di partizionare gli elementi in K gruppi aventi ciascuno massa mk
- Masse:
- Siano inoltre definiti, come segue, i baricentri di ciascun gruppo k ed il baricentro generale : Teorema: L’inerzia complessiva di n punti in Rp^ aventi massa mi e partizionati in K classi può essere scomposta nel modo seguente:
Dove:
- ||·||^2 = norma del vettore (differenza) al quadrato (cioè la distanza al quadrato tra i due punti)
- T, W, B = sono rispettivamente gli acronimi di “Total”, “Within” (inerzia interna) e “Between” (inerzia esterna)
- Metrica M: (motivi alla base della scelta della metrica) La metrica scelta è un elemento che influenza tra le altre cose, la distanza tra 2 punti Se calcolassimo la distanza (al quadrato) tra 2 variabili (cioè due punti profilo-riga) in uno spazio con metrica indotta dalla matrice identità: Se calcolo la distanza così succede che la diversità tra due punti viene mascherata dal fatto che alcuni valori sono piccoli Per ovviare a tale inconveniente si ricorre alla metrica del χ2 (chi-quadro), la quale consente di riponderare i punti assegnando a ciascuno di essi un peso inversamente proporzionale alla massa della categoria di appartenenza. Da questo segue che: - La metrica nello spazio degli individui (profili riga) è: Mr è una matrice quadrata di dimensione c - La metrica nello spazio delle variabili (profili colonna) è: Mc è una matrice quadrata di dimensione r
- Matrice dei pesi (D): (motivi alla base della scelta della matrice dei pesi) L’importanza assoluta di ciascun profilo riga dipende dalla sua massa e cioè dal valore della frequenza marginale ad esso associata L’importanza relativa, invece, si otterrà rapportando la massa dell’individuo alla numerosità complessiva del campione (Discorso analogo - mutatis mutandis- vale per i profili colonna) Dal ragionamento fatto segue che:
- La matrice dei pesi nello spazio degli individui (profili riga) è:
- La matrice dei pesi nello spazio delle variabili (profili colonna) è: Matrice da fattorizzare:
- La matrice da fattorizzare nello spazio degli individui è X’DXM:
- In modo analogo, si dimostra che la matrice da fattorizzare nello spazio delle variabili è:
RICHIAMI GENERALI
- Un versore è: a) Una matrice di dimensione unitaria b) Un vettore di norma unitaria c) Nessuno dei precedenti
- Un versore è: a) Una matrice di dimensione unitaria b) Un vettore di dimensione unitaria c) Nessuna delle precedenti
- Un vettore nullo è: a) un vettore di modulo 0
- La somma di due vettori è: a) un altro vettore
- L’affermazione “la somma tra due vettori ha come risultato un vettore” è: a) Vera b) Falsa c) Vera solo se i vettori sono non nulli
- L’affermazione “la differenza tra due vettori ha come risultato un vettore” è: a) Vera b) Falsa c) Vera se i vettori sono nulli
- L’affermazione “la somma tra due vettori ha come risultato una matrice” è: a) Vera b) Falsa – è un vettore c) Vera solo se i vettori sono non nulli
- Se il prodotto scalare tra due vettori è nullo significa che: d) i due vettori sono ortogonali e) almeno uno dei due vettori è nullo f) entrambe le precedenti affermazioni sono corrette
- Se il prodotto scalare tra due vettori è pari a 1 significa che: a) I vettori sono ortogonali b) Almeno uno dei due vettori è nullo c) Nessuna delle precedenti – sarebbero state vere entrambe se il prodotto scalare fosse stato 0
- Dati due vettori v e w, il coseno dell’angolo θ (teta) che essi formano è pari a: a) Cos(ⱷ) = <v.w> / ( ||v||.||w||) b) Cos(ⱷ) = ||v||.||w|| / (<v.w>) c) Nessuno dei precedenti
- L’affermazione “il prodotto scalare tra due vettori definiti in Rp è una funzione da Rp in R1” è: a) Vera b) Falsa c) Non ci sono sufficienti elementi per rispondere
- La metrica definita su uno spazio metrico influenza: a) La distanza tra i punti b) L’angolo formato da due vettori c) Entrambe le precedenti
- Il prodotto tra un vettore colonna (nx1) e un vettore riga (1xn) produce: a) Un numero b) Una matrice – vanno eliminati gli indici vicini, in questo caso 1 e 1. Rimane nxn, cioè una matrice c) Un vettore
- Il prodotto tra un vettore riga (1xn) e un vettore colonna (nx1) è: a) un numero – vanno eliminati gli indici vicini, in questo caso n e n. Rimane 1x1, cioè un numero
- Una matrice diagonale è caratterizzata dal fatto che: a) Sono nulli tutti gli elementi lungo la diagonale principale b) Sono nulli tutti gli elementi fuori la diagonale principale c) Nessuno dei precedenti
- Una matrice scalare k è: a) Una matrice in cui tutti gli elementi sono uguali a k b) Una matrice diagonale con elementi uguali a k c) Non esiste la matrice scalare
- Una matrice quadrata A di dimensione (k) si dice idempotente se: a) AxA = A b) AxA = A c) Nessuna delle precedenti
- Una matrice rettangolare A di dimensione (k,r) si dice idemponente se: a) AxA =A b) AxA = A c) Nessuna delle precedenti – la matrice è rettangolare e non quadrata, l’idempotenza non vale
- Il prodotto scalare tra due matrici è: a) Un numero b) Una matrice c) Nessuno dei precedenti
- La traccia di una matrice è: a) uguale alla somma dei suoi autovalori
- La traccia di una matrice è definita: a) qualunque siano le dimensioni della matrice b) solo per le matrici quadrate c) solo per le matrici diagonali
- Il rango di una matrice è: a) L’ordine della sub-matrice quadrata più grande avente determinante diverso da zero b) Il numero massimo di righe o di colonne linearmente indipendenti c) Entrambe le affermazioni precedenti sono corrette
- Data una matrice A e un vettore x, il sistema omogeneo ammette soluzioni se: a) Il determinante di A è nullo – abbiamo soluzioni proprie solo se det(A) = 0 b) Il determinante di A è diverso da 0 c) Il determinante di Ax è nullo
- Data una matrice quadrata A in Rn, l’equazione caratteristica ad essa associata è: a) Di grado n b) Di grado n- 1 c) Non si può dire a priori
- Data una matrice quadrata A, l’equazione caratteristica ad essa associata è: a) Di grado n b) Di grado n- 1 c) Non si può dire a priori – non è specificato lo spazio Rp
- Se ho una matrice quadrata di grado n, come sarà il grado dell’equazione caratteristica: a) N b) N – 1 c) Non posso dirlo a priori
- Siano A una matrice, K uno scalare ed u un vettore non nullo. L’equazione Au=ku ha soluzione se: a) tr(A-KI) = 0 b) tr(A-KI) ≠ 0 c) Nessuna delle precedenti – ha soluzioni se det(A – KI) = 0
- Un autovettore è: a) un vettore che non muta direzione e verso quando è moltiplicato per una matrice b) un vettore che non muta direzione quando è moltiplicato per una matrice c) un vettore che non muta verso quando è moltiplicato per una matrice
- Ho una matrice 3x3, sono noti i suoi autovalori: 1,2,3. Quanto vale il determinante? a) 1x2x3 – determinante è uguale al prodotto degli autovalori b) 1+2+ c) Nessuna
- La forma quadratica è: a) Uno scalare
- La forma bilineare è: a) Un numero b) Un vettore c) Una matrice
- Una matrice quadrata A i cui elementi sono numeri reali è: a) Sempre invertibile b) Invertibile solo se ha rango pieno c) Non ci sono elementi per valutare l’invertibilità della matrice
- Siano dati due versori u e v entrambi definiti in Rp, il determinante di uv’ è pari a: a) 1 b) 0 c) Non ci sono elementi sufficienti per il calcolo
- Il determinante di una matrice è: A) Uguale al determinante della trasposta di A – è una proprietà del determinante B) Uguale al determinante dell’inversa di A C) Entrambe le precedenti