Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


DOMANDE DATA MINING AGGIORNATE 2022 - crocette e risposte aperte, Prove d'esame di Analisi Dei Dati

Domande di Analisi dei Dati e Data Mining aggiornate 2022, con crocette e risposte aperte complete

Tipologia: Prove d'esame

2021/2022

In vendita dal 04/06/2022

cc33
cc33 🇮🇹

1 documento

1 / 51

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
DOMANDE APERTE
1) Il candidato dimostri come si perviene alla stima dei parametri in un modello di regressione
lineare semplice
Metodo dei Minimi quadrati:
Deriviamo per α e β:
Derivata rispetto ad α:
Derivata rispetto a β:
Sostituisco il valore di α trovato prima, in modo di avere tutto in β
Risultati:
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33

Anteprima parziale del testo

Scarica DOMANDE DATA MINING AGGIORNATE 2022 - crocette e risposte aperte e più Prove d'esame in PDF di Analisi Dei Dati solo su Docsity!

DOMANDE APERTE

  1. Il candidato dimostri come si perviene alla stima dei parametri in un modello di regressione lineare semplice Metodo dei Minimi quadrati: Deriviamo per α e β: Derivata rispetto ad α: Derivata rispetto a β: Sostituisco il valore di α trovato prima, in modo di avere tutto in β Risultati:
  1. Si consideri la seguente funzione f(x,y) = Σ(xi-yi)^4 dove x ed y sono due vettori (punti) definiti in Rp. Dopo avere definito la distanza tra due punti, si discuta se f(x,y) sia una distanza o meno La distanza d(A,B) tra due punti qualunque definiti nello spazio Rp è una funzione che ha come dominio Rp e come codominio R (un numero reale) (Rp R) e che gode delle seguenti proprietà:
  1. NON NEGATIVITÀ: d(A,B) ≥ 0 Significa che è uguale a 0 o positiva quindi è una quantità non negativa (es. distanza Battipaglia- Salerno non può essere negativa così anche qui)
  2. SIMMETRIA: d(A,B) = d(B,A) cioè la distanza tra A e B è uguale a quella tra B e A;
  3. IDENTITÀ: A=B d(A,B) = 0 quindi se la distanza è 0, A=B
  4. DISUGUAGLIANZA TRIANGOLARE: d(A,B) ≤ d(A,C) + d(B,C) Considerando la prima proprietà, la non negatività, è possibile dimostrare che: la funzione in questione è una distanza in quanto, essendo elevata alla quarta, è per forza positiva.
  1. Si consideri la seguente funzione f(x,y) = Σ(xi-yi)^3 dove x ed y sono due vettori (punti) definiti in Rp. Dopo avere definito la distanza tra due punti, si discuta se f(x,y) sia una distanza o meno [vedi domanda precedente] Considerando la prima proprietà (la non negatività): non è possibile affermare con certezza che la seguente funzione è una distanza, in quanto l’elevazione al cubo non assicura la positività della funzione in questione.

Derivata rispetto a u1: Qui la soluzione è γ = 0 Andiamo a sostituire γ nella prima equazione: Conclusione: Le soluzioni proprie (cioè diverse da quella banale u=0) si hanno uguagliando a zero il determinante di (X’X - λI) e ricercando le p soluzioni λi dell’equazione caratteristica Il sottospazio ottimo è identificato dall’autovettore associato a λ2 che è il secondo autovalore più grande di X’X

  1. Dimostrare come si previene alla identificazione dei sottospazi ottimi in un modello di analisi fattoriale con metrica e pesi dati dalla matrice identità. Effettuare la dimostrazione privilegiando la lettura di riga (analisi punti variabile) [Vedi domanda 4] Per i punti variabile il procedimento è lo stesso, ma utilizziamo: Stesso procedimento della Domanda 4… Ciò equivale a risolvere l’equazione caratteristica che si origina ponendo pari a zero il determinante della matrice

Le uniche cosa che cambiano sono:

  • Il trasposto sulla X, che si sposta dalla prima (X’X) alla seconda (XX’)
  • Utilizzare “v” al posto di “u”
  • Utilizzare “γ” al posto di “λ” Il secondo sottospazio ottimo si ottiene, come prima, risolvendo il problema di massimizzazione vincolata seguente:
  1. Il candidato dia la definizione di base ortogonale La base Ortogonale è una base i cui vettori appartengono a direzioni poste a 90 gradi
  2. Il candidato dia la definizione di base ortonormale La base Ortonormale è una base ortogonale i cui vettori sono versori
  3. Teorema di Huygens Siano dati n punti in uno spazio a p dimensioni e sia xi l’i-simo punto avente massa mi Ipotizziamo di partizionare gli elementi in K gruppi aventi ciascuno massa mk
  • Masse:
  • Siano inoltre definiti, come segue, i baricentri di ciascun gruppo k ed il baricentro generale : Teorema: L’inerzia complessiva di n punti in Rp^ aventi massa mi e partizionati in K classi può essere scomposta nel modo seguente:

Dove:

  • ||·||^2 = norma del vettore (differenza) al quadrato (cioè la distanza al quadrato tra i due punti)
  • T, W, B = sono rispettivamente gli acronimi di “Total”, “Within” (inerzia interna) e “Between” (inerzia esterna)

- Metrica M: (motivi alla base della scelta della metrica) La metrica scelta è un elemento che influenza tra le altre cose, la distanza tra 2 punti Se calcolassimo la distanza (al quadrato) tra 2 variabili (cioè due punti profilo-riga) in uno spazio con metrica indotta dalla matrice identità: Se calcolo la distanza così succede che la diversità tra due punti viene mascherata dal fatto che alcuni valori sono piccoli Per ovviare a tale inconveniente si ricorre alla metrica del χ2 (chi-quadro), la quale consente di riponderare i punti assegnando a ciascuno di essi un peso inversamente proporzionale alla massa della categoria di appartenenza. Da questo segue che: - La metrica nello spazio degli individui (profili riga) è: Mr è una matrice quadrata di dimensione c - La metrica nello spazio delle variabili (profili colonna) è: Mc è una matrice quadrata di dimensione r

  • Matrice dei pesi (D): (motivi alla base della scelta della matrice dei pesi) L’importanza assoluta di ciascun profilo riga dipende dalla sua massa e cioè dal valore della frequenza marginale ad esso associata L’importanza relativa, invece, si otterrà rapportando la massa dell’individuo alla numerosità complessiva del campione (Discorso analogo - mutatis mutandis- vale per i profili colonna) Dal ragionamento fatto segue che:
    • La matrice dei pesi nello spazio degli individui (profili riga) è:
    • La matrice dei pesi nello spazio delle variabili (profili colonna) è: Matrice da fattorizzare:
    • La matrice da fattorizzare nello spazio degli individui è X’DXM:
    • In modo analogo, si dimostra che la matrice da fattorizzare nello spazio delle variabili è:

RICHIAMI GENERALI

  1. Un versore è: a) Una matrice di dimensione unitaria b) Un vettore di norma unitaria c) Nessuno dei precedenti
  2. Un versore è: a) Una matrice di dimensione unitaria b) Un vettore di dimensione unitaria c) Nessuna delle precedenti
  3. Un vettore nullo è: a) un vettore di modulo 0
  4. La somma di due vettori è: a) un altro vettore
  5. L’affermazione “la somma tra due vettori ha come risultato un vettore” è: a) Vera b) Falsa c) Vera solo se i vettori sono non nulli
  6. L’affermazione “la differenza tra due vettori ha come risultato un vettore” è: a) Vera b) Falsa c) Vera se i vettori sono nulli
  7. L’affermazione “la somma tra due vettori ha come risultato una matrice” è: a) Vera b) Falsa – è un vettore c) Vera solo se i vettori sono non nulli
  1. Se il prodotto scalare tra due vettori è nullo significa che: d) i due vettori sono ortogonali e) almeno uno dei due vettori è nullo f) entrambe le precedenti affermazioni sono corrette
  2. Se il prodotto scalare tra due vettori è pari a 1 significa che: a) I vettori sono ortogonali b) Almeno uno dei due vettori è nullo c) Nessuna delle precedenti – sarebbero state vere entrambe se il prodotto scalare fosse stato 0
  3. Dati due vettori v e w, il coseno dell’angolo θ (teta) che essi formano è pari a: a) Cos(ⱷ) = <v.w> / ( ||v||.||w||) b) Cos(ⱷ) = ||v||.||w|| / (<v.w>) c) Nessuno dei precedenti
  4. L’affermazione “il prodotto scalare tra due vettori definiti in Rp è una funzione da Rp in R1” è: a) Vera b) Falsa c) Non ci sono sufficienti elementi per rispondere
  5. La metrica definita su uno spazio metrico influenza: a) La distanza tra i punti b) L’angolo formato da due vettori c) Entrambe le precedenti
  6. Il prodotto tra un vettore colonna (nx1) e un vettore riga (1xn) produce: a) Un numero b) Una matrice – vanno eliminati gli indici vicini, in questo caso 1 e 1. Rimane nxn, cioè una matrice c) Un vettore
  7. Il prodotto tra un vettore riga (1xn) e un vettore colonna (nx1) è: a) un numero – vanno eliminati gli indici vicini, in questo caso n e n. Rimane 1x1, cioè un numero
  1. Una matrice diagonale è caratterizzata dal fatto che: a) Sono nulli tutti gli elementi lungo la diagonale principale b) Sono nulli tutti gli elementi fuori la diagonale principale c) Nessuno dei precedenti
  2. Una matrice scalare k è: a) Una matrice in cui tutti gli elementi sono uguali a k b) Una matrice diagonale con elementi uguali a k c) Non esiste la matrice scalare
  3. Una matrice quadrata A di dimensione (k) si dice idempotente se: a) AxA = A b) AxA = A c) Nessuna delle precedenti
  4. Una matrice rettangolare A di dimensione (k,r) si dice idemponente se: a) AxA =A b) AxA = A c) Nessuna delle precedenti – la matrice è rettangolare e non quadrata, l’idempotenza non vale
  5. Il prodotto scalare tra due matrici è: a) Un numero b) Una matrice c) Nessuno dei precedenti
  6. La traccia di una matrice è: a) uguale alla somma dei suoi autovalori
  7. La traccia di una matrice è definita: a) qualunque siano le dimensioni della matrice b) solo per le matrici quadrate c) solo per le matrici diagonali
  1. Il rango di una matrice è: a) L’ordine della sub-matrice quadrata più grande avente determinante diverso da zero b) Il numero massimo di righe o di colonne linearmente indipendenti c) Entrambe le affermazioni precedenti sono corrette
  2. Data una matrice A e un vettore x, il sistema omogeneo ammette soluzioni se: a) Il determinante di A è nullo – abbiamo soluzioni proprie solo se det(A) = 0 b) Il determinante di A è diverso da 0 c) Il determinante di Ax è nullo
  3. Data una matrice quadrata A in Rn, l’equazione caratteristica ad essa associata è: a) Di grado n b) Di grado n- 1 c) Non si può dire a priori
  4. Data una matrice quadrata A, l’equazione caratteristica ad essa associata è: a) Di grado n b) Di grado n- 1 c) Non si può dire a priori – non è specificato lo spazio Rp
  5. Se ho una matrice quadrata di grado n, come sarà il grado dell’equazione caratteristica: a) N b) N – 1 c) Non posso dirlo a priori
  6. Siano A una matrice, K uno scalare ed u un vettore non nullo. L’equazione Au=ku ha soluzione se: a) tr(A-KI) = 0 b) tr(A-KI) ≠ 0 c) Nessuna delle precedenti – ha soluzioni se det(A – KI) = 0
  1. Un autovettore è: a) un vettore che non muta direzione e verso quando è moltiplicato per una matrice b) un vettore che non muta direzione quando è moltiplicato per una matrice c) un vettore che non muta verso quando è moltiplicato per una matrice
  2. Ho una matrice 3x3, sono noti i suoi autovalori: 1,2,3. Quanto vale il determinante? a) 1x2x3 – determinante è uguale al prodotto degli autovalori b) 1+2+ c) Nessuna
  3. La forma quadratica è: a) Uno scalare
  4. La forma bilineare è: a) Un numero b) Un vettore c) Una matrice
  5. Una matrice quadrata A i cui elementi sono numeri reali è: a) Sempre invertibile b) Invertibile solo se ha rango pieno c) Non ci sono elementi per valutare l’invertibilità della matrice
  6. Siano dati due versori u e v entrambi definiti in Rp, il determinante di uv’ è pari a: a) 1 b) 0 c) Non ci sono elementi sufficienti per il calcolo
  7. Il determinante di una matrice è: A) Uguale al determinante della trasposta di A – è una proprietà del determinante B) Uguale al determinante dell’inversa di A C) Entrambe le precedenti