Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

DOMANDE DATA MINING AGGIORNATE 2022 - crocette e risposte aperte, Prove d'esame di Analisi Dei Dati

Università degli Studi di Roma La Sapienza (UNIROMA1)Analisi Dei Dati

Prof. Maria Felice Arezzo

Domande di Analisi dei Dati e Data Mining aggiornate 2022, con crocette e risposte aperte complete

Tipologia: Prove d'esame

2021/2022

In vendita dal 04/06/2022

cc33 🇮🇹

1 documento

1 / 51

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

DOMANDE APERTE

1) Il candidato dimostri come si perviene alla stima dei parametri in un modello di regressione

lineare semplice

Metodo dei Minimi quadrati:

Deriviamo per α e β:

Derivata rispetto ad α:

Derivata rispetto a β:

Sostituisco il valore di α trovato prima, in modo di avere tutto in β

Risultati:

Scopri Prove d'esame di Analisi Dei Dati Università degli Studi di Roma La Sapienza (UNIROMA1)

Documenti correlati

Crocette aggiornate anno 2024-2025 per superare la parte seconda della prova intermedia

(1)

Crocette Data Mining

DATA MINING 2023 - TRACCE DOMANDE APERTE UFFICIALI

(3)

LEZIONI RSTUDIO DATA MINING

data mining crocette

Analisi dei dati e Data Mining 9Cfu Prof. Maria Felice Arezzo

(1)

CROCETTE COMPLETE DATA MINING 2021

(2)

PROVE D'ESAME DATA MINING

PROVE D'ESAME DATA MINING 2

Domande e risposte Crocette Data Mining (anche alcune domande aperte)

Riassunto di Analisi dei dati e data mining con la prof. Arezzo

Appunti COMPLETI 2023 "Analisi dei dati e Data Mining" (AREZZO)

(2)

Anteprima parziale del testo

Scarica DOMANDE DATA MINING AGGIORNATE 2022 - crocette e risposte aperte e più Prove d'esame in PDF di Analisi Dei Dati solo su Docsity!

DOMANDE APERTE

Il candidato dimostri come si perviene alla stima dei parametri in un modello di regressione lineare semplice Metodo dei Minimi quadrati: Deriviamo per α e β: Derivata rispetto ad α: Derivata rispetto a β: Sostituisco il valore di α trovato prima, in modo di avere tutto in β Risultati:

Si consideri la seguente funzione f(x,y) = Σ(xi-yi)^4 dove x ed y sono due vettori (punti) definiti in Rp. Dopo avere definito la distanza tra due punti, si discuta se f(x,y) sia una distanza o meno La distanza d(A,B) tra due punti qualunque definiti nello spazio Rp è una funzione che ha come dominio Rp e come codominio R (un numero reale) (Rp R) e che gode delle seguenti proprietà:

NON NEGATIVITÀ: d(A,B) ≥ 0 Significa che è uguale a 0 o positiva quindi è una quantità non negativa (es. distanza Battipaglia- Salerno non può essere negativa così anche qui)
SIMMETRIA: d(A,B) = d(B,A) cioè la distanza tra A e B è uguale a quella tra B e A;
IDENTITÀ: A=B d(A,B) = 0 quindi se la distanza è 0, A=B
DISUGUAGLIANZA TRIANGOLARE: d(A,B) ≤ d(A,C) + d(B,C) Considerando la prima proprietà, la non negatività, è possibile dimostrare che: la funzione in questione è una distanza in quanto, essendo elevata alla quarta, è per forza positiva.

Si consideri la seguente funzione f(x,y) = Σ(xi-yi)^3 dove x ed y sono due vettori (punti) definiti in Rp. Dopo avere definito la distanza tra due punti, si discuta se f(x,y) sia una distanza o meno [vedi domanda precedente] Considerando la prima proprietà (la non negatività): non è possibile affermare con certezza che la seguente funzione è una distanza, in quanto l’elevazione al cubo non assicura la positività della funzione in questione.

Derivata rispetto a u1: Qui la soluzione è γ = 0 Andiamo a sostituire γ nella prima equazione: Conclusione: Le soluzioni proprie (cioè diverse da quella banale u=0) si hanno uguagliando a zero il determinante di (X’X - λI) e ricercando le p soluzioni λi dell’equazione caratteristica Il sottospazio ottimo è identificato dall’autovettore associato a λ2 che è il secondo autovalore più grande di X’X

Dimostrare come si previene alla identificazione dei sottospazi ottimi in un modello di analisi fattoriale con metrica e pesi dati dalla matrice identità. Effettuare la dimostrazione privilegiando la lettura di riga (analisi punti variabile) [Vedi domanda 4] Per i punti variabile il procedimento è lo stesso, ma utilizziamo: Stesso procedimento della Domanda 4… Ciò equivale a risolvere l’equazione caratteristica che si origina ponendo pari a zero il determinante della matrice

Le uniche cosa che cambiano sono:

Il trasposto sulla X, che si sposta dalla prima (X’X) alla seconda (XX’)
Utilizzare “v” al posto di “u”
Utilizzare “γ” al posto di “λ” Il secondo sottospazio ottimo si ottiene, come prima, risolvendo il problema di massimizzazione vincolata seguente:

Il candidato dia la definizione di base ortogonale La base Ortogonale è una base i cui vettori appartengono a direzioni poste a 90 gradi
Il candidato dia la definizione di base ortonormale La base Ortonormale è una base ortogonale i cui vettori sono versori
Teorema di Huygens Siano dati n punti in uno spazio a p dimensioni e sia xi l’i-simo punto avente massa mi Ipotizziamo di partizionare gli elementi in K gruppi aventi ciascuno massa mk

Masse:
Siano inoltre definiti, come segue, i baricentri di ciascun gruppo k ed il baricentro generale : Teorema: L’inerzia complessiva di n punti in Rp^ aventi massa mi e partizionati in K classi può essere scomposta nel modo seguente:

Dove:

||·||^2 = norma del vettore (differenza) al quadrato (cioè la distanza al quadrato tra i due punti)
T, W, B = sono rispettivamente gli acronimi di “Total”, “Within” (inerzia interna) e “Between” (inerzia esterna)

- Metrica M: (motivi alla base della scelta della metrica) La metrica scelta è un elemento che influenza tra le altre cose, la distanza tra 2 punti Se calcolassimo la distanza (al quadrato) tra 2 variabili (cioè due punti profilo-riga) in uno spazio con metrica indotta dalla matrice identità: Se calcolo la distanza così succede che la diversità tra due punti viene mascherata dal fatto che alcuni valori sono piccoli Per ovviare a tale inconveniente si ricorre alla metrica del χ2 (chi-quadro), la quale consente di riponderare i punti assegnando a ciascuno di essi un peso inversamente proporzionale alla massa della categoria di appartenenza. Da questo segue che: - La metrica nello spazio degli individui (profili riga) è: Mr è una matrice quadrata di dimensione c - La metrica nello spazio delle variabili (profili colonna) è: Mc è una matrice quadrata di dimensione r

Matrice dei pesi (D): (motivi alla base della scelta della matrice dei pesi) L’importanza assoluta di ciascun profilo riga dipende dalla sua massa e cioè dal valore della frequenza marginale ad esso associata L’importanza relativa, invece, si otterrà rapportando la massa dell’individuo alla numerosità complessiva del campione (Discorso analogo - mutatis mutandis- vale per i profili colonna) Dal ragionamento fatto segue che:
- La matrice dei pesi nello spazio degli individui (profili riga) è:
- La matrice dei pesi nello spazio delle variabili (profili colonna) è: Matrice da fattorizzare:
- La matrice da fattorizzare nello spazio degli individui è X’DXM:
- In modo analogo, si dimostra che la matrice da fattorizzare nello spazio delle variabili è:

RICHIAMI GENERALI

Un versore è: a) Una matrice di dimensione unitaria b) Un vettore di norma unitaria c) Nessuno dei precedenti
Un versore è: a) Una matrice di dimensione unitaria b) Un vettore di dimensione unitaria c) Nessuna delle precedenti
Un vettore nullo è: a) un vettore di modulo 0
La somma di due vettori è: a) un altro vettore
L’affermazione “la somma tra due vettori ha come risultato un vettore” è: a) Vera b) Falsa c) Vera solo se i vettori sono non nulli
L’affermazione “la differenza tra due vettori ha come risultato un vettore” è: a) Vera b) Falsa c) Vera se i vettori sono nulli
L’affermazione “la somma tra due vettori ha come risultato una matrice” è: a) Vera b) Falsa – è un vettore c) Vera solo se i vettori sono non nulli

Se il prodotto scalare tra due vettori è nullo significa che: d) i due vettori sono ortogonali e) almeno uno dei due vettori è nullo f) entrambe le precedenti affermazioni sono corrette
Se il prodotto scalare tra due vettori è pari a 1 significa che: a) I vettori sono ortogonali b) Almeno uno dei due vettori è nullo c) Nessuna delle precedenti – sarebbero state vere entrambe se il prodotto scalare fosse stato 0
Dati due vettori v e w, il coseno dell’angolo θ (teta) che essi formano è pari a: a) Cos(ⱷ) = <v.w> / ( ||v||.||w||) b) Cos(ⱷ) = ||v||.||w|| / (<v.w>) c) Nessuno dei precedenti
L’affermazione “il prodotto scalare tra due vettori definiti in Rp è una funzione da Rp in R1” è: a) Vera b) Falsa c) Non ci sono sufficienti elementi per rispondere
La metrica definita su uno spazio metrico influenza: a) La distanza tra i punti b) L’angolo formato da due vettori c) Entrambe le precedenti
Il prodotto tra un vettore colonna (nx1) e un vettore riga (1xn) produce: a) Un numero b) Una matrice – vanno eliminati gli indici vicini, in questo caso 1 e 1. Rimane nxn, cioè una matrice c) Un vettore
Il prodotto tra un vettore riga (1xn) e un vettore colonna (nx1) è: a) un numero – vanno eliminati gli indici vicini, in questo caso n e n. Rimane 1x1, cioè un numero

Una matrice diagonale è caratterizzata dal fatto che: a) Sono nulli tutti gli elementi lungo la diagonale principale b) Sono nulli tutti gli elementi fuori la diagonale principale c) Nessuno dei precedenti
Una matrice scalare k è: a) Una matrice in cui tutti gli elementi sono uguali a k b) Una matrice diagonale con elementi uguali a k c) Non esiste la matrice scalare
Una matrice quadrata A di dimensione (k) si dice idempotente se: a) AxA = A b) AxA = A c) Nessuna delle precedenti
Una matrice rettangolare A di dimensione (k,r) si dice idemponente se: a) AxA =A b) AxA = A c) Nessuna delle precedenti – la matrice è rettangolare e non quadrata, l’idempotenza non vale
Il prodotto scalare tra due matrici è: a) Un numero b) Una matrice c) Nessuno dei precedenti
La traccia di una matrice è: a) uguale alla somma dei suoi autovalori
La traccia di una matrice è definita: a) qualunque siano le dimensioni della matrice b) solo per le matrici quadrate c) solo per le matrici diagonali

Il rango di una matrice è: a) L’ordine della sub-matrice quadrata più grande avente determinante diverso da zero b) Il numero massimo di righe o di colonne linearmente indipendenti c) Entrambe le affermazioni precedenti sono corrette
Data una matrice A e un vettore x, il sistema omogeneo ammette soluzioni se: a) Il determinante di A è nullo – abbiamo soluzioni proprie solo se det(A) = 0 b) Il determinante di A è diverso da 0 c) Il determinante di Ax è nullo
Data una matrice quadrata A in Rn, l’equazione caratteristica ad essa associata è: a) Di grado n b) Di grado n- 1 c) Non si può dire a priori
Data una matrice quadrata A, l’equazione caratteristica ad essa associata è: a) Di grado n b) Di grado n- 1 c) Non si può dire a priori – non è specificato lo spazio Rp
Se ho una matrice quadrata di grado n, come sarà il grado dell’equazione caratteristica: a) N b) N – 1 c) Non posso dirlo a priori
Siano A una matrice, K uno scalare ed u un vettore non nullo. L’equazione Au=ku ha soluzione se: a) tr(A-KI) = 0 b) tr(A-KI) ≠ 0 c) Nessuna delle precedenti – ha soluzioni se det(A – KI) = 0

Un autovettore è: a) un vettore che non muta direzione e verso quando è moltiplicato per una matrice b) un vettore che non muta direzione quando è moltiplicato per una matrice c) un vettore che non muta verso quando è moltiplicato per una matrice
Ho una matrice 3x3, sono noti i suoi autovalori: 1,2,3. Quanto vale il determinante? a) 1x2x3 – determinante è uguale al prodotto degli autovalori b) 1+2+ c) Nessuna
La forma quadratica è: a) Uno scalare
La forma bilineare è: a) Un numero b) Un vettore c) Una matrice
Una matrice quadrata A i cui elementi sono numeri reali è: a) Sempre invertibile b) Invertibile solo se ha rango pieno c) Non ci sono elementi per valutare l’invertibilità della matrice
Siano dati due versori u e v entrambi definiti in Rp, il determinante di uv’ è pari a: a) 1 b) 0 c) Non ci sono elementi sufficienti per il calcolo
Il determinante di una matrice è: A) Uguale al determinante della trasposta di A – è una proprietà del determinante B) Uguale al determinante dell’inversa di A C) Entrambe le precedenti