Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Crocette Data Mining, Panieri di Statistica

Università degli Studi di Roma La Sapienza (UNIROMA1)Statistica

Prof. Maria Felice Arezzo

Insieme di crocette dei compiti di Analisi dei dati e data mining

Tipologia: Panieri

2022/2023

Caricato il 18/05/2025

Valentino-De-Pasquale-99 🇮🇹

4.7

(25)

12 documenti

1 / 35

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

CROCETTE&DATA&MINING&(DEFINITIVO)&

RICHIAMI'GENERALI'

1) Un%versore'è:%

a) Una%matrice%di%dimensione%unitaria%

b) Un%vettore%di%norma%unitaria%%

c) Nessuno%dei%precedenti%

2) Un%versore'è:%

a) Una%matrice%di%dimensione%unitaria%

b) Un%vettore%di%dimensione%unitaria%

c) Nessuna%delle%precedenti%%

3) Un%vettore'nullo'è:%

a) un%vettore%di%modulo%0%

4) La%somma'di'due'vettori'è:%

a) un%altro%vettore%

5) L’affermazione%“la'somma'tra'due'vettori'ha%come%risultato%un%vettore”%è:%

a) Vera%

b) Falsa%

c) Vera%solo%se%i%vettori%sono%non%nulli%

6) L’affermazione%“la'differenza'tra'due'vettori'ha%come%risultato%un%vettore”%è:%

a)%Vera%

b) Falsa%

c) Vera%se%i%vettori%sono%nulli%

7) L’affermazione%“la'somma'tra'due'vettori'ha%come%risultato%una%matrice”%è:%

a) Vera%

b) Falsa%%

c) Vera%solo%se%i%vettori%sono%non%nulli%

Scopri Panieri di Statistica Università degli Studi di Roma La Sapienza (UNIROMA1)

Documenti correlati

Crocette aggiornate anno 2024-2025 per superare la parte seconda della prova intermedia

(1)

DATA MINING 2023 - TRACCE DOMANDE APERTE UFFICIALI

(3)

LEZIONI RSTUDIO DATA MINING

data mining crocette

Analisi dei dati e Data Mining 9Cfu Prof. Maria Felice Arezzo

(1)

CROCETTE COMPLETE DATA MINING 2021

(2)

DOMANDE DATA MINING AGGIORNATE 2022 - crocette e risposte aperte

Lezioni di Data Mining 2016 prof. Arezzo

(5)

PROVE D'ESAME DATA MINING

PROVE D'ESAME DATA MINING 2

Domande e risposte Crocette Data Mining (anche alcune domande aperte)

Riassunto di Analisi dei dati e data mining con la prof. Arezzo

Anteprima parziale del testo

Scarica Crocette Data Mining e più Panieri in PDF di Statistica solo su Docsity!

CROCETTE DATA MINING (DEFINITIVO)

RICHIAMI GENERALI

Un versore è:

a) Una matrice di dimensione unitaria

b) Un vettore di norma unitaria

c) Nessuno dei precedenti

Un versore è:

a) Una matrice di dimensione unitaria

b) Un vettore di dimensione unitaria

c) Nessuna delle precedenti

Un vettore nullo è:

a) un vettore di modulo 0

La somma di due vettori è:

a) un altro vettore

L’affermazione “ la somma tra due vettori ha come risultato un vettore ” è:

a) Vera

b) Falsa

c) Vera solo se i vettori sono non nulli

L’affermazione “ la differenza tra due vettori ha come risultato un vettore ” è:

a) Vera

b) Falsa

c) Vera se i vettori sono nulli

L’affermazione “ la somma tra due vettori ha come risultato una matrice ” è:

a) Vera

b) Falsa

c) Vera solo se i vettori sono non nulli

L’affermazione “ il prodotto scalare tra due vettori ha come risultato un vettore ” è:

a) Vera

b) Falsa

c) Vera solo se i vettori sono non nulli

Il prodotto scalare tra due vettori mi dà come risultato:

a) Una matrice

b) Uno scalare

c) Un vettore

Uno spazio vettoriale è un insieme di punti (vettori) per i quali:

a) È definito l’operazione di somma di vettori e di moltiplicazione di un vettore per un numero reale

b) È definita l’operazione di somma di vettori

c) È definita l’operazione di prodotto scalare

La dimensione di uno spazio è data da:

a) il numero massimo di vettori linearmente indipendenti in esso definiti

b) il numero minimo di vettori linearmente indipendenti in esso definiti

c) il numero medio di vettori linearmente indipendenti in esso definiti

Una base è costituita da:

a) Un insieme di vettori applicati nello stesso punto

b) Un insieme di vettori linearmente indipendenti

c) Un insieme di vettori linearmente indipendenti applicati nello stesso punto

Quale delle seguenti affermazioni sulla distanza tra due punti è falsa:

a) La distanza non dipende dall’ordine con cui si prendono i due punti

b) La distanza è un numero positivo (può essere 0)

c) La distanza tra due punti è una funzione del prodotto scalare tra due vettori

Se il prodotto scalare tra due vettori è nullo significa che:

a) i due vettori sono ortogonali

b) i due vettori sono linearmente indipendenti

c) entrambe le precedenti affermazioni sono corrette

Il prodotto tra un vettore riga (1xn) e un vettore colonna (nx1) è:

a) un numero

b) una matrice

c) un vettore

Una matrice diagonale è caratterizzata dal fatto che:

a) Sono nulli tutti gli elementi lungo la diagonale principale

b) Sono nulli tutti gli elementi fuori la diagonale principale

c) Nessuno dei precedenti

Una matrice scalare k è:

a) Una matrice in cui tutti gli elementi sono uguali a k

b) Una matrice diagonale con elementi uguali a k

c) Non esiste la matrice scalare

Una matrice quadrata A di dimensione (k) si dice idempotente se:

a) AxA = A

b) AxA = A

c) Nessuna delle precedenti

Una matrice rettangolare A di dimensione (k,r) si dice idemponente se:

a) AxA =A

b) AxA = A

c) Nessuna delle precedenti

Il prodotto scalare tra due matrici è:

a) Un numero

b) Una matrice

c) Nessuno dei precedenti

La traccia di una matrice è:

a) uguale alla somma dei suoi autovalori

La traccia di una matrice è definita:

a) qualunque siano le dimensioni della matrice

b) solo per le matrici quadrate

c) solo per le matrici diagonali

La traccia di AxB è:

a) Uguale a quella di BxA e in particolare se le dimensioni delle matrici sono An,q e Bq,n

Il determinante di una matrice A di dimensione 4x6 è:

a) Uguale al prodotto dei suoi autovalori

b) Uguali alla somma dei suoi autovalori

c) Il determinante non è definito per le matrici rettangolari

Il determinante di una matrice quadrata di dimensione 6x6 è:

a) Uguale al prodotto dei suoi autovalori

b) Uguale alla somma dei suoi autovalori

c) Uguale alla somma dei suoi autovettori

Quale delle seguenti affermazioni sul determinante di due matrici A e B è corretta :

a) det(A+B) = det(A) + det(B)

b) det(AxB) = det(A) x det(B)

c) Entrambe le precedenti affermazioni sono corrette

Siano A e B due matrici di dimensioni appropriate. Quali delle seguenti affermazioni è corretta?

a) Il determinante della somma di A e B è uguale alla somma dei determinanti

b) Il determinante della somma di A e B è uguale al prodotto dei determinanti

c) Nessuna delle precedenti

Siano date due matrici quadrate A e B della stessa dimensione ed uno scalare k, quale delle

seguenti affermazioni è corretta:

a) kAB = kBA

b) kAB = BAk

c) k AB ≠ k BA

Sia A una matrice (n,q) e sia B una matrice (q,n). Quale delle seguenti affermazioni è vera:

a) tr(AB)=tr(BA)

b) det(AB) = det(A) x det(B)

c) Entrambe le affermazioni precedenti sono corrette

Il rango di una matrice è:

a) L’ordine della sub-matrice quadrata più grande avente determinante diverso da zero

b) Il numero massimo di righe o di colonne linearmente indipendenti

c) Entrambe le affermazioni precedenti sono corrette

La forma quadratica è:

a) Uno scalare

b) Un vettore

c) Una matrice

La forma bilineare è:

a) Un numero

b) Un vettore

c) Una matrice

TIPI DI MATRICI DI DATI

Le tabelle di preferenze sono:

a) Matrici unità-variabile

b) Matrici unità-unità

c) Matrici variabile-variabile

Le matrici di intensità sono:

a) Matrici unità-variabile

b) Matrici unità-unità

c) Matrici variabile-variabile

Le matrici di distanza (flussi) sono:

a) Matrici unità-variabile

b) Matrici unità-unità

c) Matrici variabile-variabile

La matrice di varianza-covarianza è:

a) Matrice unità-variabile

b) Matrice unità-unità

c) Matrice variabile-variabile

ANALISI IN COMPONENTI PRINCIPALI (ACP)

La matrice dei dati centrati si calcola perché:

a) Si vuole tenere conto del diverso ordine di grandezze

b) Si vuole eliminare l’unità di misura

c) Nessuna delle precedenti

Nella matrice dei dati scarto , il prodotto scalare tra due variabili è pari a:

a) La covarianza tra le due variabili

b) Il coefficiente di correlazione tra le due variabili

c) Nessuna delle precedenti

Nella matrice dei dati standardizzati , il quadrato della norma di un vettore rappresentativo di un

punto-variabile è:

a) La varianza della variabile

b) La covarianza tra due variabili

c) Nessuno dei precedenti

Nell’ACP effettuata nello spazio degli individui , la matrice da diagonalizzare è:

a) La matrice di varianze-covarianze

b) La matrice di correlazione

c) Entrambe le affermazioni precedenti sono vere

Nell’ACP, il coefficiente di correlazione tra la k-esima variabile Xk e la p-esima componente Cp, è (si

tenga presente che 𝛾𝑝 è l’autovalore, 𝑢𝑝 è l’autovettore, 𝑠.𝑘 è lo scarto quadratico medio di Xk):

a) (𝛾𝑝 x 𝑢𝑝) / 𝑠.𝑘

b) √ (𝛾𝑝 x 𝑢𝑝) / 𝑠.𝑘

c) Nessuna delle precedenti à La radice deve essere riferita solo all’autovalore ((√ 𝛾𝑝) x 𝑢𝑝 / 𝑠.𝑘)

Nell’ACP, il coefficiente di correlazione tra la k-esima variabile Xk e la p-esima componente Cp, è (si

tenga presente che 𝛾𝑝 è l’autovalore, 𝑢𝑝 è l’autovettore, 𝑠.𝑘 è lo scarto quadratico medio di Xk):

a) (𝛾𝑝 x 𝑢𝑝) / 𝑠.𝑘

b) (√ 𝛾𝑝) x 𝑢𝑝 / 𝑠.𝑘 à La radice deve essere riferita solo all’autovalore

c) √ (𝛾𝑝 x 𝑢𝑝)

L’affermazione “i risultati dell’ACP condotta su dati scarto o su dati standardizzati sono uguali ” è:

a) Sempre vera

b) Sempre falsa

c) Vera solo se le variabili di partenza sono qualitative

Se si effettua una ACP su dati scarto è possibile passare direttamente ai risultati dell’ACP sui dati

standardizzati :

a) Si, basta applicare appropriate formule

b) No, occorre effettuare l’analisi dall’inizio

c) Solo se i dati di partenza sono qualitativi

L’affermazione “a partire dalla matrice varianze e covarianze è possibile risalire alla matrice di

correlazione ” è:

a) Vera

b) Falsa

c) Vera solo se le variabili sono tra loro indipendenti

L’affermazione “a partire dalla matrice di correlazione è possibile risalire alla matrice di varianza-

covarianza ” è:

a) Vera

b) Falsa

c) Vera solo se le variabili sono tra loro indipendenti

Nell’ACP il tasso di inerzia di un asse fattoriale è:

a) La quota di varianza spiegata da quel particolare asse fattoriale

b) Il rapporto tra l’autovalore associato a quel particolare asse e la somma di tutti gli autovalori

c) Entrambe le affermazioni sono vere

Nell’ACP il tasso di inerzia di un asse fattoriale è:

d) La quota di varianza spiegata da quel particolare asse fattoriale

e) Il prodotto tra l’autovalore associato a quel particolare asse e la somma di tutti gli autovalori

f) Entrambe le affermazioni sono vere

ANALISI DELLE CORRISPONDENZE (AC)

Data una tabella di contingenza con r righe e c colonne, i profili riga si ottengono:

a) Nij/ni.

b) Nij/n.j

c) Nij/n..

Data una tabella di contingenza con r righe e c colonne, i profili colonna si ottengono:

a) Nij/ni.

b) Nij/n.j

c) Nij/n..

Data una tabella di contingenza con 4 righe e 3 colonne , quante distribuzioni condizionate è

possibile identificare?

a) 2

b) 4 x 3 = 12

c) Nessuno dei precedenti à 4+3=

Data una tabella di contingenze con 4 righe e 3 colonne , quante distribuzioni condizionate è

possibile identificare?

a) 2

b) 4+3=7 à r+c

c) Nessuno dei precedenti

Data una tabella di contingenze con 4 righe e 3 colonne , quante distribuzioni marginali è possibile

identificare?

a) 2 (1 di riga e 1 di colonna) à Le marginali non dipendono dal numero di righe/colonne

Data una tabella di contingenza con 4 righe e 3 colonne , quante distribuzioni marginali è possibile

identificare?

a) 2 à Le marginali non dipendono dal numero di righe/colonne

b) 4+3=

c) Nessuno dei precedenti

L’ obiettivo dell’AC è:

a) Studiare la dipendenza tra 2 caratteri statistici

b) Studiare la struttura dell’interconnessione tra le modalità di 2 caratteri statistici

c) Nessuno dei precedenti

Nell’AC il primo autovalore della matrice da diagonalizzare è:

a) 1 à Autovalore banale

b) 0

c) Dipende da come sono strutturati i profili riga e colonna

Nell’AC il secondo autovalore della matrice da diagonalizzare è:

a) 1

b) 0

c) Nessuno dei precedenti à Può essere un valore qualsiasi

Si ipotizzi di avere effettuato una AC e di aver trovato i seguenti autovalori: λ 1 =1; λ 2 =0,3; λ 3 =0,2;

λ 4 =0,15. Il tasso di inerzia del piano fattoriale (due assi) è pari a:

a) Circa il 46%

b) Circa il 77% à (0,3+0,2)/(0,3+0,2+0,15) (l’autovalore banale λ 1 non si utilizza)

c) Circa il 18%

Si ipotizzi di avere effettuato una AC e di aver trovato i seguenti autovalori: λ 1 =1; λ 2 =0,3; λ 3 =0,2;

λ 4 =0,15. Il tasso di inerzia della prima dimensione fattoriale è pari a:

a) Circa il 46% à (0,3)/(0,3+0,2+0,15) (l’autovalore banale λ 1 non si utilizza)

b) Circa il 77%

c) Circa il 18%

I primi 4 autovalori di una AC sono risultati i seguenti: λ 1 =1; λ 2 =0,5; λ 3 =0,2; λ 4 =0,15. Il tasso di

inerzia del primo asse è pari a:

a) Circa il 27%

b) Circa il 54.4%

c) Circa il 58.8% à (0,5)/(0,5+0,2+0,15) (l’autovalore banale λ 1 non si utilizza)

Nell’AC la traccia della matrice da diagonalizzare (al netto dell’autovalore banale) è:

a) Una quantità connessa con il coefficiente di correlazione

b) Una quantità connessa con gli autovettori

c) Una quantità connessa con l’indice chi-quadro à (x

/n)+

Nell’AC la traccia della matrice da diagonalizzare (al netto dell’autovalore banale) è:

a) Una quantità connessa con il coefficiente di correlazione

b) Una quantità connessa con gli autovettori

c) Nessuna delle precedenti à Una quantità connessa con l’indice chi-quadro e gli autovalori

Nell’AC (punti individuo) la matrice da fattorizzare è:

a) X’DXM

b) MX’DX

c) XDX’M

Nell’AC le coordinate dei punti unità (profili riga) sull'α-simo asse fattoriale sono:

a) n Dr

T Dc

Uα à Prima Dr e poi Dc (n riferito alla metrica, ma è scalare, quindi commutativo)

b) n Dc

T Dr

Uα

c) Nessuno dei precedenti

Se nell’AC il contributo assoluto di una modalità su di un asse fattoriale è elevato , vuol dire che:

a) Il punto è ben rappresentato

b) Il punto è mal rappresentato

c) Il punto è molto importante per la costruzione di quel particolare asse

Se nell’AC il contributo assoluto di una modalità su di un asse fattoriale è negativo, vuol dire che:

a) Il punto è molto importante per la costruzione di quel particolare asse

b) Il punto è poco importante per la costruzione di quel particolare asse

c) Nessuna delle precedenti à Il contributo assoluto non può essere negativo

Se nell’AC il contributo relativo di un punto su un asse vale zero , vuol dire che:

a) Il punto è ben rappresentato

b) Il punto è male rappresentato

c) Il punto è molto importante per la costruzione di quel particolare asse

CLUSTER ANALYSIS

L’ algoritmo che usa il metodo del legame completo (o complesso) è:

a) Un algoritmo gerarchico scissorio

b) Un algoritmo gerarchico aggregativo

c) Un algoritmo non gerarchico

L’ algoritmo che usa il metodo del legame singolo è:

a) Un algoritmo gerarchico aggregativo

b) Un algoritmo gerarchico scissorio

c) Un algoritmo non gerarchico

L’ algoritmo k-medie è:

a) Un algoritmo gerarchico aggregativo

b) Un algoritmo gerarchico scissorio

c) Un algoritmo non gerarchico

L’ algoritmo di Edwards e Cavalli Sforza è:

a) Un algoritmo gerarchico aggregativo

b) Un algoritmo gerarchico scissorio

c) Un algoritmo non gerarchico

97) Sapendo che W è la matrice di varianze-covarianze interna, l’ algoritmo di Edwards e Cavalli Sforza

cerca la partizione che:

a) Massimizza il determinante di (W)

b) Minimizza la traccia di (W) à Traccia della matrice varianze-covarianze

c) Nessuna delle precedenti

Il Teorema di Huygens (scomposizione dell’inerzia) afferma che:

a) L’inerzia interna è pari all’inerzia totale meno l’inerzia esterna

b) L’inerzia complessiva è pari alla somma dell’inerzia interna e di quella esterna

c) Le affermazioni precedenti, essendo equivalenti, sono entrambe vere

106) La distanza di Mahalanobis:

a) È appropriata allorchè si vuole tenere conto della correlazione tra variabili à Variabili quantitative

b) È appropriata per variabili qualitative

c) Nessuna delle precedenti

107) Quando uso la distanza di Mahalanobis:

a) Quando i dati sono incorrelati

b) Quando ho dati qualitativi

c) Nessuna delle precedenti à Quando i dati sono quantitativi e molto correlati

108) La distanza di Minkowsky:

a) È appropriata allorchè si vuole tenere conto della correlazione tra variabili

b) È appropriata per variabili qualitative

c) Nessuna delle precedenti à E’ appropriata per variabili quantitative incorrelate

La distanza della città a blocchi (o metrica di Manhattan ):

a) Si usa in caso di variabili quantitative

b) Appartiene alla famiglia delle distanze di Minkowsky

c) Entrambe le affermazioni precedenti sono vere

I metodi di clumping sono:

a) Tecniche di classificazione che producono partizioni

b) Tecniche di classificazione che producono insiemi sovrapposti à 1 elemento in più cluster

c) Nessuna delle precedenti

I metodi di classificazione si applicano:

a) Direttamente alla matrice dei dati eventualmente trasformata opportunamente

b) Ai punteggi fattoriali

c) Si può applicare sia alla matrice dei dati sia ai punteggi fattoriali

REGRESSIONE LINEARE SEMPLICE

La covarianza tra le variabili X e Y :

a) E’ un numero puro

b) Ha come unità di misura il prodotto delle unità di misura di X e Y

c) Nessuna delle precedenti

La covarianza tra le variabili X e Y :

a) Varia tra - 1 e 1

b) Ha come unità di misura il prodotto delle unità di misura di X e Y

c) Entrambe le precedenti

Il coefficiente di correlazione lineare r tra le variabili X e Y:

a) E’ un numero puro

b) Varia tra - 1 e 1

c) Entrambe le precedenti

Il coefficiente di correlazione lineare r tra le variabili X e Y:

a) È un numero puro

b) Ha come unità di misura il prodotto delle unità di misura di X e Y

c) Nessuna delle precedenti

Una volta scelto il modello lineare

Yi = B 0 + B 1 X, l’applicazione del metodo dei minimi

quadrati consiste nel porre la condizione:

a) (

Yi - B 0 – B 1 Xi)² = minimo

b) Σ(Yi − B 0 − B 1 Xi )² = minimo

c) nessuna delle precedenti

[Se solo B 1 Xi fosse stato elevato al quadrato, la risposta sarebbe stata: NESSUNA DELLE PRECEDENTI]

Il modello 𝐘

𝐢 =f(Xi) , può anche essere scritto nella forma :

a) Yi= f(Xi) + ei

Yi =f(Xi) + ei

c) Nessuna delle precedenti