Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Crocette Data Mining, Panieri di Statistica

Insieme di crocette dei compiti di Analisi dei dati e data mining

Tipologia: Panieri

2022/2023

Caricato il 18/05/2025

Valentino-De-Pasquale-99
Valentino-De-Pasquale-99 🇮🇹

4.7

(25)

12 documenti

1 / 35

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
CROCETTE&DATA&MINING&(DEFINITIVO)&
&
RICHIAMI'GENERALI'
'
'
1) Un%versore'è:%
a) Una%matrice%di%dimensione%unitaria%
b) Un%vettore%di%norma%unitaria%%
c) Nessuno%dei%precedenti%
%
%
2) Un%versore'è:%
a) Una%matrice%di%dimensione%unitaria%
b) Un%vettore%di%dimensione%unitaria%
c) Nessuna%delle%precedenti%%
%
%
3) Un%vettore'nullo'è:%
a) un%vettore%di%modulo%0%
%
%
4) La%somma'di'due'vettori'è:%
a) un%altro%vettore%
%
%
5) L’affermazione%“la'somma'tra'due'vettori'ha%come%risultato%un%vettore”%è:%
a) Vera%
b) Falsa%
c) Vera%solo%se%i%vettori%sono%non%nulli%
%
%
6) L’affermazione%“la'differenza'tra'due'vettori'ha%come%risultato%un%vettore”%è:%
a)%Vera%
b) Falsa%
c) Vera%se%i%vettori%sono%nulli%
%
%
7) L’affermazione%“la'somma'tra'due'vettori'ha%come%risultato%una%matrice”%è:%
a) Vera%
b) Falsa%%
c) Vera%solo%se%i%vettori%sono%non%nulli%
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23

Anteprima parziale del testo

Scarica Crocette Data Mining e più Panieri in PDF di Statistica solo su Docsity!

CROCETTE DATA MINING (DEFINITIVO)

RICHIAMI GENERALI

  1. Un versore è:

a) Una matrice di dimensione unitaria

b) Un vettore di norma unitaria

c) Nessuno dei precedenti

  1. Un versore è:

a) Una matrice di dimensione unitaria

b) Un vettore di dimensione unitaria

c) Nessuna delle precedenti

  1. Un vettore nullo è:

a) un vettore di modulo 0

  1. La somma di due vettori è:

a) un altro vettore

  1. L’affermazione “ la somma tra due vettori ha come risultato un vettore ” è:

a) Vera

b) Falsa

c) Vera solo se i vettori sono non nulli

  1. L’affermazione “ la differenza tra due vettori ha come risultato un vettore ” è:

a) Vera

b) Falsa

c) Vera se i vettori sono nulli

  1. L’affermazione “ la somma tra due vettori ha come risultato una matrice ” è:

a) Vera

b) Falsa

c) Vera solo se i vettori sono non nulli

  1. L’affermazione “ il prodotto scalare tra due vettori ha come risultato un vettore ” è:

a) Vera

b) Falsa

c) Vera solo se i vettori sono non nulli

  1. Il prodotto scalare tra due vettori mi dà come risultato:

a) Una matrice

b) Uno scalare

c) Un vettore

  1. Uno spazio vettoriale è un insieme di punti (vettori) per i quali:

a) È definito l’operazione di somma di vettori e di moltiplicazione di un vettore per un numero reale

b) È definita l’operazione di somma di vettori

c) È definita l’operazione di prodotto scalare

  1. La dimensione di uno spazio è data da:

a) il numero massimo di vettori linearmente indipendenti in esso definiti

b) il numero minimo di vettori linearmente indipendenti in esso definiti

c) il numero medio di vettori linearmente indipendenti in esso definiti

  1. Una base è costituita da:

a) Un insieme di vettori applicati nello stesso punto

b) Un insieme di vettori linearmente indipendenti

c) Un insieme di vettori linearmente indipendenti applicati nello stesso punto

  1. Quale delle seguenti affermazioni sulla distanza tra due punti è falsa:

a) La distanza non dipende dall’ordine con cui si prendono i due punti

b) La distanza è un numero positivo (può essere 0)

c) La distanza tra due punti è una funzione del prodotto scalare tra due vettori

  1. Se il prodotto scalare tra due vettori è nullo significa che:

a) i due vettori sono ortogonali

b) i due vettori sono linearmente indipendenti

c) entrambe le precedenti affermazioni sono corrette

  1. Il prodotto tra un vettore riga (1xn) e un vettore colonna (nx1) è:

a) un numero

b) una matrice

c) un vettore

  1. Una matrice diagonale è caratterizzata dal fatto che:

a) Sono nulli tutti gli elementi lungo la diagonale principale

b) Sono nulli tutti gli elementi fuori la diagonale principale

c) Nessuno dei precedenti

  1. Una matrice scalare k è:

a) Una matrice in cui tutti gli elementi sono uguali a k

b) Una matrice diagonale con elementi uguali a k

c) Non esiste la matrice scalare

  1. Una matrice quadrata A di dimensione (k) si dice idempotente se:

a) AxA = A

b) AxA = A

2

c) Nessuna delle precedenti

  1. Una matrice rettangolare A di dimensione (k,r) si dice idemponente se:

a) AxA =A

b) AxA = A

2

c) Nessuna delle precedenti

  1. Il prodotto scalare tra due matrici è:

a) Un numero

b) Una matrice

c) Nessuno dei precedenti

  1. La traccia di una matrice è:

a) uguale alla somma dei suoi autovalori

  1. La traccia di una matrice è definita:

a) qualunque siano le dimensioni della matrice

b) solo per le matrici quadrate

c) solo per le matrici diagonali

  1. La traccia di AxB è:

a) Uguale a quella di BxA e in particolare se le dimensioni delle matrici sono An,q e Bq,n

  1. Il determinante di una matrice A di dimensione 4x6 è:

a) Uguale al prodotto dei suoi autovalori

b) Uguali alla somma dei suoi autovalori

c) Il determinante non è definito per le matrici rettangolari

  1. Il determinante di una matrice quadrata di dimensione 6x6 è:

a) Uguale al prodotto dei suoi autovalori

b) Uguale alla somma dei suoi autovalori

c) Uguale alla somma dei suoi autovettori

  1. Quale delle seguenti affermazioni sul determinante di due matrici A e B è corretta :

a) det(A+B) = det(A) + det(B)

b) det(AxB) = det(A) x det(B)

c) Entrambe le precedenti affermazioni sono corrette

  1. Siano A e B due matrici di dimensioni appropriate. Quali delle seguenti affermazioni è corretta?

a) Il determinante della somma di A e B è uguale alla somma dei determinanti

b) Il determinante della somma di A e B è uguale al prodotto dei determinanti

c) Nessuna delle precedenti

  1. Siano date due matrici quadrate A e B della stessa dimensione ed uno scalare k, quale delle

seguenti affermazioni è corretta:

a) kAB = kBA

b) kAB = BAk

c) k AB ≠ k BA

  1. Sia A una matrice (n,q) e sia B una matrice (q,n). Quale delle seguenti affermazioni è vera:

a) tr(AB)=tr(BA)

b) det(AB) = det(A) x det(B)

c) Entrambe le affermazioni precedenti sono corrette

  1. Il rango di una matrice è:

a) L’ordine della sub-matrice quadrata più grande avente determinante diverso da zero

b) Il numero massimo di righe o di colonne linearmente indipendenti

c) Entrambe le affermazioni precedenti sono corrette

  1. La forma quadratica è:

a) Uno scalare

b) Un vettore

c) Una matrice

  1. La forma bilineare è:

a) Un numero

b) Un vettore

c) Una matrice

TIPI DI MATRICI DI DATI

  1. Le tabelle di preferenze sono:

a) Matrici unità-variabile

b) Matrici unità-unità

c) Matrici variabile-variabile

  1. Le matrici di intensità sono:

a) Matrici unità-variabile

b) Matrici unità-unità

c) Matrici variabile-variabile

  1. Le matrici di distanza (flussi) sono:

a) Matrici unità-variabile

b) Matrici unità-unità

c) Matrici variabile-variabile

  1. La matrice di varianza-covarianza è:

a) Matrice unità-variabile

b) Matrice unità-unità

c) Matrice variabile-variabile

ANALISI IN COMPONENTI PRINCIPALI (ACP)

  1. La matrice dei dati centrati si calcola perché:

a) Si vuole tenere conto del diverso ordine di grandezze

b) Si vuole eliminare l’unità di misura

c) Nessuna delle precedenti

  1. Nella matrice dei dati scarto , il prodotto scalare tra due variabili è pari a:

a) La covarianza tra le due variabili

b) Il coefficiente di correlazione tra le due variabili

c) Nessuna delle precedenti

  1. Nella matrice dei dati standardizzati , il quadrato della norma di un vettore rappresentativo di un

punto-variabile è:

a) La varianza della variabile

b) La covarianza tra due variabili

c) Nessuno dei precedenti

  1. Nell’ACP effettuata nello spazio degli individui , la matrice da diagonalizzare è:

a) La matrice di varianze-covarianze

b) La matrice di correlazione

c) Entrambe le affermazioni precedenti sono vere

  1. Nell’ACP, il coefficiente di correlazione tra la k-esima variabile Xk e la p-esima componente Cp, è (si

tenga presente che 𝛾𝑝 è l’autovalore, 𝑢𝑝 è l’autovettore, 𝑠.𝑘 è lo scarto quadratico medio di Xk):

a) (𝛾𝑝 x 𝑢𝑝) / 𝑠.𝑘

b) √ (𝛾𝑝 x 𝑢𝑝) / 𝑠.𝑘

c) Nessuna delle precedenti à La radice deve essere riferita solo all’autovalore ((√ 𝛾𝑝) x 𝑢𝑝 / 𝑠.𝑘)

  1. Nell’ACP, il coefficiente di correlazione tra la k-esima variabile Xk e la p-esima componente Cp, è (si

tenga presente che 𝛾𝑝 è l’autovalore, 𝑢𝑝 è l’autovettore, 𝑠.𝑘 è lo scarto quadratico medio di Xk):

a) (𝛾𝑝 x 𝑢𝑝) / 𝑠.𝑘

b) (√ 𝛾𝑝) x 𝑢𝑝 / 𝑠.𝑘 à La radice deve essere riferita solo all’autovalore

c) √ (𝛾𝑝 x 𝑢𝑝)

  1. L’affermazione “i risultati dell’ACP condotta su dati scarto o su dati standardizzati sono uguali ” è:

a) Sempre vera

b) Sempre falsa

c) Vera solo se le variabili di partenza sono qualitative

  1. Se si effettua una ACP su dati scarto è possibile passare direttamente ai risultati dell’ACP sui dati

standardizzati :

a) Si, basta applicare appropriate formule

b) No, occorre effettuare l’analisi dall’inizio

c) Solo se i dati di partenza sono qualitativi

  1. L’affermazione “a partire dalla matrice varianze e covarianze è possibile risalire alla matrice di

correlazione ” è:

a) Vera

b) Falsa

c) Vera solo se le variabili sono tra loro indipendenti

  1. L’affermazione “a partire dalla matrice di correlazione è possibile risalire alla matrice di varianza-

covarianza ” è:

a) Vera

b) Falsa

c) Vera solo se le variabili sono tra loro indipendenti

  1. Nell’ACP il tasso di inerzia di un asse fattoriale è:

a) La quota di varianza spiegata da quel particolare asse fattoriale

b) Il rapporto tra l’autovalore associato a quel particolare asse e la somma di tutti gli autovalori

c) Entrambe le affermazioni sono vere

  1. Nell’ACP il tasso di inerzia di un asse fattoriale è:

d) La quota di varianza spiegata da quel particolare asse fattoriale

e) Il prodotto tra l’autovalore associato a quel particolare asse e la somma di tutti gli autovalori

f) Entrambe le affermazioni sono vere

ANALISI DELLE CORRISPONDENZE (AC)

  1. Data una tabella di contingenza con r righe e c colonne, i profili riga si ottengono:

a) Nij/ni.

b) Nij/n.j

c) Nij/n..

  1. Data una tabella di contingenza con r righe e c colonne, i profili colonna si ottengono:

a) Nij/ni.

b) Nij/n.j

c) Nij/n..

  1. Data una tabella di contingenza con 4 righe e 3 colonne , quante distribuzioni condizionate è

possibile identificare?

a) 2

b) 4 x 3 = 12

c) Nessuno dei precedenti à 4+3=

  1. Data una tabella di contingenze con 4 righe e 3 colonne , quante distribuzioni condizionate è

possibile identificare?

a) 2

b) 4+3=7 à r+c

c) Nessuno dei precedenti

  1. Data una tabella di contingenze con 4 righe e 3 colonne , quante distribuzioni marginali è possibile

identificare?

a) 2 (1 di riga e 1 di colonna) à Le marginali non dipendono dal numero di righe/colonne

  1. Data una tabella di contingenza con 4 righe e 3 colonne , quante distribuzioni marginali è possibile

identificare?

a) 2 à Le marginali non dipendono dal numero di righe/colonne

b) 4+3=

c) Nessuno dei precedenti

  1. L’ obiettivo dell’AC è:

a) Studiare la dipendenza tra 2 caratteri statistici

b) Studiare la struttura dell’interconnessione tra le modalità di 2 caratteri statistici

c) Nessuno dei precedenti

  1. Nell’AC il primo autovalore della matrice da diagonalizzare è:

a) 1 à Autovalore banale

b) 0

c) Dipende da come sono strutturati i profili riga e colonna

  1. Nell’AC il secondo autovalore della matrice da diagonalizzare è:

a) 1

b) 0

c) Nessuno dei precedenti à Può essere un valore qualsiasi

  1. Si ipotizzi di avere effettuato una AC e di aver trovato i seguenti autovalori: λ 1 =1; λ 2 =0,3; λ 3 =0,2;

λ 4 =0,15. Il tasso di inerzia del piano fattoriale (due assi) è pari a:

a) Circa il 46%

b) Circa il 77% à (0,3+0,2)/(0,3+0,2+0,15) (l’autovalore banale λ 1 non si utilizza)

c) Circa il 18%

  1. Si ipotizzi di avere effettuato una AC e di aver trovato i seguenti autovalori: λ 1 =1; λ 2 =0,3; λ 3 =0,2;

λ 4 =0,15. Il tasso di inerzia della prima dimensione fattoriale è pari a:

a) Circa il 46% à (0,3)/(0,3+0,2+0,15) (l’autovalore banale λ 1 non si utilizza)

b) Circa il 77%

c) Circa il 18%

  1. I primi 4 autovalori di una AC sono risultati i seguenti: λ 1 =1; λ 2 =0,5; λ 3 =0,2; λ 4 =0,15. Il tasso di

inerzia del primo asse è pari a:

a) Circa il 27%

b) Circa il 54.4%

c) Circa il 58.8% à (0,5)/(0,5+0,2+0,15) (l’autovalore banale λ 1 non si utilizza)

  1. Nell’AC la traccia della matrice da diagonalizzare (al netto dell’autovalore banale) è:

a) Una quantità connessa con il coefficiente di correlazione

b) Una quantità connessa con gli autovettori

c) Una quantità connessa con l’indice chi-quadro à (x

2

/n)+

  1. Nell’AC la traccia della matrice da diagonalizzare (al netto dell’autovalore banale) è:

a) Una quantità connessa con il coefficiente di correlazione

b) Una quantità connessa con gli autovettori

c) Nessuna delle precedenti à Una quantità connessa con l’indice chi-quadro e gli autovalori

  1. Nell’AC (punti individuo) la matrice da fattorizzare è:

a) X’DXM

b) MX’DX

c) XDX’M

  1. Nell’AC le coordinate dei punti unità (profili riga) sull'α-simo asse fattoriale sono:

a) n Dr

  • 1

T Dc

  • 1

Uα à Prima Dr e poi Dc (n riferito alla metrica, ma è scalare, quindi commutativo)

b) n Dc

  • 1

T Dr

  • 1

c) Nessuno dei precedenti

  1. Se nell’AC il contributo assoluto di una modalità su di un asse fattoriale è elevato , vuol dire che:

a) Il punto è ben rappresentato

b) Il punto è mal rappresentato

c) Il punto è molto importante per la costruzione di quel particolare asse

  1. Se nell’AC il contributo assoluto di una modalità su di un asse fattoriale è negativo, vuol dire che:

a) Il punto è molto importante per la costruzione di quel particolare asse

b) Il punto è poco importante per la costruzione di quel particolare asse

c) Nessuna delle precedenti à Il contributo assoluto non può essere negativo

  1. Se nell’AC il contributo relativo di un punto su un asse vale zero , vuol dire che:

a) Il punto è ben rappresentato

b) Il punto è male rappresentato

c) Il punto è molto importante per la costruzione di quel particolare asse

CLUSTER ANALYSIS

  1. L’ algoritmo che usa il metodo del legame completo (o complesso) è:

a) Un algoritmo gerarchico scissorio

b) Un algoritmo gerarchico aggregativo

c) Un algoritmo non gerarchico

  1. L’ algoritmo che usa il metodo del legame singolo è:

a) Un algoritmo gerarchico aggregativo

b) Un algoritmo gerarchico scissorio

c) Un algoritmo non gerarchico

  1. L’ algoritmo k-medie è:

a) Un algoritmo gerarchico aggregativo

b) Un algoritmo gerarchico scissorio

c) Un algoritmo non gerarchico

  1. L’ algoritmo di Edwards e Cavalli Sforza è:

a) Un algoritmo gerarchico aggregativo

b) Un algoritmo gerarchico scissorio

c) Un algoritmo non gerarchico

97) Sapendo che W è la matrice di varianze-covarianze interna, l’ algoritmo di Edwards e Cavalli Sforza

cerca la partizione che:

a) Massimizza il determinante di (W)

b) Minimizza la traccia di (W) à Traccia della matrice varianze-covarianze

c) Nessuna delle precedenti

  1. Il Teorema di Huygens (scomposizione dell’inerzia) afferma che:

a) L’inerzia interna è pari all’inerzia totale meno l’inerzia esterna

b) L’inerzia complessiva è pari alla somma dell’inerzia interna e di quella esterna

c) Le affermazioni precedenti, essendo equivalenti, sono entrambe vere

106) La distanza di Mahalanobis:

a) È appropriata allorchè si vuole tenere conto della correlazione tra variabili à Variabili quantitative

b) È appropriata per variabili qualitative

c) Nessuna delle precedenti

107) Quando uso la distanza di Mahalanobis:

a) Quando i dati sono incorrelati

b) Quando ho dati qualitativi

c) Nessuna delle precedenti à Quando i dati sono quantitativi e molto correlati

108) La distanza di Minkowsky:

a) È appropriata allorchè si vuole tenere conto della correlazione tra variabili

b) È appropriata per variabili qualitative

c) Nessuna delle precedenti à E’ appropriata per variabili quantitative incorrelate

  1. La distanza della città a blocchi (o metrica di Manhattan ):

a) Si usa in caso di variabili quantitative

b) Appartiene alla famiglia delle distanze di Minkowsky

c) Entrambe le affermazioni precedenti sono vere

  1. I metodi di clumping sono:

a) Tecniche di classificazione che producono partizioni

b) Tecniche di classificazione che producono insiemi sovrapposti à 1 elemento in più cluster

c) Nessuna delle precedenti

  1. I metodi di classificazione si applicano:

a) Direttamente alla matrice dei dati eventualmente trasformata opportunamente

b) Ai punteggi fattoriali

c) Si può applicare sia alla matrice dei dati sia ai punteggi fattoriali

REGRESSIONE LINEARE SEMPLICE

  1. La covarianza tra le variabili X e Y :

a) E’ un numero puro

b) Ha come unità di misura il prodotto delle unità di misura di X e Y

c) Nessuna delle precedenti

  1. La covarianza tra le variabili X e Y :

a) Varia tra - 1 e 1

b) Ha come unità di misura il prodotto delle unità di misura di X e Y

c) Entrambe le precedenti

  1. Il coefficiente di correlazione lineare r tra le variabili X e Y:

a) E’ un numero puro

b) Varia tra - 1 e 1

c) Entrambe le precedenti

  1. Il coefficiente di correlazione lineare r tra le variabili X e Y:

a) È un numero puro

b) Ha come unità di misura il prodotto delle unità di misura di X e Y

c) Nessuna delle precedenti

  1. Una volta scelto il modello lineare

Yi = B 0 + B 1 X, l’applicazione del metodo dei minimi

quadrati consiste nel porre la condizione:

a) (

Yi - B 0 – B 1 Xi)² = minimo

b) Σ(Yi − B 0 − B 1 Xi )² = minimo

c) nessuna delle precedenti

[Se solo B 1 Xi fosse stato elevato al quadrato, la risposta sarebbe stata: NESSUNA DELLE PRECEDENTI]

  1. Il modello 𝐘

𝐢 =f(Xi) , può anche essere scritto nella forma :

a) Yi= f(Xi) + ei

b)

Yi =f(Xi) + ei

c) Nessuna delle precedenti