Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


DOMANDE DATA MINING RISOLTE, Prove d'esame di Statistica Per L'impresa

DOMANDE DATA MINING RISOLTE

Tipologia: Prove d'esame

2013/2014

Caricato il 27/10/2014

malpa
malpa 🇮🇹

4

(2)

6 documenti

1 / 1

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
DOMANDE TIPO CORSO DI DATA MINING A.A. 2013-2014
Il datawarehouse aziendale ed il data mart
Il data warehouse è un archivio informatico contenente i dati di un'organizzazione, progettati per
consentire di produrre facilmente analisi e relazioni utili a fini decisionali-aziendali. Ha 4
caratteristiche principali: è orientata al soggetto, integrata, non volatile e variabile nel tempo.
Orientata al soggetto: i dati vengono archiviati in modo da essere facilmente letti o elaborati dagli
utenti.
Integrata: il data warehouse deve essere in grado di integrarsi perfettamente con la moltitudine di
standard utilizzati dalle diverse applicazioni dalle quali colleziona i dati.
È variabile nel tempo poiché il suo orizzonte temporale oscilla solitamente tra i 5 e i 10 anni, e in
questo lasso di tempo i dati raccolti non sono altro che una sofisticata serie di “istantanee” scattate
in precisi istanti temporali.
Non volatile: Ogni volta che si aggiorna non si perdono le informazioni precedenti, ma si va solo ad
aggiungere un’altra istantanea.
Componenti essenziali di un sistema data warehouse sono anche gli strumenti per localizzare,
estrarre, trasformare e caricare i dati, gli strumenti per gestire un dizionario dei dati e gli strumenti
di business intelligence.
Due approcci per la creazione di un data warehouse: creazione di un unico archivio centralizzato
oppure unione di diversi database tematici (data mart).
Un’altra importante componente del sistema di data warehouse è la raccolta di data mart. Un data
mart è un database tematico, rappresentato di solito in forma semplice, espressamente rispondente
a specifici obiettivi (per esempio, data mart di marketing).
Gli indici di eterogeneità
Si calcolano per distribuzioni di caratteri qualitativi.
Situazioni estreme: 1)Eterogeneità nulla, quando tutte le unità presentano la medesima modalità del
fenomeno in oggetto,, ovvero pi=1 per un certo i, pi = 0 per ogni altro i; 2) Eterogeneità massima
quando le unità sono ripartite uniformemente tra le k modalità del carattere, pi =1/k, per i=1,2,…k

Anteprima parziale del testo

Scarica DOMANDE DATA MINING RISOLTE e più Prove d'esame in PDF di Statistica Per L'impresa solo su Docsity!

DOMANDE TIPO CORSO DI DATA MINING A.A. 2013-

Il datawarehouse aziendale ed il data mart Il data warehouse è un archivio informatico contenente i dati di un'organizzazione, progettati per consentire di produrre facilmente analisi e relazioni utili a fini decisionali-aziendali. Ha 4 caratteristiche principali: è orientata al soggetto, integrata, non volatile e variabile nel tempo. Orientata al soggetto: i dati vengono archiviati in modo da essere facilmente letti o elaborati dagli utenti. Integrata : il data warehouse deve essere in grado di integrarsi perfettamente con la moltitudine di standard utilizzati dalle diverse applicazioni dalle quali colleziona i dati. È variabile nel tempo poiché il suo orizzonte temporale oscilla solitamente tra i 5 e i 10 anni, e in questo lasso di tempo i dati raccolti non sono altro che una sofisticata serie di “istantanee” scattate in precisi istanti temporali. Non volatile : Ogni volta che si aggiorna non si perdono le informazioni precedenti, ma si va solo ad aggiungere un’altra istantanea. Componenti essenziali di un sistema data warehouse sono anche gli strumenti per localizzare, estrarre, trasformare e caricare i dati, gli strumenti per gestire un dizionario dei dati e gli strumenti di business intelligence. Due approcci per la creazione di un data warehouse: creazione di un unico archivio centralizzato oppure unione di diversi database tematici (data mart). Un’altra importante componente del sistema di data warehouse è la raccolta di data mart. Un data mart è un database tematico, rappresentato di solito in forma semplice, espressamente rispondente a specifici obiettivi (per esempio, data mart di marketing).

Gli indici di eterogeneità Si calcolano per distribuzioni di caratteri qualitativi. Situazioni estreme: 1)Eterogeneità nulla, quando tutte le unità presentano la medesima modalità del fenomeno in oggetto,, ovvero p (^) i=1 per un certo i, p (^) i = 0 per ogni altro i; 2) Eterogeneità massima quando le unità sono ripartite uniformemente tra le k modalità del carattere, p (^) i =1/k, per i=1,2,…k