Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Apuntes sobre el Data Mining, Apuntes de Ingeniería

Apunte sobre qué es el Data Mining y cómo éste influencia al desarrollo de las aplicaciones de riesgo en la ingeniería.

Tipo: Apuntes

2015/2016

Subido el 29/01/2016

pati_patillas
pati_patillas 🇪🇸

4.6

(34)

549 documentos

1 / 78

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Data Mining y Aplicaciones en
Riesgo de Crédito
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e

Vista previa parcial del texto

¡Descarga Apuntes sobre el Data Mining y más Apuntes en PDF de Ingeniería solo en Docsity!

Data Mining y Aplicaciones en

Riesgo de Crédito

1

Contenido

  • Un caso real: Fraude en Aduanas
  • Proceso KDD, Estadística y Minería de Datos (Data mining)
  • Segmentación de clientes
  • Aplicaciones en empresas e instituciones chilenas 2

Volumen

Big Data – Una definición

 Los 3 V:

Velocidad

Variedad

¿Qué no es?

  • Una tecnología solamente para grandes

empresas.

  • Una Base de Datos / un Data Warehouse

más grande.

  • Un fenómeno nuevo.

Velocidad

  • Data Streams:
    • Llamadas telefónicas,
    • Transacciones bancarias,
    • Visitas en página web,

Variedad

  • Distintos tipos de “datos”:
    • Textos,
    • Imágenes,
    • Videos,

Generación de datos

  • The World Wide Web contains about 170 terabytes of information on its surface; in volume this is seventeen times the size of the Library of Congress print collections.
  • Instant messaging generates five billion messages a day (750GB), or 274 Terabytes a year.
  • Email generates about 400,000 terabytes of new information each year worldwide. Fuente: http://www.sims.berkeley.edu/research/projects/how-much-info-2003/ Código Barra RFID: Radio Frequency Identification Código QR

Costos para guardar datos

1990 1992 1994 1996 1998 2000 2002 Costos de un disco duro (US-$) / Capacidad (MB) Fuente: http://www.sims.berkeley.edu/research/projects/how-much-info-2003/

Disponibilidad de datos

Disponibilidad de datos

Data Warehouse – Definición

16 Data Warehouse: Abbreviated DW , a collection of data designed to support management decision making. Data warehouses contain a wide variety of data that present a coherent picture of business conditions at a single point in time. Development of a data warehouse includes development of systems to extract data from operating systems plus installation of a warehouse database systems that provides managers flexible access to the data. The term data warehousing generally refers to the combination of many different databases across an entire enterprise. Contrast with data mart. Fuente: http://www.webopedia.com/TERM/D/data_warehouse.html

Arquitectura de un Data Warehouse

17 Información detallada Resumen Meta Datos

Datos Información Decisión

Fuente: Anahory, Murray (1997): Data Warehousing in the Real World. Datos operacionales Datos externos

Herramientas
de Data Mining
Herramientas
de OLAP

OLAP - Online Analytical Processing

19

Ubicación

Producto

Tiempo

Navegación en un cubo OLAP

20

Ubicación

Producto

Tiempo

P

U

Drill down:

profundizar una

dimensión