



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Arbol de Decision IA. Mostrar pasos para obtener la información y el gain ratio para elegir cada nivel del árbol.
Tipo: Ejercicios
1 / 6
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




Abstract Se construye un árbol de decisión mediante el algoritmo ID3 extendido con el criterio de GainRatio para controlar el sesgo hacia atributos con muchos valores. El conjunto de entrenamiento consta de 12 ejemplos que describen si un comensal esperaría para ser atendido en un restaurante, caracterizados por 10 atributos. El árbol resultante alcanza clasificación perfecta sobre el conjunto de entrenamiento empleando únicamente 4 de los 10 atributos disponibles, con una profundidad máxima de 4 niveles.
Alt Bar Fri Hun Pat Price Rain Res Type Est WillWait x1 Y N N Y Some $$$ N Y French 0-10 Yes x2 Y N N Y Full $ N N Thai 30-60 No x3 N Y N N Some $ N N Burger 0-10 Yes x4 Y N Y Y Full $ Y N Thai 10-30 Yes x5 Y N Y N Full $$$ N Y French >60 No x6 N Y N Y Some $$ Y Y Italian 0-10 Yes x7 N Y N N None $ Y N Burger 0-10 No x8 N N N Y Some $$ Y Y Thai 0-10 Yes x9 N Y Y N Full $ Y N Burger >60 No x10 Y Y Y Y Full $$$ N Y Italian 10-30 No x11 N N N N None $ N N Thai 0-10 No x12 Y Y Y Y Full $ N N Burger 30-60 Yes Tabla 1. Conjunto de entrenamiento para el problema de espera en restaurante.
H(S) = -sum_v p(v) * log2 p(v) Gain(A) = H(S) - sum_v |S_v|/|S| * H(S_v)
SplitInfo(A) = -sum_v |S_v|/|S| * log2(|S_v|/|S|) GainRatio(A) = Gain(A) / SplitInfo(A)
3. Construcción del Árbol
H(S) = -(6/12)log2(6/12) - (6/12)log2(6/12) = 1.0 bit
Atributo Particiones H pond. Gain SplitInfo GainRatio Alt Yes(3Y,3N) · No(3Y,3N) 1.000 0.000 1.000 0. Bar Yes(3Y,3N) · No(3Y,3N) 1.000 0.000 1.000 0. Fri Yes(2Y,3N) · No(4Y,3N) 0.979 0.021 0.980 0. Hun Yes(5Y,2N) · No(1Y,4N) 0.804 0.196 0.980 0. Pat None(0Y,2N)·Some(4Y,0N)·Full(2Y,4N) 0.459 0.541 1.459 0. Price $(3Y,4N) · $$(2Y,0N) · $$$(1Y,2N) 0.804 0.196 1.385 0. Rain Yes(3Y,2N) · No(3Y,4N) 0.979 0.021 0.980 0. Res Yes(3Y,2N) · No(3Y,4N) 0.979 0.021 0.980 0. Type Fre(1Y,1N)·Thai(2Y,2N)·Burg(2Y,2N)·Ital(1Y,1N) 1.000 0.000 1.919 0. Est 0-10(4Y,2N)·10-30(1Y,1N)·30-60(1Y,1N)·>60(0Y,2N)0.793 0.207 1.793 0. Tabla 2. Métricas de selección para el nodo raíz (12 ej., H = 1.0 bit). La fila sombreada indica el atributo seleccionado.
H(Full) = -(2/6)log2(2/6) - (4/6)log2(4/6) = 0. Gain(Pat) = 1.0 - (2/12)0 - (4/12)0 - (6/12)0.918 = 0. SplitInfo(Pat) = -(2/12)log2(2/12) - (4/12)log2(4/12) - (6/12)log2(6/12) =
GainRatio(Pat) = 0.541 / 1.459 = 0.
Atributo Partición Gain GainRatio Fri No (x2 = No) · Yes (x4 = Yes) 1.000 1. Rain No (x2 = No) · Yes (x4 = Yes) 1.000 1. Est 30-60 (x2 = No) · 10-30 (x4 = Yes) 1.000 1. Tabla 5. Métricas para Type = Thai (2 ej., H = 1.0 bit). Los tres atributos alcanzan Gain = GainRatio = 1.0.
4. Árbol de Decisión Final
Figura 1. Árbol de decisión final para el problema de espera en restaurante.
Nivel Contexto Atributo Gain GainRatio Ejemplos 1 (Raíz) — Pat 0.541 0.371 12 2 Pat = Full Hun 0.251 0.273 6 3 Pat=Full, Hun=Yes Type 0.500 0.333 4 4 Type = Thai Fri 1.000 1.000 2 Tabla 6. Resumen de atributos seleccionados por nivel.
5. Conclusiones