



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Examen de aprendizaje automático
Tipo: Exámenes
1 / 7
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




Apellidos: Nombre: Grupo:
Cuestiones (2 puntos; tiempo estimado: 30 minutos)
Marca cada recuadro con una única opción de entre las dadas. Cada acierto suma 1/2 puntos y cada fallo resta 1/6 puntos.
1 D Para un problema de clasicación en dos clases, sea θ(x; θ) def = θtx + θ 0 una función discriminante lineal (FDL) y sea H el hiperplano de decisión denido por φ(x; θ) = 0. Entre las siguientes supuestas propiedades hay una que es falsa:
A) El valor de φ(x; θ) es proporcional a la distancia de x a H B) La distancia del origen de coordenadas a H es θ 0 ‖θ‖ C) H también está denido por un número innito de FDL φ′^6 = φ D) Solo hay una única FDL que dene a H
2 A Se ha evaluado un sistema de Aprendizaje Automático mediante un proceso de exclusion individual (Leaving One Out) usando 1000 muestras etiquetadas. En este proceso se han producido 15 errores en total. Indicar cuál de las armaciones siguientes es razonable: A) La talla de entrenamiento efectiva es de 999 muestras y el error estimado es 1 .5 % ± 0 .75 % B) La talla de entrenamiento efectiva es de 1000 muestras y el error estimado es 1 .5 % ± 0 .15 % C) La talla de test efectiva es de 999 muestras y el error estimado es 1 .5 % ± 0 .15 % D) Las tallas de entrenamiento y de test efectivas son de 1000 muestras y el error estimado es 1 .5 % ± 0 .75 %
3 D Se desea ajustar por mínimos cuadrados la función f : R^2 → R, denida como: y = f (x) def = ax 1 x 2 + bx 1 + cx 2 a una secuencia de N pares entrada-salida: S = (x 1 , y 1 ), (x 2 , y 2 )... , (xN , yN )). La técnica empleada es minimizar por descenso por gradiente la función de error cuadrático:
q(a, b, c) =
n=
(f (xn) − yn)^2
Identica la armación acertada de entre las siguientes:
A) El gradiente es ax 1 + bx 2 + cx 1 x 2 B) El vector gradiente es: 2
n=1(f^ (xn)^ −^ yn)^ ·^ x t n C) La técnica de descenso por gradiente no es aplicable en este caso ya que la función a ajustar, f (·), no es lineal. D) El vector gradiente es: 2
n=1(f^ (xn)^ −^ yn)^ ·^ (xn^1 xn^2 , xn^1 , xn^2 )
t
4 C Considerar el aprendizaje mediante máquinas de vectores soportes y márgenes blandos con una muestra de apren- dizaje x 1 ,... , xN no separable linealmente. Si un multiplicador de Lagrange óptimo α∗ j , asociado a la restricción cj (θtxj + θ 0 ) ≥ 1 − ζj , 1 ≤ j ≤ N , es cero, entonces:
A) La muestra xj está mal clasicada B) La muestra xj está clasicada correctamente pero θ y θ 0 no es canónico con respecto a la muestra C) La muestra xj está clasicada correctamente D) La muestra xj es un vector soporte
El perceptrón multicapa de la gura se utiliza para resolver un problema de regresión, con función de activación de los nodos de la capa de salida de tipo lineal y de la capa oculta de tipo sigmoide, y factor de aprendizaje ρ = 1. 0.
+1.
-1.
+1.
-1.
+1.
+1.
-1.
+1.
+1.
-1.
-1. -1. -1.
+1.
-1.
-1.
+1.
θ 321
θ^213
Dado un vector de entrada xt^ = (+2, +2), las salidas de las unidades de la capa de salida son s^21 = 1. 0474 y s^22 = 0. 9526 y las de las unidades ocultas son s^11 = 0. 0474 , s^12 = 0. 2689 y s^13 = 0. 2689. Si el valor deseado de salida es tt^ = (+1, 0), calcular:
a) Los correspondientes errores en los nodos de la capa de salida y en los nodos de la capa oculta.
b) Los nuevos valores de los pesos de las conexiones θ^132 y θ^213.
a) Los errores en la capa de salida (función de activación lineal) son: δ 12 = (t 1 − s^21 ) = − 0. 0474 δ 22 = (t 2 − s^22 ) = − 0. 9526 Los errores en la capa de oculta son: δ 11 = (δ 12 θ^211 + δ 22 θ^221 ) s^11 (1 − s^11 ) = + 0. 0409 ; δ 21 = (δ 12 θ^212 + δ 22 θ^222 ) s^12 (1 − s^12 ) = − 0. 1780 ; δ 31 = (δ 12 θ^213 + δ 22 θ^223 ) s^13 (1 − s^13 ) = + 0. 1780
b) El nuevo peso θ 132 es: θ^213 = θ^213 + ρ δ^21 s^13 = 0. 9872 ; El nuevo peso θ 321 es: θ^132 = θ^132 + ρ δ^13 x 2 = 1. 3559
Problema 3 (2 puntos; tiempo estimado: 20 minutos)
Las variables aleatorias A, B, C, D toman valores en el conjunto { 0 , 1 }. La distribución de probabilidad conjunta de estas variables viene dada por P (A, B, C, D) = P (A) P (B) P (C | A, B) P (D | A, B), donde las distribuciones de probabilidad asociadas son:
a) Representar grácamente la red bayesiana correspondiente
b) Obtener una expresión simplicada de P (A | B, C, D) y calcular su valor para A = 1 cuando B = 1, C = 1 y D = 1.
c) Dados B = 1, C = 1 y D = 1, ¾Cuál es el mejor valor de A que se puede predecir?
a) Representar grácamente la red bayesiana correspondiente
A (^) B
C D
b) Obtener una expresión simplicada de P (A | B, C, D) y calcular su valor para A = 1 cuando B = 1, C = 1 y D = 1.
c) Dados B = 1, C = 1 y D = 1, ¾Cuál es el mejor valor de A que se puede predecir? a?^ = arg maxa∈{ 0 , 1 } P (A = a | B = 1, C = 1, D = 1) P (A = 0 | B = 1, C = 1, D = 1) = 1 − 0. 391 = 0. 609 ≥ 0. 391 ⇒ valor óptimo de A es a?^ = 0