




Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Este documento proporciona una introducción al deep learning y las redes neuronales artificiales (ann). Explora la evolución histórica del deep learning, desde los primeros modelos matemáticos de redes neuronales hasta los modelos generativos modernos. Se detallan los elementos fundamentales de una ann, incluyendo conexiones, funciones de activación y capas, así como su funcionamiento a través de forward y backward propagation. Además, se describen diferentes tipos de redes como dnn, cnn y rnn, y se discuten las funciones de pérdida, algoritmos de optimización y técnicas de regularización. El documento también aborda el aprendizaje supervisado, no supervisado y semi-supervisado, la detección de anomalías y el uso de autoencoders para la compresión de datos. Finalmente, se comparan diferentes optimizadores como adam, rmsprop y sgd, destacando sus ventajas y desventajas para diferentes tipos de problemas.
Tipo: Apuntes
1 / 8
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





Deep Learning: Es un subconjunto del aprendizaje automático que imita al cerebro humano, usando redes neuronales profundas que extraen y clasifican automáticamente características complejas. Evolución histórica:
Semana 2: Aprendizaje Supervisado Aprendizaje Supervisado Entrenamos modelos con datos ya etiquetados, guiando al modelo para que descubra patrones y relaciones entre entradas (X) y salidas correctas (Y). Objetivo principal: Identificar patrones, buscamos que el modelo descubra “patrones o relaciones entre variable en entada y salida” Estructura de los Datos Entrada (X): Datos que queremos clasificar. Etiqueta (Y): Respuesta correcta asociada a cada entrada. Proceso del Aprendizaje Supervisado Alimentar el modelo con datos para que establezca relaciones. Medir precisión usando función de pérdida. Ajustar parámetros para mejorar el modelo. Repetir hasta minimizar el error a un nivel aceptable. Ciclo de optimización de Aprendizaje Supervisado (Es un ciclo iterativo, debido que se repite en cada época, buscando mejorar el modelo) Definir función de pérdida para medir errores. Calcular la pérdida entre predicciones y valores reales. Ajustar parámetros para reducir errores. Evaluar la mejora en la precisión. Función de Pérdida Permite que el modelo aprenda sistemáticamente de sus errores cuantificándolos.
1. Pérdida de Entropía Cruzada - Mide diferencia entre probabilidades predichas y reales. - Usada en clasificación binaria y multiclase. - Ventajas: buena para clasificación, detecta cambios, señales suaves. - Desventajas: problemas con clases desbalanceadas, necesita muchos datos. 2. Pérdida de Errores Cuadráticos Medios (MSE) - Mide promedio del cuadrado de errores entre predicciones y valores reales. - Usada en regresión (predicción de valores continuos). - Ventajas: fácil de entender, buen rendimiento. - Desventajas: sensible a valores atípicos. 3. Pérdida Hinge
Técnica para agrupar datos similares sin conocimiento previo, usando centroides y medidas de similitud. Busca formar grupos homogéneos dentro de conjuntos heterogéneos.
Proceso que simplifica los datos manteniendo su información esencial, no eliminando columnas arbitrariamente, sino preservando variables importantes para facilitar la visualización y análisis de datos complejos.
Identifica puntos que se desvían significativamente del comportamiento normal, permitiendo detectar valores atípicos o eventos inusuales en conjuntos de datos.
Descubre relaciones y asociaciones entre variables dentro de grandes conjuntos de datos, útil para sistemas de recomendación y análisis de cestas de compra.
Detecta características relevantes en los datos, utilizando técnicas como autoencoders, para facilitar la identificación de patrones subyacentes.
Técnica clave de reducción de dimensionalidad que transforma linealmente los datos a un nuevo sistema de coordenadas, buscando concentrar la mayor varianza en cada componente para facilitar la interpretación y agrupación de los datos.
Aplicaciones de PCA: Se usa en análisis exploratorio, visualización, preprocesamiento para modelos, reducción de ruido, extracción de características, compresión de imágenes, reconocimiento de patrones y finanzas.
Red neuronal que aprende codificaciones eficientes de datos no etiquetados, con tres componentes principales: ● Encoder (Codificador): Comprime datos de entrada a una representación de menor dimensión. ● Cuello de Botella (Espacio Latente): Capa central compacta que contiene la representación comprimida, determinando el grado de compresión. ● Decoder (Decodificador): Reconstruye los datos originales desde la representación comprimida. ● neuronas en la capa de salida del decodificador es típicamente igual que la entrada" Funcionamiento El ejemplo visual muestra cómo funciona un autoencoder con un dígito "2": ● Entrada: Imagen original del dígito "2" (podría ser 28×28 píxeles) ● Proceso de codificación: La imagen se comprime a una representación mínima (por ejemplo, "un 2×3, 4, 5, 2×6") ● Representación comprimida: Versión reducida y abstracta del "2" (en el centro) ● Proceso de decodificación: El decoder reconstruye la imagen original a partir de la versión comprimida ● Salida: Imagen reconstruida del "2", similar a la original, aunque puede "perder un poco de características"
El sobreajuste ocurre cuando el modelo aprende en exceso los datos de entrenamiento, incluyendo el ruido, en vez de identificar patrones generalizables. Esto resulta en un rendimiento excelente en entrenamiento (99-100%) pero pobre en datos nuevos.
Busca encontrar los parámetros del modelo que minimizan la función de pérdida para mejorar su rendimiento. La función de pérdida mide qué tan bien actúa el modelo (ejemplo: MSE para regresión, entropía cruzada para clasificación). El objetivo es minimizar esta función para que
Gradiente Descendente (Gradient Descent): Actualiza parámetros moviéndose en la dirección opuesta al gradiente para minimizar la función de pérdida.