El deep learning (aprendizaje profundo) es un subconjunto del machine learning que utiliza redes neuronales artificiales con muchas capas (de ahí lo de "profundo") para aprender representaciones cada vez más abstractas de los datos.
Mientras que un modelo de ML tradicional puede necesitar que un humano le diga qué características buscar (por ejemplo, "fíjate en los bordes y colores de una imagen"), una red neuronal profunda descubre automáticamente las características relevantes directamente de los datos en bruto.
El deep learning es la tecnología detrás de los avances más impactantes de la IA reciente: modelos de lenguaje como GPT y Claude, generación de imágenes con DALL-E y Midjourney, reconocimiento facial, traducción automática y conducción autónoma. Todos estos sistemas utilizan redes neuronales profundas.
Las arquitecturas más relevantes incluyen las redes convolucionales (CNNs) para imágenes, las redes recurrentes (RNNs) para secuencias temporales, y los transformers, que revolucionaron el procesamiento del lenguaje natural y son la base de los LLMs actuales.
El deep learning requiere grandes cantidades de datos y potencia de cómputo significativa para el entrenamiento. Sin embargo, gracias a los modelos preentrenados y las APIs de compañías como OpenAI y Anthropic, cualquier empresa puede aprovechar el deep learning sin necesidad de entrenar sus propios modelos.