Autor: Dr. José Luis Mateos | Director de Transformación Digital en Honne Services
Cuando uno revisa la historia de la inteligencia artificial (IA), se encuentra con un período de surgimiento, como muchos otros campos del conocimiento, pero también con los llamados inviernos de la IA. Estos dos inviernos corresponden a periodos en los cuales decayó el apoyo y la inversión económica por parte de empresas y gobiernos, producto del desencanto al no obtenerse las expectativos esperadas.
En este artículo analizaremos a qué se debió el surgimiento de estos dos inviernos, cómo se logró salir de ambos, y la razón por lo cuál no se espera un tercer invierno de la IA.
Este último punto es de crucial importancia para las empresas, ya que entender el porqué no habrá un tercer invierno y que, por lo tanto, el futuro de la IA es brillante y prometedor, es vital para la toma de decisiones y la planeación estratégica en las empresas.
Los dos inviernos de la IA
Los dos principales “inviernos” de la inteligencia artificial (IA) se refieren a periodos durante los cuales el entusiasmo, la financiación y el progreso en el campo de la IA experimentaron notables declives. Estos periodos fueron caracterizados por expectativas exageradas, seguidas de desilusión y recortes significativos en financiamiento.
Primer Invierno de la IA (Años 70 y Principios de los 80)
Causas:
1. Expectativas Irrealistas: A finales de los años 60, se habían generado expectativas muy altas sobre las capacidades de la IA que no pudieron cumplirse. Los investigadores prometieron más de lo que la tecnología de la época podía ofrecer, particularmente en términos de comprensión del lenguaje natural y la traducción automática.
2. Limitaciones Tecnológicas: La tecnología disponible en ese momento era insuficiente para soportar los modelos y algoritmos de IA necesarios para cumplir estas expectativas. Las limitaciones en potencia de cómputo y almacenamiento de datos eran significativas.
3. Reducción del Financiamiento: La desilusión por la falta de progreso llevó a una reducción drástica en el financiamiento por parte de gobiernos y entidades privadas, especialmente notable en Estados Unidos y el Reino Unido, tras publicaciones críticas como el informe Lighthill.
Superación:
La superación de este primer invierno de la IA comenzó a finales de los años 80, gracias a varios factores:
– Enfoque en Dominios Específicos: La IA empezó a aplicarse en áreas más específicas y controladas, como sistemas expertos, que demostraron utilidad práctica en campos como la medicina y la geología.
– Avances en Hardware: Mejoras en la capacidad de procesamiento y almacenamiento de los ordenadores permitieron abordar problemas más complejos.
– Nuevas Metodologías: El desarrollo de nuevas técnicas y enfoques en IA, como las redes neuronales, que, a pesar de entrar en un periodo de relativo ostracismo, sentaron las bases para futuros avances.
Segundo Invierno de la IA (Finales de los 80 y Principios de los 90)
Causas:
1. Fracaso de los Sistemas Expertos
Aunque los sistemas expertos encontraron aplicaciones útiles, también se enfrentaron a limitaciones importantes. Eran costosos de mantener, difíciles de actualizar, y no podían generalizar su conocimiento más allá de sus estrechos dominios de aplicación.
2. Limitaciones del Procesamiento de Símbolos
La aproximación dominante a la IA, basada en el procesamiento de símbolos (o inteligencia artificial simbólica), demostró ser insuficiente para capturar la complejidad del razonamiento humano y el procesamiento de información natural.
3. Nuevamente, Reducción de Financiamiento
La decepción renovada resultó en otra ronda de recortes en la inversión, tanto de fuentes gubernamentales como comerciales.
Superación:
La recuperación del segundo invierno de la IA se produjo gracias a:
Auge de Internet
La expansión de Internet en los años 90 aumentó exponencialmente la cantidad de datos disponibles, lo que proporcionó una rica fuente de información para entrenar modelos de IA.
Mejoras en Hardware
Continuaron las mejoras en potencia de procesamiento, especialmente con la llegada de los GPUs para el entrenamiento de redes neuronales, lo que facilitó el desarrollo de algoritmos más sofisticados.
Avances en Machine Learning y Redes Neuronales
El resurgimiento del interés en las redes neuronales, especialmente con el desarrollo del aprendizaje profundo a finales de los 2000 y principios de los 2010, demostró capacidades que superaban significativamente los enfoques anteriores de la IA.
Estos avances, junto con la inversión renovada tanto del sector público como privado, impulsaron un renacimiento en el campo de la IA, llevándolo a la prominencia y el éxito que disfruta hoy en día. Este renacimiento ha sido marcado por avances significativos en procesamiento del lenguaje natural, visión por computadora, sistemas autónomos, y más, alimentando el optimismo y la inversión en la investigación y aplicación de la IA en una amplia gama de sectores.
La superación de los inviernos de la inteligencia artificial (IA) fue posible gracias a las contribuciones de destacados investigadores, instituciones académicas y empresas tecnológicas. La colaboración entre estos diversos actores fue fundamental para revitalizar el campo, introduciendo innovaciones técnicas, nuevos enfoques teóricos y aplicaciones prácticas que demostraron el potencial de la IA.
Personas clave
Geoffrey Hinton, Yann LeCun y Yoshua Bengio
Conocidos como los “padrinos del aprendizaje profundo”, su investigación en redes neuronales y aprendizaje profundo a finales de los 80 y principios de los 90 sentó las bases para muchos de los avances actuales en IA.
Instituciones Académicas
Universidad de Stanford: Fue un centro neurálgico para la investigación en IA desde sus inicios, jugando un papel crucial en el desarrollo de sistemas expertos y en el renacimiento de las redes neuronales.
Instituto Tecnológico de Massachusetts (MIT): Contribuyó significativamente al avance de la IA a través de su laboratorio de IA, especialmente en los campos de robótica y procesamiento del lenguaje natural.
Universidad de Toronto: Bajo el liderazgo de Geoffrey Hinton, se convirtió en un centro importante para la investigación en aprendizaje profundo, contribuyendo al desarrollo de algoritmos y técnicas que impulsaron el campo.
Empresas Tecnológicas
Ha sido un jugador clave en la promoción del aprendizaje profundo, especialmente a través de adquisiciones como DeepMind, cuyas investigaciones en aprendizaje por refuerzo y otras áreas han impulsado avances significativos en la IA.
Aunque originalmente enfocada en gráficos por computadora, NVIDIA se convirtió en una empresa fundamental para el avance de la IA mediante el desarrollo de GPUs que aceleran significativamente el entrenamiento de redes neuronales.
Con el surgimiento de los Transformers en 2017, inicia un auge en el estudio del procesamiento del lenguaje natural (NLP), que dio lugar a los modelos grandes del lenguaje (LLMs) y a la IA generativa con los Generative Pretrained Transformers (GPT), con su célebre chatGPT a finales de 2022.
¿Por qué no ocurrirá un tercer invierno de la IA?
Para entender por qué no ocurrirá el surgimiento de un tercer invierno de la IA, es fundamental tomar en cuenta la existencia de lo que yo llamo la terna virtuosa: 1) datos masivos, 2) hardware avanzado y 3) software y algoritmos.
Para expandir y profundizar en el contenido sobre los aspectos cruciales de la inteligencia artificial (IA) – datos masivos, hardware avanzado, y software y algoritmos potentes – es esencial desglosar y detallar aún más cada uno de estos tres componentes de la terna virtuosa, sus interconexiones, y cómo juntos están acelerando el progreso en el campo de la IA.
1) Datos Masivos: El Combustible de la IA
El Auge de los Datos
En la era actual, caracterizada por la digitalización masiva, los datos se generan a una escala sin precedentes. Este fenómeno es impulsado por la proliferación de dispositivos conectados a internet, plataformas de redes sociales, sistemas empresariales, y sensores IoT, produciendo una diversidad de datos que incluye texto, imágenes, video, y señales de sensores. Estos vastos conjuntos de datos, conocidos como big data, son el combustible que alimenta los avances en IA, proporcionando la materia prima necesaria para entrenar modelos de aprendizaje automático y aprendizaje profundo.
Tecnologías de Procesamiento y Análisis
Para transformar estos enormes volúmenes de datos en información útil para la IA, se han desarrollado y perfeccionado tecnologías de procesamiento y análisis de datos. Diversas herramientas y la tecnología de la nube, facilitan el procesamiento distribuido de datos, permitiendo manejar grandes volúmenes de información de manera eficiente. Estos sistemas utilizan clústers de computadoras para procesar y analizar datos en paralelo, reduciendo significativamente el tiempo necesario para obtener información valiosa.
Desafíos y Soluciones en el Manejo de Datos Masivos
El manejo de datos masivos implica enfrentar desafíos relacionados con su volumen, variedad, y velocidad. La integración, limpieza, y preparación de datos de fuentes heterogéneas son tareas críticas que requieren algoritmos avanzados y técnicas de data analítica y machine learning para asegurar que los datos estén listos para su análisis. Además, el almacenamiento eficiente de estos datos plantea desafíos en términos de infraestructura y accesibilidad, impulsando el desarrollo de soluciones de almacenamiento en la nube y bases de datos que ofrecen escalabilidad y flexibilidad.
2) Hardware Avanzado: El Poder Detrás de la IA
Evolución de los Procesadores para IA
El progreso en el campo de la IA ha sido paralelo al desarrollo de hardware especializado que puede satisfacer sus intensivas demandas computacionales. Los procesadores gráficos (GPUs) han evolucionado desde su uso en videojuegos y aplicaciones gráficas hasta convertirse en pilares para el entrenamiento de modelos de IA, gracias a su habilidad para realizar cálculos paralelos a gran escala. De manera similar, las unidades de procesamiento tensoriales (TPUs) han sido diseñadas específicamente para acelerar las cargas de trabajo de aprendizaje automático, ofreciendo mejoras significativas en términos de velocidad y eficiencia energética.
Impacto en la Innovación y el Desarrollo
El acceso a hardware más potente y rápido ha catalizado la innovación en IA, permitiendo la experimentación con modelos más complejos y la exploración de nuevas fronteras en la investigación. Este avance ha facilitado el desarrollo de aplicaciones que antes se consideraban inviables, como vehículos autónomos, sistemas avanzados de recomendación, y asistentes virtuales inteligentes. La continua miniaturización y mejora en la eficiencia de estos procesadores también promete hacer la IA más accesible y sostenible, abriendo el camino para su integración en dispositivos móviles y sistemas embebidos.
3) Software y Algoritmos: La Inteligencia de la IA
Profundizando en el Deep Learning
El deep learning, una técnica que utiliza redes neuronales profundas para modelar abstracciones complejas en grandes volúmenes de datos, ha sido fundamental para los recientes éxitos en IA. Estas redes, que imitan la estructura y función del cerebro humano, han demostrado ser excepcionalmente buenas en tareas como el reconocimiento de patrones y la clasificación. Los avances en esta área han sido posibles gracias a la disponibilidad de grandes conjuntos de datos y el poder computacional necesario para entrenar estas redes, resultando en progresos notables en visión por computadora, procesamiento del lenguaje natural, y otros campos.
Innovaciones en IA Generativa
La IA generativa, incluyendo tecnologías como los modelos de Transformers, han abierto nuevas posibilidades en la creación de contenido digital sintético. Estos modelos no solo pueden generar imágenes, textos, videos y sonidos, indistinguibles de los creados por humanos, sino que también pueden ser utilizados para diseñar fármacos, crear arte, y simular escenarios complejos para entrenamiento y análisis. La capacidad de estos modelos para aprender y generar nuevos patrones a partir de datos existentes está transformando creativamente numerosas industrias, desde el entretenimiento hasta la biotecnología.
Desafíos en el Desarrollo de Algoritmos
A pesar de los avances, el desarrollo de algoritmos de IA aún enfrenta desafíos significativos, incluyendo la necesidad de mejorar la eficiencia computacional, reducir los requisitos de datos para el entrenamiento, y aumentar la interpretabilidad de los modelos. La investigación en técnicas como el aprendizaje por transferencia, el aprendizaje semi-supervisado, y el aprendizaje reforzado apunta hacia soluciones que pueden hacer que los modelos de IA sean más robustos, versátiles, y comprensibles.
La interacción entre los datos masivos, el hardware avanzado, y el software y algoritmos, está impulsando una era de innovación sin precedentes en el campo de la IA. A medida que estos elementos continúan evolucionando de manera alineada, las posibilidades para aplicaciones de IA se expanden, prometiendo transformaciones significativas en prácticamente todos los sectores de la sociedad.
El mensaje para las empresas es el siguiente: dado que por primera vez tenemos a esta terna virtuosa alineada, es claro que no surgirá un tercer invierno de la IA. Por el contrario, se avizora un futuro brillante. Por lo cual, hay que sumarse a esta revolución. Esto es solo el inicio: la punta del iceberg.
Dr. José Luis Mateos Trigos, físico mexicano, doctorado en Ciencias (Física) de la UNAM, posdoctorado en la Universidad de Northeastern. Investigador, coordinador de investigación, premiado autor y divulgador científico. Director de Transformación Digital en Honne Services.