OpenAI o1 da un salto importante en las herramientas que tenemos disponibles.

Pablo Vittori
7 min readSep 30, 2024

--

Septiembre del 2024 marcó un momento crucial en el panorama de la inteligencia artificial cuando OpenAI levantó el telón sobre su último modelo de IA, señalando un avance sustancial en el campo. Durante meses, los expertos de la industria habían especulado sobre el proyecto clandestino de OpenAI, inicialmente denominado Q* y posteriormente renombrado como Proyecto Strawberry. El desarrollo interno tenía como objetivo mejorar las capacidades de razonamiento de la IA, abordando uno de los aspectos más desafiantes de la inteligencia artificial.

OpenAI presentó oficialmente el lanzamiento o1, un modelo que no solo abandona la convención de nombres GPT tradicional, sino que también representa una renovación estratégica del producto diseñada para cumplir las ambiciosas promesas de sus predecesores.

Abriendo Nuevos Horizontes en el Razonamiento de la IA

En una publicación detallada en su blog acompañando el anuncio, OpenAI destacó que el modelo o1 realiza avances significativos en áreas que dependen en gran medida del razonamiento, dominios donde iteraciones anteriores, incluido el reconocido GPT-4, habían encontrado limitaciones. Estos avances son particularmente evidentes en los puntos de referencia estandarizados, que a menudo se modelan según exámenes humanos diseñados para probar las capacidades de la IA. El modelo o1 ha demostrado mejoras notables al responder preguntas complejas en diversas disciplinas como matemáticas, ciencias y programación, algunas de las cuales alcanzan el nivel de sofisticación de exámenes de doctorado.

El Avance Tecnológico Detrás de o1

El avance logrado por OpenAI con o1 se atribuye a una combinación sofisticada de reinforcement learning (aprendizaje por refuerzo) y chain-of-thought reasoning (razonamiento en cadena de pensamiento). El aprendizaje por refuerzo, un paradigma de aprendizaje automático que ha mostrado resultados impresionantes en áreas como la inteligencia artificial para juegos, permite que el modelo aprenda estrategias óptimas a través de prueba y error. Cuando se integra con el razonamiento en cadena de pensamiento — un método que descompone problemas intrincados en pasos más pequeños y manejables — el modelo o1 puede abordar sistemáticamente los desafíos para llegar a soluciones.

OpenAI explicó en su blog: “A través del aprendizaje por refuerzo, o1 aprende a perfeccionar su cadena de pensamiento y refinar las estrategias que utiliza. Aprende a reconocer y corregir sus errores. Aprende a desglosar pasos complicados en otros más simples. Aprende a intentar un enfoque diferente cuando el actual no está funcionando.” Esta interacción dinámica entre el aprendizaje a partir de retroalimentación y la resolución metódica de problemas permite que o1 maneje tareas complejas con mayor precisión y eficiencia.

Métricas de Rendimiento Excepcionales

El modelo o1 ha mostrado métricas de rendimiento impresionantes que subrayan sus capacidades mejoradas de razonamiento. En escenarios de programación competitiva, o1 se ubicó dentro del 11 por ciento superior, demostrando una competencia que rivaliza con algunos de los mejores programadores humanos. Además, alcanzó puntuaciones lo suficientemente altas como para calificar para la Olimpiada de Matemáticas, una prestigiosa competencia matemática generalmente reservada para estudiantes de secundaria. Más allá de estos logros, o1 superó a titulares de doctorados humanos en puntos de referencia que evalúan el conocimiento en física avanzada, biología y química. Estos resultados no solo destacan el rendimiento superior de o1 en comparación con GPT-4, sino que también lo establecen como una herramienta formidable en entornos académicos y profesionales.

Sin embargo, es importante señalar que OpenAI observó que o1 aún puede no igualar a GPT-4 en tareas que están estrictamente limitadas al lenguaje. Esto sugiere que, si bien o1 sobresale en áreas que requieren razonamiento, todavía hay margen de mejora en aplicaciones puramente lingüísticas.

La Búsqueda Industrial de un Razonamiento Avanzado

La búsqueda de capacidades de razonamiento de múltiples pasos no es exclusiva de OpenAI. Google DeepMind es otro actor importante que está realizando inversiones significativas en esta área. AlphaGeometry de DeepMind, por ejemplo, combina un gran modelo de lenguaje con un modelo simbólico — un enfoque más tradicional y codificado — para lograr niveles de rendimiento comparables a los de los mejores estudiantes de geometría de secundaria. Demis Hassabis, opede DeepMind, también ha enfatizado el uso del aprendizaje por refuerzo como una estrategia central para mejorar futuros modelos, destacando su importancia en su hoja de ruta de desarrollo.

Los avances realizados tanto por OpenAI como por DeepMind indican una tendencia más amplia en la industria hacia la creación de sistemas de IA que puedan razonar a través de problemas complejos de manera similar a los procesos de pensamiento humanos. Estos esfuerzos son cruciales para desarrollar una IA que pueda utilizarse de manera confiable en una amplia gama de aplicaciones, desde la investigación científica hasta la ingeniería avanzada y más allá.

Escalando la IA sin Aumentar el Tamaño del Modelo

Uno de los aspectos más notables del lanzamiento de o1 es su demostración de que se puede lograr un progreso significativo en las capacidades de la IA sin simplemente aumentar el tamaño de los modelos, una estrategia conocida como escalado. Tradicionalmente, el escalado implica mejorar el rendimiento de la IA haciendo que los modelos sean más grandes y entrenándolos con conjuntos de datos más extensos, un método que, aunque efectivo, plantea desafíos en términos de recursos computacionales y consumo de energía.

El éxito de o1 sugiere que enfoques innovadores, como la integración del aprendizaje por refuerzo y el razonamiento en cadena de pensamiento, pueden producir mejoras sustanciales en el rendimiento de la IA sin la necesidad de un escalado continuo. Este es un desarrollo prometedor, ya que apunta hacia caminos más sostenibles y eficientes para el avance de la IA.

Sin embargo, el escalado sigue siendo una parte esencial del desarrollo de la IA. Los movimientos recientes en la industria indican que las empresas aún están invirtiendo fuertemente en esfuerzos de escalado para asegurar el respaldo financiero necesario y los recursos energéticos requeridos para soportar modelos cada vez más grandes y complejos.

Impulso Financiero Detrás de los Avances en la IA

El lanzamiento de o1 coincidió con desarrollos financieros significativos dentro de OpenAI y la industria de la IA en general. Informes indican que OpenAI está en proceso de recaudar nuevos fondos de inversores, valorando la empresa en una asombrosa cifra de 150 mil millones de dólares, casi el doble de la valoración de la compañía en el mismo período del año pasado. De manera similar, Anthropic, otra firma prominente de IA, está involucrada en su propia ronda de financiación, con valoraciones potenciales que alcanzan los 40 mil millones de dólares.

Estas valoraciones reflejan la inmensa confianza que los inversores tienen en el futuro de la IA generativa y su potencial para revolucionar diversos sectores. A pesar del rápido crecimiento en las bases de usuarios — la base de usuarios de OpenAI se ha duplicado en el último año — los ingresos generados hasta ahora son insuficientes para cubrir los costos operativos y los gastos exorbitantes asociados con el entrenamiento de modelos de IA de próxima generación. Para cerrar esta brecha, se están canalizando inversiones sustanciales en la infraestructura de IA.

Una coalición notable compuesta por Microsoft, BlackRock, Global Infrastructure Partners y MGX ha anunciado planes para recaudar una impresionante suma de 100 mil millones de dólares dedicados a la construcción de infraestructura de IA. Esta iniciativa incluye 30 mil millones de dólares en capital privado, complementados por financiamiento mediante deuda para cubrir los fondos restantes. Estas inversiones masivas subrayan la escala a la que opera la industria y la creencia de que los retornos de estas inversiones podrían alcanzar los billones.

Evaluando la Factibilidad del Escalado Continuo

Dado el ritmo implacable de inversión, surgen preguntas sobre la factibilidad técnica de mantener tal crecimiento. Un informe reciente de Epoch AI investigó si los insumos primarios necesarios — como energía, chips semiconductores y datos — pueden mantenerse al ritmo de las demandas del escalado de la IA actual. Los hallazgos sugieren que, técnicamente, es posible escalar modelos de IA al menos 10,000 veces más allá de GPT-4 de OpenAI para el año 2030.

Sin embargo, el informe identifica el principal cuello de botella como los requerimientos energéticos necesarios para alimentar la próxima ola de centros de datos. El crecimiento exponencial en el procesamiento y almacenamiento de datos requerirá avances significativos en la infraestructura energética para soportar estos desarrollos de manera sostenible.

Proyectos Ambiciosos de Infraestructura en el Horizonte

A la luz de estas demandas energéticas, líderes de la industria como Sam Altman, CEO de OpenAI, han estado interactuando activamente con organismos gubernamentales para proponer proyectos de infraestructura a gran escala. Notablemente, Altman ha presentado planes al gobierno de los EE. UU. para la construcción de varios centros de datos de cinco gigavatios en todo el país. Para poner esto en perspectiva, una sola instalación de cinco gigavatios es comparable a la producción de energía de cinco plantas nucleares, capaces de suministrar energía a aproximadamente tres millones de hogares.

En un desarrollo relacionado, Microsoft ha anunciado planes para reabrir la planta nuclear Three Mile Island en Pensilvania, enfatizando aún más la necesidad crítica de fuentes de energía robustas y confiables para soportar la infraestructura de IA en auge.

El Camino por Delante: Equilibrando Inversión e Innovación

El actual aumento en la inversión refleja el inmenso potencial que las grandes empresas tecnológicas ven en la inteligencia artificial. Con cientos de miles de millones de dólares canalizados hacia el desarrollo de la IA, los retornos anticipados se proyectan en los billones, impulsando aún más la innovación y expansión dentro de la industria.

Sin embargo, la sostenibilidad de este crecimiento depende de qué tan efectivamente el escalado continúe generando beneficios tangibles. Las futuras inversiones probablemente dependerán de que la próxima generación de modelos de IA demuestre avances claros y significativos sobre sus predecesores. Además, descubrimientos como o1, que logran más con menos mediante metodologías innovadoras, podrían ofrecer vías alternativas para el progreso, reduciendo la dependencia del mero escalado.

A medida que el panorama de la IA continúa evolucionando, el camino a seguir se está volviendo cada vez más claro. Con un respaldo financiero sustancial, avances tecnológicos de vanguardia e inversiones estratégicas en infraestructura, la industria está preparada para perseguir objetivos ambiciosos. El enfoque sigue siendo desarrollar una IA que no solo escale, sino que también exhiba capacidades mejoradas de razonamiento y resolución de problemas, asegurando que la próxima generación de modelos de IA pueda satisfacer las demandas complejas del mundo moderno.

--

--

Pablo Vittori

Consultant and CTO, Former Globant CTO for Latam, Nerd, Early Adopter, Father. Living from what i love since 1990.