OpenAI anunció el lanzamiento de o3-mini, un nuevo modelo de razonamiento de IA rentable optimizado para tareas STEM, en respuesta a la creciente competencia de DeepSeek de China.
Según informan Fast Company y The Star, o3-mini ofrece un mejor rendimiento en ciencia, matemáticas y programación, mientras mantiene velocidad y asequibilidad, marcando un paso significativo en la misión de OpenAI de ampliar el acceso a capacidades avanzadas de IA.
DeepSeek, una startup china de inteligencia artificial, ha sacudido la industria tecnológica con su innovador modelo de IA que rivaliza con las capacidades de OpenAI a una fracción del costo. El modelo DeepSeek-V3 de la compañÃa, desarrollado por solo $5-6 millones, ha demostrado un rendimiento comparable al de ChatGPT mientras utiliza significativamente menos chips de computación especializados.
Este enfoque rentable ha provocado una reevaluación de las estrategias de desarrollo de IA en toda la industria, con actores importantes como Meta estableciendo "salas de guerra" para analizar los métodos de DeepSeek.
DeepSeek, una startup china de inteligencia artificial, ha sacudido la industria tecnológica con su innovador modelo de IA que rivaliza con las capacidades de OpenAI a una fracción del costo. El modelo DeepSeek-V3 de la compañÃa, desarrollado por solo $5-6 millones, ha demostrado un rendimiento comparable al de ChatGPT mientras utiliza significativamente menos chips de computación especializados.
Este enfoque rentable ha provocado una reevaluación de las estrategias de desarrollo de IA en toda la industria, con actores importantes como Meta estableciendo "salas de guerra" para analizar los métodos de DeepSeek.
El impacto de la innovación de DeepSeek ha sido de gran alcance, causando una volatilidad significativa en el mercado. Gigantes tecnológicos como Nvidia experimentaron caÃdas sustanciales en sus acciones, con Nvidia perdiendo $589 mil millones en valor de mercado en un solo dÃa, la mayor pérdida de mercado en un dÃa en la historia de los Estados Unidos.
El modelo de código abierto y el desarrollo de bajo costo de DeepSeek no solo han desafiado el dominio de las empresas de IA establecidas, sino que también han planteado preguntas sobre el futuro de las inversiones en infraestructura de IA y el potencial para una accesibilidad más amplia a la IA. Esta disrupción ha intensificado la carrera de IA entre Estados Unidos y China, provocando respuestas rápidas de los competidores y remodelando el panorama global de la IA.
Rentabilidad del o3-mini
El modelo o3-mini de OpenAI ofrece ahorros significativos en costos en comparación con sus predecesores, mientras mantiene un alto rendimiento. Con un precio de $1.10 por millón de tokens de entrada y $4.40 por millón de tokens de salida, o3-mini es un 63% más barato que o1-mini y un 93% más barato que o1 en términos de costo por token1. Esta estrategia de precios competitiva posiciona a o3-mini como una opción más accesible para desarrolladores y empresas, especialmente en comparación con otros modelos en el mercado:
- Es más asequible que GPT-4o, que cuesta $2.50 por millón de tokens de entrada.
- Aunque sigue siendo más caro que el modelo R1 de DeepSeek ($0.55 por millón de tokens de entrada), o3-mini ofrece un mejor rendimiento en ciertos benchmarks.
- El modelo proporciona niveles de razonamiento flexibles (bajo, medio, alto), permitiendo a los usuarios optimizar entre costo o rendimiento según sus necesidades especÃficas.
A pesar de su rentabilidad, o3-mini representa una mejora significativa con respecto a modelos anteriores, ofreciendo respuestas un 24% más rápidas que o1-mini con mayor precisión. Este equilibrio entre rendimiento y asequibilidad convierte a o3-mini en una opción atractiva para una amplia gama de aplicaciones de IA, desde pequeñas empresas hasta grandes corporaciones.
Optimización STEM de o3-mini
o3-mini demuestra un rendimiento excepcional en campos STEM, destacándose particularmente en matemáticas, programación y razonamiento cientÃfico. En matemáticas de competencia, o3-mini con un alto esfuerzo de razonamiento supera a modelos anteriores en puntos de referencia como AIME 20241.
Para tareas de programación, alcanza la calificación Elo más alta de 2130 en Codeforces, superando a otros modelos incluso con menores esfuerzos de razonamiento. En ingenierÃa de software, o3-mini establece un nuevo estándar en las evaluaciones verificadas de SWE-bench, logrando un 39% de precisión con herramientas de código abierto y un 61% de precisión con estructuras internas.
- Resuelve más del 32% de los problemas de FrontierMath en el primer intento, incluyendo el 28% de los desafiantes problemas T32
- Iguala el rendimiento de o1 en preguntas cientÃficas a nivel de doctorado (GPQA Diamond) con un alto esfuerzo de razonamiento2
- Supera a o1 y o1-mini en puntos de referencia de matemáticas y programación, incluyendo AIME 2024 y Codeforces3
- Soporta llamadas a funciones, salidas estructuradas y mensajes para desarrolladores, lo que lo hace listo para producción en diversas aplicaciones