Aviso

 

OpenAI ha presentado o3, su nueva familia de modelos de razonamiento que promete acercar a la humanidad a la inteligencia artificial general (AGI, por sus siglas en inglés).

La propuesta se encuentra en fase experimental y se ha puesto a disposición de investigadores externos para evaluar sus capacidades y garantizar su seguridad antes del lanzamiento oficial.

El conjunto contempla dos versiones del algoritmo. El o3 estándar está diseñado para procesar grandes cantidades de datos y realizar tareas generales. Por su parte, la variante 03-mini opera con una menor cantidad de parámetros y es ideal para responder a tareas más específicas.

La compañía dirigida por Sam Altman asegura que sus nuevos productos superan a OpenAI o1 en todas las referencias de rendimiento. En las pruebas de codificación SWE-Bench Verified, o3 es 22.8% más preciso que su antecesor. Alcanza casi 90% de aciertos en el benchmark GPQA Diamond que evalúa las habilidades para resolver problemas científicos de nivel experto. El sistema fue capaz de solucionar el 25% de los desafíos matemáticos y de razonamiento más avanzados. Hasta el momento, ninguna otra IA había logrado completar más del 2% de estas tareas.

El avance tecnológico sugiere que OpenAI se está acercando cada vez más a la AGI. Su nuevo conjunto de modelos obtuvo una puntuación de 87.5% en el indicador ARC-AGI, una prueba que mide las habilidades del algoritmo para adquirir por su cuenta conocimientos de manera eficiente y más allá de los datos con los que fue entrenado. La generación o3 triplicó el desempeño de o1 en este campo.

OpenAI quiere garantizar la seguridad de su nueva IA

La startup comparte que o3 ha sido capacitado para “reflexionar a través de una cadena privada de pensamiento” antes de responder. Cuando recibe una instrucción, hace una pausa, fragmenta la solicitud y la relaciona con otras indicaciones previas para entregar un resultado más preciso. El procedimiento es una característica generalizada en los recursos de inteligencia artificial de razonamiento y está asociado a una disminución en la rapidez de respuesta.

Una de las novedades de o3 es que permite definir el tiempo de cálculo. Los usuarios pueden elegir entre velocidades bajas, medias y altas de procesamiento de datos. Cuanto mayor sea este rango, más fiables serán las respuestas propuestas por el algoritmo, según la firma.

La creadora de ChatGPT comparte que su nueva IA ha sido entrenada con una técnica conocida como “alineación deliberativa” para alinear su funcionamiento con los principios de seguridad internos. Este método obliga al sistema a analizar y “razonar de manera activa” si la solicitud de un usuario se ajusta a los criterios de uso adecuados de las tecnologías de OpenAI.