El 20 de diciembre el sistema o3 de OpenAI alcanzó un puntaje de 85% en la prueba ARC-AGI, bien por encima del mejor puntaje anterior de la IA, de 55%, y a la par del puntaje promedio humano
IA arrojó resultados de nivel humano en una prueba diseñada para medir la “inteligencia general”

IA arrojó resultados de nivel humano en una prueba diseñada para medir la “inteligencia general”.-Un nuevo modelo de inteligencia artificial que también obtuvo muy buen puntaje en una prueba muy difícil de matemáticas. Crear inteligencia artificial general o AGI es el objetivo de todos los grandes laboratorios de investigación de IA. A primera vista parece que OpenAI tal vez haya al menos dado un gran paso hacia este objetivo.

Si bien todavía hay escepticismo, muchos investigadores y desarrolladores de IA sienten que algo acaba de cambiar. Para muchos, la idea de la AGI ahora se ve más real, urgente, y cercana de lo que se anticipaba. ¿Será así?

Para entender lo que significa el resultado del sistema o3 hay que entender de qué va la prueba ARC-AGI. En términos técnicos la prueba es de “eficiencia de muestra” de un sistema de IA para adaptarse a algo nuevo, como cuántos ejemplos de una situación nueva necesita ver el sistema para calcular cómo funciona.

Te puede interesar: La primera teletransportación cuántica se llevó a cabo por un cable de internet

Un sistema de IA como ChatGPT (GPT-4) no es muy eficiente con las muestras. Se lo “entrenó” con millones de ejemplos de textos humanos, construyendo “reglas” de probabilidad para las combinaciones de palabras más probables.

El resultado en tareas comunes es bastante bueno. En tareas que no son comunes es malo porque tiene menos datos (menos muestras) de esas tareas. Hasta que los sistemas de IA puedan aprender de pocos ejemplos y adaptarse con mayor eficiencia, solo se podrán usar para tareas muy repetitivas en las que sea tolerable el fracaso ocasional.

La capacidad para resolver con precisión problemas desconocidos o nuevos a partir de limitadas muestras de datos es lo que se conoce como capacidad para generalizar. Se considera un elemento de inteligencia necesario, e incluso fundamental.

EO//Con información de Gizmodo