jueves, 12 de diciembre de 2024

Dos físicos retan a ChatGPT a sacarse un título universitario y esto es lo que consiguen

 

La 'batalla' entre la IA y los humanos tiene un nuevo capítulo (Freepik)

Los investigadores sometieron a la IA de OpenAI a un experimento. El objetivo era averiguar si era capaz de graduarse en Física y, en caso afirmativo, con qué calificación


ChatGPT, la inteligencia artificial de OpenAI, ha sido sometida a una prueba de lo más inusual con el propósito de evaluar si realmente es ya una competencia científica para los humanos: ¿podría aprobar un grado en Física? Un estudio publicado en el European Journal of Physics, el cual ha sido elaborado por L.J. Morrell y K.A. Pimbblet, ha evaluado su rendimiento en asignaturas de esta disciplina. Los resultados, aunque prometedores en ciertos aspectos, revelan las limitaciones actuales de esta tecnología.

El experimento siguió un enfoque conocido como "inteligencia máxima", que optimiza las capacidades del modelo. Esto incluyó simplificar preguntas, desglosar tareas complejas en partes más pequeñas y proporcionar indicaciones detalladas. Bajo estas condiciones, ChatGPT obtuvo resultados excepcionales en asignaturas como Modelado numérico y simulación, destacando especialmente en problemas relacionados con programación y cálculo matemático.

Sin embargo, la inteligencia artificial mostró importantes carencias en materias que requieren habilidades prácticas. Por ejemplo, en módulos de laboratorio, la imposibilidad de realizar mediciones experimentales y la dependencia de datos introducidos manualmente limitaron su desempeño. Esto subraya la necesidad de habilidades humanas en ámbitos donde la interacción física es esencial.

Fortalezas y debilidades

En evaluaciones escritas, ChatGPT logró una media del 65%, equivalente a un título de segunda clase superior en el sistema británico. Su mayor fortaleza radica en la resolución de problemas bien estructurados, como la implementación de la ecuación del diodo Shockley en Python. Estas tareas, basadas en conceptos claros y soluciones predefinidas, son donde la IA brilla con mayor intensidad.

No obstante, cuando se enfrentó a problemas más complejos o que requerían razonamiento abstracto, el rendimiento de ChatGPT disminuyó notablemente. En el módulo de Mecánica clásicacometió errores de relevancia, como en el cálculo de la aceleración gravitatoria en la Estación Espacial Internacional. Estas fallas evidencian las limitaciones de la IA en áreas que exigen razonamiento avanzado o integración interdisciplinar.

Font, article de R. Badillo per a "El Confidencial"

No hay comentarios:

Publicar un comentario