Рубрики NoticiasSuaveTecnologías

Conoce CriticGPT — «maestro» ChatGPT, que buscará errores en las respuestas del chatbot

Опубликовал
Катерина Даньшина

«¡Sigo poniendo un dos a lápiz!» (c)

OpenAI desarrollado un modelo separado de CriticGPT que buscará errores en las respuestas de ChatGPT — principiante «profesor» se centrará en fragmentos de código y, como se ha señalado, solo será una herramienta auxiliar para los expertos humanos que revisarán manualmente los textos del chatbot.

CriticGPT, basado en la familia GPT-4 de modelos lingüísticos, se entrenó además con un conjunto de muestras de código con errores insertados deliberadamente y en las primeras pruebas demostró ser mejor que los humanos en el 63% de los casos. Al parecer, escribió críticas mejores y más detalladas, reduciendo la frecuencia de las llamadas alucinaciones en el chatbot.

Durante el entrenamiento, CriticGPT encontró con éxito tanto errores insertados deliberadamente por humanos como errores añadidos por ChatGPT inicialmente.

Uno de los ejemplos del trabajo de CriticGPT

Los investigadores de OpenAI también han creado una nueva técnica llamada Force Sampling Beam Search (FSBS), que ayuda a CriticGPT a escribir revisiones de código más detalladas y puede equilibrarse en función de las necesidades de entrenamiento del modelo de crítico.

Curiosamente, en una fase del experimento, CriticGPT recibió respuestas que la gente había marcado previamente como perfectas — y encontró errores en el 24% de los casos (confirmados posteriormente por los revisores). OpenAI cree que esto demuestra el potencial del modelo para comprobar tareas no codificadas y destaca su capacidad para detectar «los errores más sutiles» que incluso una revisión humana cuidadosa podría pasar por alto.

A pesar de sus prometedores resultados, CriticGPT, como todos los modelos de IA, tiene limitaciones. Se ha entrenado con respuestas de ChatGPT relativamente cortas, por lo que aún no está preparado para tareas más largas y complejas.

Los comentarios de Disqus están cargando....