YouTube
Los investigadores chinos afirman que modelos modernos de IA ya son capaces de reconocer y clasificar distintas categorías de información, igual que los humanos.
Según científicos del Según investigadores de la Academia China de Ciencias y la Universidad Tecnológica del Sur de China, en Guangzhou, algunos modelos de IA copian funciones clave del cerebro humano al realizar tareas de clasificación de información. Los investigadores pretendían averiguar si grandes modelos lingüísticos, como ChatGPT o Gemini, para comprender y procesar información sobre diversos objetos de forma similar a la humana.
Para ello, los investigadores encomendaron a los modelos de IA ChatGPT-3.5 y Gemini Pro Vision la tarea de eliminar el texto y los objetos visuales innecesarios de una serie de textos y objetos visuales. Para ello, se recopilaron 4,7 millones de respuestas de 1.854 objetos diferentes, entre ellos perros, sillas, manzanas, coches, etc.
Los investigadores descubrieron que 66 de los modelos creados por la IA se basaban en la forma en que las personas hacen las cosas. Estos modelos incluían atributos bastante complejos, como: textura, significado emocional y accesibilidad para los niños.
Los investigadores descubrieron que los modelos multimodales capaces de combinar texto e imágenes imitan aún más el pensamiento humano. Además, el equipo descubrió que los datos de los escáneres cerebrales revelaban una coincidencia entre la forma en que la IA y los cerebros humanos reaccionan ante los objetos.
Según los científicos chinos, los resultados de su estudio demuestran que las IA son realmente capaces de acercarse a la comprensión humana, y no sólo de imitar respuestas Los futuros modelos de IA podrán adquirir un razonamiento más intuitivo y compatible con el ser humano, algo esencial para la robótica, la educación y la colaboración entre humanos.
Sin embargo grandes modelos lingüísticos embargo, no entienden los objetos del mismo modo que los humanos a nivel emocional o empírico. Los modelos de IA funcionan, reconociendo patrones en textos o contenidos visuales, pero a diferencia de los humanos, esto no se basa en la experiencia vital ni en la interacción sensoriomotora. Los grandes modelos lingüísticos son más bien un espejo que refleja millones de fuentes de información textual y visual al usuario basándose en los patrones que han aprendido.
Los resultados del estudio se publican en la revista Nature
Fuente: Interesting Engineering