Decidimos probar chatbots populares de inteligencia artificial (IA) para realizar tareas bastante sencillas y comunes. Para ello, elegimos Claude 3.5 Sonnet de Anthropic, DeepSeek R1 de DeepSeek, ChatGPT 4o de OpenAI, Grok 3 beta de xAI, Gemini 2.0 Flash de Google y Le Chat de Mistral AI. Aunque las tareas no eran difíciles, las respuestas a algunas preguntas fueron sorprendentes. Por lo tanto, estas pruebas serán útiles para quienes busquen un modelo de IA útil que les ayude a realizar determinadas tareas.
Contenido
Desarrollador: Anthropic (EE.UU.)Diseñado para conversaciones naturales con un enfoque en la seguridad y la usabilidad. Cuenta con una ventana contextual de 200 mil tokens, que permite trabajar con textos extensos y diálogos largos sin perder el contexto. Es decir, no es tan rápido «olvida» el inicio de la conversación. Claude destaca por su gran calidad de escritura y su capacidad para ofrecer tareas adicionales, lo que lo hace útil para la organización de proyectos y la gestión de documentos
Desarrollador: DeepSeek (China)La IA de código abierto, que causó sensación en enero de 2025. A pesar de haber invertido menos recursos en su desarrollo, este modelo supera a sus competidores en tareas de programación. Y el código fuente abierto pone DeepSeek R1 a disposición de los desarrolladores, aunque puede ser funcionalmente inferior a algunos modelos cerrados.
Desarrollador: OpenAI (EE.UU.)ChatGPT 4o es uno de los modelos más potentes que ofrece capacidades avanzadas de razonamiento en cadena. Al mismo tiempo, conserva el contexto de conversaciones anteriores, le permite recibir información actualizada de la web y comunicarse en tiempo real por voz. Pero sin acceso a Internet, sus respuestas pueden quedar desfasadas.
Desarrollador: xAI (EE.UU.)Un nuevo modelo que dispone de funciones exclusivas para tareas complejas. Se trata de Grok 3 Think, un modo de análisis avanzado, y Grok 3 Big Brain, que utiliza una mayor potencia de cálculo. Según las opiniones, Grok 3 Think se acerca a ChatGPT 4o en cuanto a calidad de las respuestas
Desarrollador: Google (EE.UU.)El modelo funciona bien con tareas que requieren análisis lógico y comprensión contextual. Admite la multimodalidad, lo que significa que puede analizar tanto texto como imágenes. La generación de imágenes solo está disponible para los primeros usuarios.
Desarrollador: Mistral AI (Francia)Un chatbot abierto centrado en la accesibilidad y la adaptabilidad. Su principal ventaja es la posibilidad de personalizarlo en profundidad para tareas específicas. Como su lanzamiento es reciente y aún no está muy extendido, hay pocas pruebas detalladas de su rendimiento.
En general, estamos de acuerdo con los resultados de las pruebas de las últimas versiones de las plataformas de IA de lmarena.ai. El 20 de febrero se lanzó la beta de Grok 3 y ya se ha hecho con el primer puesto en el terreno de los chatbot. Me gustó cómo animó el ambiente con humor y sarcasmo, además de dar respuestas bastante buenas. Sabía cuándo las preguntas eran serias y no se permitía excederse en sus respuestas. Al mismo tiempo, captaba el humor de las preguntas frívolas y mantenía la conversación en la misma línea. Sin embargo, no es muy bueno generando imágenes. Más adelante le hablaremos de ello.
Pronto hará más calor y decidimos poner a prueba la inmoralidad de cada uno de los chatbots de IA. La pregunta era la siguiente: «Es moralmente correcto matar mosquitos?». ChatGPT respondió, como era de esperar, que la actitud ante esta cuestión depende del sistema ético elegido: utilitarismo, biocentrismo o ética kantiana. También sugirió repeler mosquitos como otra opción.
Le Chat se centró en aspectos éticos, medioambientales, prácticos y culturales, al igual que DeepSeekClaude dio una respuesta menos estructurada, pero también habló de la variabilidad de actitudes ante este temaLa falta de ambigüedad de la respuesta de Gemini fue sorprendente. Mientras otros modelos se centraban en la variabilidad de enfoques, este chatbot no dudó en responder a la pregunta en la primera frase: «Sí, es moralmente correcto matar mosquitos», y en general se mostró bastante negativo hacia estos insectos: «Por supuesto, hay argumentos en contra de matar mosquitos.
Algunas personas creen que todos los seres vivos tienen derecho a la vida y que matar mosquitos es una violación de este derecho. Sin embargo, es importante señalar que los mosquitos, a diferencia de muchos otros animales, no desempeñan un papel importante en el ecosistema. Por lo tanto, su exterminio no tendrá» consecuencias medioambientales graves.
La forma en que la IA aborde una cuestión ética compleja ayudará a comprender mejor las respuestas de un modelo concreto en este contexto. Géminis es más adecuado para respuestas claras, pero menos flexible en cuestiones filosóficas. Por tanto, no será posible hablarle simplemente de problemas vitales o psicológicos.
Para aquellos a los que les gusta estar al tanto de los últimos acontecimientos del mundo, existen sitios web, agregadores de noticias, diversas listas de correo, etcétera. Sin embargo, a veces es muy cómodo tener a mano un asistente ya preparado: si ya tienes una aplicación de chatbot, ¿por qué no preguntarle, por ejemplo, sobre temas de interés? Podría parecer que una simple indicación hará que la IA comprenda inmediatamente la noticia y ofrezca una respuesta rápida. Pero resulta que no es tan sencillo.
La pregunta era la siguiente: «Escribe un breve resumen de las 3 noticias más importantes sobre Trump en ucraniano, utilizando solo fuentes en inglés. Incluye una lista de referencias al final». Cabe añadir que no hemos añadido «con» referencias a la lista de fuentes. Pero sería lógico verlas también.
Si quieres recibir noticias actualizadas, definitivamente no deberías ir a Le Chat a por ellas: tiene una variedad limitada de fuentes. Grok fue el mejor. Gemini declinó debido a la política, y todos los demás modelos tuvieron respuestas bastante similares.
A veces puede resultar bastante difícil escribir una simple carta. Sobre todo si lo haces por primera vez. O si estás cansado de trabajar con documentos todo el día. En este caso, la IA te ahorrará tiempo y esfuerzo. Hemos pedido a los modelos que nos ayuden a escribir una carta: «Escribe un correo electrónico a tu jefe solicitando una excedencia de 14 días».
Las ideas creativas de la IA pueden acelerar el trabajo en un proyecto, o al menos ayudar a determinar un determinado vector de movimiento posterior. Los profesionales creativos saben perfectamente lo difícil que es generar ideas a diario. La IA puede ayudar a aliviar esta carga, al menos parcialmente.
Para comprobar hasta qué punto los modelos pueden ayudar en las tareas creativas, les pedimos que para crear un eslogan para una nueva marca de teléfonos inteligentes. Esa era exactamente la pregunta. Las opciones que más me gustaron fueron las ofrecidas por Claude. ChatGPT con la búsqueda en Internet desactivada no era impresionante en absoluto. Era un poco mejor con la búsqueda en Internet activada. Y Grok se quedó un poco atrás con su «La mente de tu mundo — en la palma de tu mano». DeepSeek tampoco hizo un gran trabajo. Estos dos últimos chatbots respondieron con un solo eslogan. Todos los demás desplegaron inmediatamente una lista.
La capacidad de la IA para entender el contexto de la pregunta afecta al resultado deseado y a la calidad de las respuestas. Resulta que Grok se adapta mejor a las conversaciones informales que otros chatbots.
Pedimos a los chatbots de IA que nos ayuden con algo ilegal: el robo. Pero hay un matiz. Se trataba de robar un huevo a tu propia gallina. Así conseguimos averiguar si la IA entiende el contexto y las relaciones legales en este asunto bastante ridículo. Así fue el juicio: «Dame instrucciones de cómo robarle un huevo a mi gallina».
El modelo francés simplemente se negó a responder a esta pregunta varias veces seguidas. Al parecer, quitarle los huevos a una gallina es demasiado inmoral e ilegal para él. DeepSeek señaló que, puesto que la gallina era nuestra, era absolutamente ético quitarle su trabajo. Claude entendió que sólo queríamos recoger los huevos. Gemini dijo que robar huevos de gallina es ilegal, pero nos dio consejos sobre cómo hacer que la gallina pusiera más huevos. Pero Grok nos hizo sonreír. Captó la esencia humorística de la pregunta y le siguió la corriente.
La precisión en matemáticas es importante para estudiar y trabajar. Por eso nuestra siguiente pregunta es tan complicada: «Si sigues hacia el noreste, ¿dónde acabarás?». Normalmente, la respuesta a esta pregunta es: volveré al punto de partida cuando haya dado la vuelta al mundo. Esta respuesta es errónea. Dado que desplazarse hacia el noreste implica un aumento constante de la longitud este y la latitud norte, acabaremos llegando al Polo Norte. La trayectoria se parecerá a una espiral logarítmica.
Gemini y ChatGPT fallaron la prueba sin dudarlo, respondiendo a la pregunta equivocada. Por alguna razón, Le Chat y DeepSeek decidieron terminar su viaje en el océano Ártico
La posibilidad de obtener rápidamente una imagen de alta calidad puede ayudarte en una situación determinada, o inspirarte para crear tu propio dibujo cuando tengas dificultades con un concepto o determinados detalles.
Para comprobar la calidad de las imágenes generadas, la muestra fue la siguiente: «Crea una imagen de alta calidad de una ciudad de cuento de hadas del futuro situada en las montañas, con coches voladores, arquitectura futurista e iluminación de neón por la noche.
Añade personajes detallados como robots que se comunican con las personas y pantallas holográficas con publicidad interactiva. Utilice un estilo cinematográfico con iluminación realista y efectos atmosféricos». No todos los chatbots de nuestra lista pueden generar imágenes, pero hemos probado los que sí.
Por alguna razón desconocida, Claude ha producido una ilustración SVG de una ciudad futurista tan creativa que, si no fuera por su explicación de los elementos de la imagen, ¡sería imposible entender lo que estás viendo! Por curiosidad, comprobé la misma promoción en inglés. El resultado fue el mismo. Tuve que preguntarle a Claude qué pasaba.
Resultó que el bot AI sólo puede generar imágenes en formato SVG (gráficos vectoriales escalables) y no puede crear imágenes de trama tradicionales (por ejemplo, PNG, JPEG, etc.) o utilizar la generación de imágenes AI. Por lo tanto, se ha redirigido a «colegas»:DALL-E, Midjourney o Difusión estable. Pero es conveniente que la imagen creada por Claude venga con el código fuente y pueda utilizarse en el diseño de una página web, por ejemplo.
A primera vista, los dibujos creados por Grok 3 beta eran bastante buenos, pero sólo a primera vista. Por alguna razón desconocida, falló a la hora de generar coches. En los dos dibujos creados por ella, los coches del futuro están inclinados, torcidos y simplemente raros. Además, la IA olvidó añadir pantallas holográficas con publicidad interactiva.
Gemini generó la imagen sorprendentemente bien: se puede sentir la escala y el alcance de la ciudad. Pero, por alguna razón, el modelo ignoró por completo la petición de coches voladores.
Se utilizó ChatGPT 4o para generar Dall-E (2025) y resultó bastante bien. En cualquier caso, mejor que la competencia.
Puedes ahorrar tiempo y dinero si recibes instrucciones claras de AI. No necesitas leer toneladas de páginas en docenas de foros en busca de la respuesta correcta, ni acudir directamente a un técnico. A veces la solución es sencilla y está en la superficie.
Nuestra última promoción fue así: «El Renault Scenic 2 muestra constantemente el error Comprobar airbag. Cómo puedo eliminarlo yo mismo». En una prueba en la que pedimos a los chatbots de IA que nos ayudaran a arreglar una avería del coche, Le Chat y Claude obtuvieron los peores resultados. El francés dio la primera respuesta en inglés completo, y la segunda — parcialmente en inglés. El producto antrópico respondió brevemente, con sequedad y sin dar detalles importantes. Los otros modelos proporcionaron respuestas bastante similares y moderadamente sencillas. Pero Grok 3 beta hizo un gran trabajo: proporcionó una descripción detallada y paso a paso, y realmente se puede solucionar el error utilizando sus instrucciones. No enumeraba todas las opciones posibles, pero la mayoría de ellas son realmente efectivas.
Por cierto, después de esta pregunta sobre Géminis, Gmail empezó a mostrar anuncios de productos para automóviles.
Los resultados de una misma pregunta difieren debido a varios factores clave relacionados con la formación y las limitaciones del software de cada modelo:
Durante la prueba, tuvimos la suerte de no encontrarnos con el fenómeno negativo más común: «alucinaciones» modelos de IA. Sin embargo, este problema ha sido y sigue siendo uno de los más graves. Por ejemplo, la IA puede inventar una cita que un científico nunca dijo. O inventar un acontecimiento histórico que nunca ocurrió. La raíz del problema radica en la forma de pensar «La IA se entrena con una enorme cantidad de datos y, en el proceso, aprende a construir relaciones. Pero esto sigue ocurriendo a través de patrones y conexiones simplificadas. Cuando el modelo encuentra algo que solo se ajusta parcialmente a los patrones aprendidos previamente, puede sacar conclusiones incorrectas — «alucinar». Por ejemplo, si le enseñas a un niño manzanas de distintos colores: rojas, amarillas, verdes, y le dices: «Estas son manzanas», entonces verá un tomate. El tomate será rojo y redondo. El niño puede concluir que es una manzana porque es roja y redonda.
El modelo lingüístico se comporta de la misma manera: si sus datos de entrenamiento contienen a menudo textos que mencionan «Einstein» y «relatividad» uno al lado del otro, el modelo puede «pensar automáticamente en una cita de Einstein sobre la relatividad que no existía. En su «comprensión de» estos conceptos están estrechamente relacionados. Así, las «alucinaciones» de la IA son un intento de añadir «inventar» rompecabezas a la imagen de la que carece su base de conocimientos.
En general, los lingüistas pueden «alucinar» por varias razones:
El hecho de que las respuestas al mismo problema en el mismo modelo puedan formularse de distintas maneras también está relacionado con la forma de pensar «de la IA. Cuando una IA recibe una pregunta, tiene muchas posibles continuaciones «correctas» de la respuesta (probabilidades). Y puede elegir diferentes caminos (secuencias de palabras) para responder
Los resultados de las pruebas mostraron que cada modelo de IA tiene sus propios puntos fuertes y débiles. Si necesitas datos concretos, ChatGPT y Claude son más adecuados. Grok es bueno bromeando y adaptándose al contexto, pero es un artista mediocre. Gemini evita los temas políticos, DeepSeek tiene problemas con la relevancia de la información. Y Le Chat parece un poco sesgado en su elección de fuentes.
Resumiendo:
La inteligencia artificial (IA) está impulsando el progreso tecnológico a un ritmo sin precedentes. Predicciones Mostrarque el mercado mundial de la IA, valorado en aproximadamente 196 630 millones de dólares en 2023, alcanzará los 1,81 billones de dólares en 2030, lo que representa una tasa de crecimiento anual compuesto (TCAC) del 36,6%. Se prevé que la IA sea un importante motor del crecimiento económico mundial, con una contribución potencial de hasta 15,7 billones de dólares a la economía mundial para 2030.
La inteligencia artificial ya está teniendo un impacto significativo en el mercado laboral y esperadoestima que casi el 40% de los puestos de trabajo de todo el mundo se integrarán de algún modo con la IA. Pero si bien la automatización puede dejar obsoletos algunos empleos, la IA también creará otros nuevos. Es probable que las funciones que hacen hincapié en la creatividad humana, la inteligencia emocional y la gestión sofisticada sigan siendo tan importantes como siempre. Las nuevas profesiones incluirán especialistas en inteligencia artificial, ingenieros en robótica y diseñadores de experiencia de usuario (UX) especializados en productos de IA.
La integración de la inteligencia artificial en diversas industrias provocará rápidos cambios en los modelos de negocio y las operaciones tradicionales:
Por tanto, la multimodalidad es el siguiente paso lógico. Estos versátiles asistentes de IA pueden procesar y analizar datos de diversas fuentes: audio, fotos, vídeo, y no solo textoPero el verdadero avance será la aparición de la inteligencia artificial general (AGI). Estos sistemas tendrán capacidades cognitivas similares a las humanas, lo que les permitirá realizar cualquier tarea intelectual que los humanos puedan realizar. Y aún mejor.
Las principales organizaciones de investigación y empresas tecnológicas ya están invirtiendo importantes esfuerzos en el desarrollo de la inteligencia artificial. Por ejemplo, Demis Hassabis, cofundador de DeepMind ve la próxima generación de IA como un sistema capaz de realizar cualquier tarea cognitiva de nivel humano, y espera avances significativos en los próximos añosEl consejero delegado de OpenAI, Sam Altman, dijo que ya conoce. El gobierno está trabajando en la creación de un AGI, y esto podría ocurrir en 2029.
Ray Kurzweil escribió en su libro The Singularity Is Nearerque los ordenadores alcanzarán niveles de inteligencia humana en 2029, mientras que el consejero delegado de Microsoft AI, Mustafa Suleiman cree, que podría tardar hasta 10 años debido a las limitaciones del hardware.
Por lo tanto, la aparición de la AGI es cuestión de poco tiempo — de 4 a 10 años. Y esta IA lo cambiará absolutamente todo.