
El gran modelo lingüístico de DeepSeek R1 recopila una enorme cantidad de datos de los usuarios y los envía a China. La IA también distorsiona información sensible para las autoridades chinas.
Recogida de datos
La empresa china guarda las pulsaciones de teclas, las contraseñas y todos los datos introducidos en las consultas, incluyendo texto e imágenesy luego los almacena en servidores de China.
Según las condiciones de DeepSeek, es legal recopilar información personal, como fecha de nacimiento, dirección de correo electrónico, números de teléfono y contraseñas. DeepSeek también se permite recopilar cualquier contenido que los usuarios proporcionen a LLM R1. Cada vez que alguien se pone en contacto con DeepSeek acepta almacenar pruebas de identidad, lo que presumiblemente significa documentos como el pasaporte o el permiso de conducir.
DeepSeek también almacena cuidadosamente todo lo relacionado con el hardware de los usuarios: Direcciones IP, modelos de teléfono, idioma, incluso «patrones de pulsación de teclas o» ritmos. Las cookies también facilitan la recogida de datos de los usuarios.
Dado que R1 es «código abierto», se puede ejecutar en cualquier lugar y en cualquier hardware, lo que en general es bueno para la privacidad — ejecutar el modelo localmente en su propio hardware probablemente no dará lugar a la recopilación de datos. Sin embargo, DeepSeek ofrece acceso en línea a R1 a través de su sitio web y aplicación móvil, lo que significa que los datos se almacenan y procesan.
Sin embargo, DeepSeek es muy transparente sobre qué datos recopila de los usuarios en línea, dónde se almacenan y qué hace con ellos. Todo esto en detalle descrito en la política de privacidad, lo que demuestra que no hay casi nada que la empresa no recopile.
DeepSeek reconoce que «anunciantes, empresas de medición y otros socios comparten información con nosotros sobre usted y las actividades que ha realizado fuera del Servicio, como sus actividades en otros sitios web y apps o en tiendas, incluidos los productos o servicios que ha adquirido en línea o en persona».
«El Grupo Corporativo» DeepSeek también tiene acceso a los datos que recopila para proporcionar «ciertas funciones, como almacenamiento, entrega de contenido, seguridad, investigación y desarrollo, análisis, soporte técnico y al cliente, y moderación de contenido». La política de privacidad establece que toda la información se almacena en servidores de China.
Censura
Además, según el Cybernews, «Un chatbot difunde desinformación a favor de China». El Estado chino puede utilizar los datos de los usuarios de DeepSeek — según la legislación local, la startup china debe compartir los datos con el Gobierno si se le pide.
«Como empresa china, DeepSeek sigue las políticas del Partido Comunista. Esto se refleja incluso en el modelo de código abierto, que suscita preocupación por la censura y otras influencias», — afirman los investigadores detrás de promptfoo, una herramienta de código abierto diseñada para evaluar grandes modelos lingüísticos.
El martes promptfoo publicado un conjunto de consultas sobre temas susceptibles de ser censurados por el régimen comunista. Entre ellos figuran cuestiones como la independencia de Taiwán, relatos históricos en torno a la sangrienta Revolución Cultural y preguntas sobre el presidente chino Xi Jinping.
Los investigadores enviaron 1.360 consultas al modelo DeepSeek, el 85% de las cuales el chatbot se negó a responder. Las negativas tienden a ser «de tono demasiado nacionalista y siguen estrictamente las políticas del PCCh». Sin embargo, la censura no es demasiado exhaustiva — consigue bypass utilizando los métodos habituales en estos casos, es decir, algún tipo de enmascaramiento de la consulta.
Spelling error report
The following text will be sent to our editors: