Desde el principio del auge de la IA, el hardware de Nvidia ha sido el mejor en lo que se refiere a redes neuronales, pero eso ha cambiado. Los desarrolladores de software por fin han adaptado los modelos de IA a las tarjetas gráficas AMD Radeon. Los resultados son realmente asombrosos, pero repasemos el proceso.
Atención. Los editores de ITC.ua piden que este texto se tome únicamente como un estudio periodístico de las capacidades de la IA y no fomenten la creación y difusión pública de textos e imágenes que violen las normas morales generalmente aceptadas Tratamos a todas las personas con respeto, independientemente de su identidad racial, religiosa o sexual.
Contenido
En el experimento se utilizó el siguiente software Amuse 2.1es un software que está perfectamente adaptado para trabajar con hardware AMD, tiene una interfaz fácil de usar y es adecuado tanto para principiantes como para profesionales. Este software permite generar imágenes a partir de descripciones de texto y mucho más.
También instalamos un chatbot de texto. Programa LM Studio funciona con redes neuronales basadas en texto, como ChatGPT. La utilidad es extremadamente funcional, ya que puede funcionar con un procesador o una tarjeta de vídeo y dispone de una amplia biblioteca de modelos lingüísticos (incluidos los no censurados).
Probamos redes neuronales en un ordenador con esta configuración:
Este punto podría omitirse, porque el proceso de instalación es increíblemente sencillo y consta de varios pasos:
Una vez iniciada, la utilidad le pedirá que descargue los modelos entrenados (ocupan mucho espacio). En total, se necesitan tres modelos para cada uno de los modos de intensidad para generar imágenes de acuerdo con la descripción.
La aceleración por hardware funciona por defecto, es decir, la red neuronal carga la tarjeta gráfica, no la CPU. En el modo «Rápido», las imágenes se disparan a la velocidad del rayo (hasta 10 imágenes en 10 segundos), pero su calidad suele dejar mucho que desear. La carga de la tarjeta de vídeo es baja.
«Equilibrado» tarda 150 segundos para 10 imágenes, pero la calidad de las imágenes es notablemente superior. La tarjeta de vídeo no se aprovecha al máximo y rara vez alcanza el 80-85%. El consumo de energía de la RX 7900 XTX está en el rango de 250-300 vatios.
Perfil «Calidad» Carga completa de la tarjeta gráfica, la calidad de imagen es la misma que en el modo equilibrado, pero se tardan 120 segundos en procesar 10 imágenes en lugar de 150. El consumo de energía de la RX 7900 XTX en este modo supera los 350-360 vatios.
En el modo Profesional, puede cargar sus propios modelos para una generación más precisa de imágenes en un estilo específico. Por ejemplo, hay un modelo separado para imágenes Pixel Art, así como para estilo realista, cyberpunk, etc.
La primera pestaña le permite generar imágenes basadas en una descripción de texto. Puede escribir en ucraniano, pero se recomienda hacerlo en inglés para mayor detalle. La descripción debe ser lo más sencilla, concisa y clara posible para la máquina.
Puedes poner en cola hasta 10 imágenes en tres formatos a la vez: cuadrado, horizontal y vertical. La resolución es de 1216×832 píxeles, no más.
La segunda pestaña permite aplicar filtros a la imagen de destino. En unos segundos, puedes crear una foto tuya al estilo Disney, Cyberpunk o Neo de Matrix. Todo depende de tu imaginación, como se describe en el texto, y del preajuste seleccionado.
La pestaña «Diseño» es la más interesante porque puede convertir una miniatura en una imagen en toda regla. Basta con dibujar con el ratón un hombre hecho de varios palos, establecer una descripción y, como resultado, obtendrás un guerrero casi exactamente como lo habías imaginado.
¿No le gusta? Genera una nueva imagen en tres segundos. El método de búsqueda siempre consigue algo que encaja. Sí, hay aplicaciones para el iPad con funciones similares, pero Amuse lo hace todo gratis, sin suscripciones.
La censura está presente en Amuse 2.1 si se utilizan modelos estándar o los disponibles en el catálogo oficial. Los que quieran generar hentai tienen que buscar modelos formados en Internet por su cuenta.
Sin embargo, hay algunos matices que merece la pena conocer. Por ejemplo, la neurona a veces acepta dibujar basura, como gente que come gatos, pero censura otras imágenes. Apenas conseguí que Amuse dibujara a una rubia en bikini, eso es todo.
Así que, con modelos estándar, no puedes dibujar mujeres total o parcialmente desnudas, las imágenes saldrán borrosas, pero esta regla se rompe cuando pides dibujar a un hombre transexual. Por alguna razón, el software los dibuja, e inmediatamente de genitales. No mostraremos estas fotos explícitas aquí, pero puedes verlas en el canal de Telegram ITC.ua.
Es un poco extraño que este modelo de formación piense que no se debe dibujar a una mujer sin bikini, pero a un hombre musculoso que se identifica como mujer, tiene el pelo largo y ondulado, lleva zapatos con tacones de 18 cm y no lleva ropa, no tiene ningún problema en representarlo.
Son normas extrañas, y no se puede hacer nada al respecto. Pero con otros modelos, puedes saltarte cualquier restricción y crear el contenido que quieras, sin censura ni tolerancia.
Consigue un resultado similar con los generadores de imágenes en línea nunca no funcionaráporque todas tienen muchas limitaciones y están «sofocadas por» los desarrolladores. Esta es, en mi opinión, la principal ventaja de las redes neuronales locales: absoluta (o casi absoluta) permisividad.
Como en el primer caso, el proceso de instalación es de lo más sencillo. El usuario sólo tiene que descargar LM Studio con AMD ROCm desde el sitio web oficial. Tras la instalación, la aplicación ofrecerá descargar los modelos necesarios.
Ten en cuenta que necesitas mucho espacio, mucho, así que es mejor elegir la ubicación deseada en la unidad con antelación para no llenar la unidad del sistema al 100%. Durante las pruebas, descargamos todos los modelos para Amuse y LM Studio en ¡200 GB!
La interfaz del programa no es difícil de entender – lo más importante es descargar el modelo deseado de la lista recomendada o mediante una búsqueda manual, establecer el modo de máximo rendimiento de la tarjeta de vídeo en la columna de la derecha y empezar a trabajar.
La diferencia entre la tarjeta gráfica y el procesador es enorme, así que asegúrate de dar prioridad a la GPU si quieres que la red neuronal funcione más rápido. Ten en cuenta que algunos modelos requieren 16 GB de memoria de vídeo, aunque por término medio basta con 8 GB. La AMD Radeon RX 7600 XT 16 GB es perfecta para este tipo de tareas con un margen enorme.
Por lo demás, prepárate para un consumo importante de RAM. Se recomienda tener al menos 32 GB de RAM, y preferiblemente 64 GB de RAM para trabajar cómodamente con varios modelos simultáneamente. Al mismo tiempo, la velocidad de respuesta disminuirá en comparación con el trabajo con GPU.
Los modelos textuales estándar no permiten hacer consultas ofensivas en los casos en que se trata de la identificación racial, religiosa, sexual de las personas, etc. Cualquier neurona basada en la nube, como ChatGPT, Copilot, etc., se comporta de la misma manera.
Con la RX 7900 XTX, los modelos básicos son rápidos, ofrecen resultados de calidad media (ChatGPT 4.0 es mejor) y todo funciona localmente sin suscripciones ni Internet.
No todos los modelos son iguales, así que tendrás que experimentar para conseguir el resultado deseado. Algunos modelos ocupan más de 10 GB de espacio y requieren hasta 16 GB de memoria (RAM o vídeo).
Sin embargo, la pregunta principal sigue sin respuesta: ¿es posible crear tu propia neurona con «vodka y» mariposas nocturnas? Sí, es posible, pero tendrás que descargarte modelos sin censura.
De hecho, se trata de modelos debidamente entrenados que no limitan el ordenador, lo que permite a la inteligencia artificial responder a cualquier pregunta. Donde puede obtener una respuesta clara, comprensible y precisa de LM Studio, a menudo con hechos confirmados, probando, etc., y ChatGPT terminará inmediatamente la conversación.
También puedes pedir que te cuenten un chiste intolerante, o escribir una redacción sobre cómo el inseguro alumno Mikhail hizo Dios sabe qué con su profesora Zhanna después de un rato de vapor en el baño, o cualquier otra cosa que se te ocurra.
En general, la calidad de los contenidos generados no es mala (a veces sí), pero habrá que pulirlos, es decir, corregir algunas pequeñas meteduras de pata, incoherencias, etc. Los textos técnicos con muchos datos precisos son los que obtienen peores resultados. Por ejemplo, es difícil describir la tecnología con una neurona de este tipo, porque hay casi la mitad de los erroresen cuanto a especificaciones técnicas.
Los modelos básicos son mediocres a la hora de mantener el contexto. ChatGPT 4.0 es menos propenso a perderse en sus respuestas y recuerda lo que se ha discutido antes. Por otro lado, en muchos casos La IA en la nube simplemente se negará a responder responder a las preguntas de los usuarios debido a las limitaciones del software.
Es estupendo ver que AMD se une con confianza a la carrera de la IA en todos los frentes: el lanzamiento de los nuevos procesadores AMD Ryzen AI con NPU y la adaptación de software de alta calidad para las tarjetas gráficas AMD Radeon 7000.
Hay que elogiar a los desarrolladores de software por hacer que los aceleradores gráficos Radeon sean competitivos frente a Nvidia en este campo en tan poco tiempo. No sólo es importante el hecho de que las redes neuronales funcionen, sino también la disponibilidad de instaladores de un solo clic aptos para usuarios de cualquier nivel de conocimientos.
Si dispone de 100-200 GB adicionales de espacio libre, ganas de experimentar con distintos modelos neuronales y un hardware moderno de AMD, no dude en probar Amuse y LM Studio, ya que, no hace mucho, tales privilegios en el sistema operativo Windows sólo estaban disponibles para los propietarios de tarjetas gráficas «verdes».
Un chatbot que dice palabrotas y habla sin censura ni tolerancia es, al menos, interesante para hablar, y como mucho se convertirá en un asistente en tareas creativas. Lo mismo puede decirse de Amuse, que sin duda resultará útil para artistas, diseñadores y desarrolladores de videojuegos.