Новости Технологии 02.08.2023 в 18:40 comment views icon

Новая ИИ-модель Meta может стать новым синтезатором в мире звуков… или просто генератором «лифтовой музыки»

author avatar
https://itc.ua/wp-content/uploads/2022/09/Katya-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/09/Katya-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/09/Katya-96x96.jpg

Катерина Даньшина

Автор новостей

Раздел Технологии выходит при поддержке Favbet Tech

Meta выпустила новую модель искусственного интеллекта с открытым кодом под названием AudioCraft, позволяющую создавать музыку и звуки с помощью текстовых подсказок.

Модель состоит из трех «подмоделей», которые предназначены для разных сфер генерации звуков:

  • MusicGen – модель, использующая текстовые данные для создания музыки и обученная на 20 000 часах музыки, «принадлежащая Meta или лицензированная специально для этой цели». Инструмент TextToSample для генерации семплов, о котором мы писали вчера, тоже работает с ее помощью.
  • AudioGen – модель, создающая аудио из письменных подсказок, имитируя, например лай собак или звук шагов.
  • EnCodec – улучшенная версия декодера Meta, позволяющая создавать звуки с меньшим количеством артефактов.

Ниже можно прослушать образцы аудио, созданные AudioCraft. В целом, звучит неплохо, хотя и порой несколько искусственно:

Текстовая подсказка: свист и ветер

Текстовая подсказка: приближающиеся и удаляющиеся звуки сирены и жужжание двигателя

Текстовая подсказка: танцевальный поп-трек с запоминающимися мелодиями; тропическими перкуссиями и бодрыми ритмами; идеально подходит для пляжа.

Онлайн-інтенсив "Як створити рекомендаційну модель за 2 дні" від robot_dreams.
Ви пройдете етапи вибору, навчання, оцінки рекомендаційної моделі для електронної бібліотеки та отримаєте індивідуальний фідбек від лекторки.
Приєднатись до інтенсиву

Meta – не единственная компания, объединившая музыку с ИИ. Google создала MusicLM – большую языковую модель, которая генерирует минутные звуки на основе текстовых подсказок, однако она доступна только исследователям. Остальные инструменты уже стали причиной недовольства музыкальных студий – таких, как созданная ИИ песня, в которой звучат голос Дрейка и The Weeknd. Некоторые музыканты наоборот поощряют использовать их вокал как основу, например певица Граймс.

В настоящее время произведения AudioCraft звучат как «лифтовая музыка», которую можно использовать для фона, а не создания хита. Хотя Meta верит, что ее модель сможет положить начало новой волне песен, так же как синтезаторы, которые стали популярными когда-то и изменили музыку.

Компания говорит, что AudioCraft нуждается в открытом коде, чтобы диверсифицировать данные, используемые для его обучения.

«Мы понимаем, что наборам данных, используемых для обучения наших моделей, не хватает разнообразия. В частности, использованный набор содержит большую часть музыки в западном стиле и только пары аудио-текста с текстом и метаданными, написанными на английском языке», — говорят в Meta.

Источник: The Verge

Раздел Технологии выходит при поддержке Favbet Tech

Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков. IT-компания входит в группу компаний FAVBET.


Loading comments...

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: