Новини Софт 25.09.2023 о 17:55 comment views icon

Із ChatGPT тепер можна спілкуватися голосом та картинками

author avatar
https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg

Юрій Орос

Автор новин

Розділ Технології виходить за підтримки Favbet Tech

В одному з найбільших оновлень ChatGPT, OpenAI запустила два нових способи взаємодії зі своїм застосунком. По-перше, ChatGPT отримав голос. Варто обрати один з п’яти синтетичних голосів, і можна спілкуватися з чат-ботом ніби телефоном, отримуючи відповіді в режимі реального часу.

Із ChatGPT тепер можна спілкуватися голосом та картинками

ChatGPT додала функцію розпізнання зображень, це означає, що тепер можна завантажувати зображення в застосунок і запитувати його про те, що на них зображено, передає MIT Technologie Review.

Ці оновлення доповнюють оголошення минулого тижня про те, що DALL-E 3, останню версію моделі створення зображень OpenAI, під’єднають до ChatGPT та навчать чат-бота генерувати зображення.

OpenAI анонсувала DALL-E 3 ─ інтеграція ChatGPT та покращені методи безпеки

Онлайн-курс "2D Animation" від Skvot.
Покроково та з фідбеком від лекторки увійдіть у 2D-анімацію через вивчення софтів, інструментів та створення кейсу у портфоліо.
Програма курсу та реєстрація

Змога розмовляти з ChatGPT базується на двох окремих моделях. Whisper, чинна модель перетворення мови в текст OpenAI, перетворює голос на текст, який потім передає чат-боту. А нова модель перетворення тексту в мову перетворює відповіді ChatGPT у вимовлені слова.

У демонстраційному ролику, який компанія надала обмеженому числу журналістів минулого тижня, Джоанна Джанг, продакт-менеджер, продемонструвала асортимент синтетичних голосів ChatGPT. Вони були створені шляхом навчання моделі перетворення тексту в мову на голосах акторів, яких найняла OpenAI. У майбутньому це може навіть дати змогу користувачам створювати власні голоси.

OpenAI ділиться цією моделлю перетворення тексту в мовлення з кількома іншими компаніями, включаючи Spotify, яка оголосила, що використовує ту ж саму технологію синтетичного голосу для перекладу подкастів знаменитостей на кілька мов, які будуть озвучені синтетичними версіями власних голосів подкастерів.

Розділ Технології виходить за підтримки Favbet Tech

Favbet Tech – це ІТ-компанія зі 100% українською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологій та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців. IT-компанія входить у групу компаній FAVBET.


Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: