Новини Софт 25.09.2023 о 17:55 comment views icon

Із ChatGPT тепер можна спілкуватися голосом та картинками

author avatar
https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg *** https://itc.ua/wp-content/uploads/2023/07/2023-07-19-12.08.01-2-96x96.jpg

Юрій Орос

Автор новин

В одному з найбільших оновлень ChatGPT, OpenAI запустила два нових способи взаємодії зі своїм застосунком. По-перше, ChatGPT отримав голос. Варто обрати один з п’яти синтетичних голосів, і можна спілкуватися з чат-ботом ніби телефоном, отримуючи відповіді в режимі реального часу.

Віддамо футболку Збірної України з футболу з підписами гравців за донат від 200 грн на ЗСУ. У описі до донату обов'язково вказуй номер мобільного, щоб ми вручили приз! Кожні додаткові 200 грн у донаті +1 шанс на виграш!
Взяти участь

Із ChatGPT тепер можна спілкуватися голосом та картинками

ChatGPT додала функцію розпізнання зображень, це означає, що тепер можна завантажувати зображення в застосунок і запитувати його про те, що на них зображено, передає MIT Technologie Review.

Ці оновлення доповнюють оголошення минулого тижня про те, що DALL-E 3, останню версію моделі створення зображень OpenAI, під’єднають до ChatGPT та навчать чат-бота генерувати зображення.

OpenAI анонсувала DALL-E 3 ─ інтеграція ChatGPT та покращені методи безпеки

Змога розмовляти з ChatGPT базується на двох окремих моделях. Whisper, чинна модель перетворення мови в текст OpenAI, перетворює голос на текст, який потім передає чат-боту. А нова модель перетворення тексту в мову перетворює відповіді ChatGPT у вимовлені слова.

У демонстраційному ролику, який компанія надала обмеженому числу журналістів минулого тижня, Джоанна Джанг, продакт-менеджер, продемонструвала асортимент синтетичних голосів ChatGPT. Вони були створені шляхом навчання моделі перетворення тексту в мову на голосах акторів, яких найняла OpenAI. У майбутньому це може навіть дати змогу користувачам створювати власні голоси.

Курс Финансовый директор.
Отримайте комплексне розуміння фінансової діяльності. Час підніматись по карʼєрним сходам.
Ознайомитись з курсом

OpenAI ділиться цією моделлю перетворення тексту в мовлення з кількома іншими компаніями, включаючи Spotify, яка оголосила, що використовує ту ж саму технологію синтетичного голосу для перекладу подкастів знаменитостей на кілька мов, які будуть озвучені синтетичними версіями власних голосів подкастерів.

Завантаження коментарів...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: