Те, що просили: в Gemini тепер можна завантажувати аудіо та "будь-які" файли

Опублікував Вадим Карпусь

На початку серпня з’явилися чутки, що Google працює над однією з найбільш очікуваних функцій для Gemini — підтримкою завантаження аудіофайлів. Тепер ця можливість уже доступна на Android, iOS і у вебверсії застосунку.

Про нововведення повідомив Джош Вудворд, віцепрезидент Google Labs і Gemini. Він підтвердив, що тепер користувачі можуть завантажувати будь-які файли у застосунок, включно з найчастіше запитуваним форматом — аудіо. Якщо натиснути на іконку “+” та обрати Upload files у вебверсії або Files на смартфоні, можна додавати MP3, WAV та інші поширені формати.

Згідно з оновленою документацією підтримки Google, за один запит дозволено завантажувати до 10 файлів. Загальна тривалість аудіо обмежена 10 хвилинами для безкоштовних користувачів. Якщо ж оформити підписку Google AI Pro або AI Ultra, ліміт зростає до трьох годин. Попри обмеження, навіть 10 хвилин звучать суттєво. Адже, для порівняння, відео у Gemini можна завантажувати тривалістю лише до 5 хвилин. Для платних користувачів цей поріг збільшується до години.

Окрім підтримки аудіо, Google оголосила ще два важливі оновлення для своїх продуктів на базі Gemini. По-перше, пошук Google Search у режимі AI Mode отримав п’ять нових мов: хінді, індонезійську, японську, корейську та бразильську португальську. Це стало можливим завдяки інтеграції Gemini 2.5 у пошуковий сервіс. Компанія зазначає, що завдяки цьому більше користувачів зможуть ставити складні запитання рідною мовою й отримувати глибші результати.

По-друге, ШІ-блокнот NotebookLM, який працює на базі Gemini, отримав нові стилі звітів. Він дозволяє створювати навчальні матеріали, стислий огляд, блоги, картки для запам’ятовування, тести та інші формати більш ніж 80 мовами. NotebookLM аналізує завантажені документи, файли та інші матеріали користувача й формує результат у заданому стилі. Тепер можна обирати структуру, тон і стиль створюваних звітів. За словами Google, оновлення стане доступним усім користувачам цього тижня.

Варто зазначити, що можливість працювати з аудіо в NotebookLM була ще до появи цієї функції в основному застосунку Gemini. Саме NotebookLM позиціонується як інструмент для досліджень і виявлення закономірностей у файлах різних форматів.

Останні місяці Google активно розширює екосистему функцій, пов’язаних із ШІ. У серпні Gemini почав автоматично запам’ятовувати деталі й уподобання користувачів з попередніх діалогів. Тоді ж безкоштовні акаунти отримали доступ до Workspace Vids — інструмента для генерації відео. У вересні Google Photos перейшов на нову версію генератора відео Veo 3 та дозволив безкоштовним користувачам створювати короткі 4-секундні відео зі своїх фотографій.

Джерело: androidauthority, theverge

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.