Рубрики НовиниСофт

Google представляє модель ШІ Gemini 1.5 – величезне контекстне вікно, здатне обробляти кілька годин відео, але не для всіх

Опубликовал
Андрій Русанов

Невдовзі після запуску Gemini, великої мовної моделі, яку Google сподівається вивести на вершину індустрії штучного інтелекту, компанія вже оголошує її наступника. Сьогодні Google запускає Gemini 1.5 і робить його доступним для розробників і корпоративних користувачів перед повним розгортанням для споживачів. Компанія позиціює Gemini як бізнес-інструмент, особистого помічника інструмента для всього, що лежить між ними.

Gemini 1.5 Pro, модель загального призначення в системі Google, вочевидь, не поступається Gemini Ultra, яку компанія нещодавно випустила, та перевершує Gemini 1.0 Pro на 87% у тестах. Модель було створено за допомогою методики, відомої як «Суміш експертів» або MoE. Це означає, що вона запускає лише частину загальної моделі, коли ви надсилаєте запит, а не обробляє запит всією потужністю весь час. Такий підхід має зробити модель швидшою у використанні та ефективнішою для роботи Google.

Gemini 1.5 має величезне контекстне вікно, що означає, що модель може обробляти набагато більші запити та переглядати набагато більше інформації одночасно. Це вікно становить колосальний 1 мільйон токенів у порівнянні зі 128 000 у GPT-4 і 32 000 в актуальному Gemini Pro. CEO Google Сундар Пічаї пояснює це: «Це приблизно 10 або 11 годин відео, десятки тисяч рядків коду». Розмір контекстного вікна означає, що ви можете запитати бота AI про весь цей вміст одночасно. Пічаї також повідомив, що дослідники Google тестують контекстне вікно з 10 млн токенів — це ніби всі серії «Гри престолів» одночасно.

Онлайн-курс "Маркетолог" від Laba.
Пройдіть повний шлях розробки маркетингових стратегій на практиці та з фідбеком від CEO бренд-маркетингової агенції.
Програма курсу і реєстрація

Сундар Пічаї також вважає, що велике контекстне вікно буде дуже корисним для бізнесу. «Це корисно у випадках, коли ви можете додати багато особистого контексту та інформації в момент запиту». Наприклад, кінематографісти можуть завантажити весь свій фільм і запитати Gemini, що скажуть рецензенти. Компанії зможуть використати Gemini для одночасного перегляду маси фінансових записів. «Я вважаю це одним із найбільших проривів, які ми зробили».

На цей момент Gemini 1.5 буде доступний лише для бізнес-користувачів та розробників через Vertex AI та AI Studio від Google. Згодом вона замінить Gemini 1.0, а стандартною версією Gemini Pro, доступною для всіх на gemini.google.com і в застосунках компанії, буде 1.5 Pro із контекстним вікном у 128 000 маркерів. Доведеться доплатити, щоб отримати мільйон. Google також перевіряє безпеку моделі та етичні межі, зокрема щодо нового більшого контекстного вікна.

Зараз Google бере участь в перегонах, щоб створити найкращий інструмент штучного інтелекту, оскільки компанії в усьому світі намагаються визначити власну стратегію штучного інтелекту: укладати угоди з OpenAI, Google чи кимось іншим. Лише цього тижня OpenAI оголосила про пам’ять для ChatGPT та збирається впровадити власний веб-пошук. Поки що Gemini здається дивовижним, особливо для тих, хто вже працює в екосистемі Google, але попереду ще багато роботи з усіх сторін.

Згодом усі ці версії 1.0 чи 1.5, плюси та ультра не матимуть значення для користувачів. «Люди просто споживатимуть цей досвід. Це як використовувати смартфон, не звертаючи уваги на процесор у ньому», — Сундар Пічаї. Але зараз, за ​​його словами, ми все ще перебуваємо на етапі, коли кожен знає чип у своєму телефоні, тому що це має значення.

Джерело: The Verge

Disqus Comments Loading...