Google підтвердила, що навчає ШІ-чатбот Bard на «‎запозичених» веб-данних

Опубликовал
Катерина Даньшина

Все, що ви публікували в інтернеті, може бути використано для навчання штучного інтелекту Google.

Відповідно до оновлення в політиці конфіденційності Google від 1 липня, її різні служби (такі як, Bard, Cloud та Перекладач) можуть використовувати для навчання загальнодоступні дані, зібрані з інтернету.

«У нашій політиці конфіденційності вже давно було вказано, що Google використовує загальнодоступну інформацію з Інтернету для навчання мовних моделей для таких сервісів, як Google Translate. Останнє оновлення просто додає до переліку новіші служби, такі як Bard», — сказала представниця Google Кріста Малдун.

Google у політиці наголошує, що використовує інформацію для покращення послуг та розробки нових продуктів, функцій і технологій, які «‎приносять користь суспільству».

Головні оновлення стосуються того, що відтепер компанія використовуватиме інформацію не для мовних моделей, а для моделей штучного інтелекту – це дає Google дещо більше свободи та можливість створювати ШІ-системи, на основі наших публічних данних.

Онлайн-курс "Excel та Power BI для аналізу даних" від robot_dreams.
Навчіться самостійно аналізувати й візуалізувати дані, знаходити зв’язки, розуміти кожен аспект отриманої інформації та перетворювати її на ефективні рішення.
Детальніше про курс

У документі не вказано, як компанія планує запобігати порушенню авторських прав, коли такі матеріали потраплять у пул данних. Більшість загальнодоступних вебсайтів використовують політику, яка забороняє скрапінг (або збір даних) для навчання мовних моделей та ШІ-інструментів.

Деякі закони та зростання конкуренції призвели до того, що виробники популярних генеративних систем штучного інтелекту, як-от OpenAI GPT-4, стають надзвичайно «‎хитрими», коли мова йде про те, звідки вони взяли дані. Однак юридично використання даних таким видом програм ще досі не врегульовано, що вже спровокувало судові процеси та підштовхнуло законодавців деяких країн взятись за розробку документів, які суворо контролюватимуть процес.

Також виникає питання, як ці дані обробляються і чи є гарантія того, що вони не випливуть десь в іншому місці під час збою в роботі.

Тим часом Twitter і Reddit — дві соціальні платформи, які містять величезну кількість загальнодоступної інформації — нещодавно вжили рішучих заходів, щоб спробувати перешкодити іншим компаніям вільно збирати їхні дані. Зміни ціноутворення API та обмеження, накладені на платформи, спільноти зустріли протестами.

Google вперше презентувала Bard у лютому, і в порівнянні з конкурентами (Bing і ChatGPT) він якось сильно не вирізнявся – хіба що демонстрацією із помилковими відповідями, яка спричинила різке падіння акцій компанії. У травні Google скасувала список очікування для чатбота – тестову версію могли випробувати користувачі 180 країн (Україні у переліку немає).

Disqus Comments Loading...