Tumblr і WordPress услід за Reddit продаватимуть дані користувачів для навчання штучного інтелекту

Опубликовал
Катерина Даньшина

Компанія Automattic, яка володіє Tumblr і WordPress, веде перемовини з Midjourney й OpenAI щодо продажу даних з дописів користувачів для навчання систем штучного інтелекту.

У звіті сайту 404 Media, який посилається на анонімне джерело, сказано, що угоди «неминучі».

Automattic вже найближчим часом має запустити нове налаштування, яке «дозволить користувачам відмовитися від обміну даними з третіми сторонами, включаючи компанії ШІ». Однак, судячи з внутрішніх листувань, компанія зібрала дамп, який містить «увесь публічний контент Tumblr, опублікований користувачами між 2014 та 2023 роками» і, як припускає The Verge, помилково — увесь контент, доданий у блоги як непублічний.

OpenAI та Midjourney поки не коментували угоду, а Automattic ще у вівторок оприлюднила звіт під назвою «Захист вибору користувача», який натякає на партнерство з неназваними компаніями штучного інтелекту.

Психологічний профорієнтаційний тест для IT-фахівців від Ithillel.
Пройдіть психологічний профорієнтаційний тест для IT-фахівців щоб дізнатися ваші сильні сторони, вподобання і інтереси і з'ясувати, яка IT-спеціальність вам підходить.
Пройти тест

«Наразі ми за замовчуванням блокуємо основні сканери платформ штучного інтелекту, в тому числі від найбільших технологічних компаній, і оновлюємо списки, коли запускаються нові», — йдеться у звіті. «Ми будемо ділитися лише загальнодоступним вмістом, розміщеним на WordPress.com і Tumblr від користувачів та сайтів, які не змінили налаштування».

Далі компанія зазначає що вже «працює з деякими компаніями штучного інтелекту, плани яких відповідають інтересам спільноти».

Як відомо, кілька великих компаній вже уклали угоду з розробниками ШІ щодо надання навчальних даних: Reddit, до прикладу, має річну угоду з Google на $60 млн, а Shutterstock — з OpenAI.

Disqus Comments Loading...