OpenAI запустила веб-краулер GPTBot и добавила инструкции для его блокировки

Опубликовал
Катерина Даньшина

Система GPTBot «будет прочесывать» интернет, чтобы собирать базу данных для обучения и совершенствования ИИ.

Согласно публикации в блоге OpenAI, использование сканера GPTBot имеет потенциал для улучшения существующих моделей искусственного интеллекта – в частности, в таких аспектах, как точность и безопасность.

«Веб-страницы, просканированные с помощью агента GPTBot, могут быть использованы для совершенствования будущих моделей и отфильтрованы с удалением источников, требующих платного доступа, собирающих личную информацию или содержащие текст, нарушающий нашу политику», — говорится в сообщении компании.

В то же время операторы веб-сайтов смогут запретить доступ GPTBot – частично или полностью. Для этого необходимо добавить его имя в файл robots.txt сайта с командой «disallow».

Ранее OpenAI уже оскандалилась с тем, что собирает данные – в июне прошлого года на компанию подали в суд за кражу информации для обучения ChatGPT. Также чат-бот случайно засветил чужие истории чатов, а впоследствии OpenAI добавила функцию отключения истории, чтобы избежать других обвинений.

Онлайн-курс "Комунікаційний менеджер" від Skvot.
Ви отримаєте скіли комунікації, сформуєте CV та розробите власну one page strategy. Для своєї карʼєри та успішного масштабування бренду.
Програма курсу і реєстрація

18 июля компания подала заявку в Бюро патентов и торговых марок США на торговую марку GPT-5, которая включает программное обеспечение для человеческого языка и текста на основе искусственного интеллекта, преобразования звука в текст и распознавания голоса и языка. Еще в июне руководитель компании Сэм Альтман заявлял, что OpenAI пока не обучает GPT-5, поскольку нужно провести много подготовительных работ.

Disqus Comments Loading...