OpenAI запустила веб-краулер GPTBot и добавила инструкции для его блокировки

Опубликовал Катерина Левицкая

08.08.2023 15:34

Система GPTBot «будет прочесывать» интернет, чтобы собирать базу данных для обучения и совершенствования ИИ.

Согласно публикации в блоге OpenAI, использование сканера GPTBot имеет потенциал для улучшения существующих моделей искусственного интеллекта – в частности, в таких аспектах, как точность и безопасность.

«Веб-страницы, просканированные с помощью агента GPTBot, могут быть использованы для совершенствования будущих моделей и отфильтрованы с удалением источников, требующих платного доступа, собирающих личную информацию или содержащие текст, нарушающий нашу политику», — говорится в сообщении компании.

В то же время операторы веб-сайтов смогут запретить доступ GPTBot – частично или полностью. Для этого необходимо добавить его имя в файл robots.txt сайта с командой «disallow».

Ранее OpenAI уже оскандалилась с тем, что собирает данные – в июне прошлого года на компанию подали в суд за кражу информации для обучения ChatGPT. Также чат-бот случайно засветил чужие истории чатов, а впоследствии OpenAI добавила функцию отключения истории, чтобы избежать других обвинений.

18 июля компания подала заявку в Бюро патентов и торговых марок США на торговую марку GPT-5, которая включает программное обеспечение для человеческого языка и текста на основе искусственного интеллекта, преобразования звука в текст и распознавания голоса и языка. Еще в июне руководитель компании Сэм Альтман заявлял, что OpenAI пока не обучает GPT-5, поскольку нужно провести много подготовительных работ.

Опубликовал Катерина Левицкая

Теги OpenAIВеб-краулерВеб-сканерИскусственный интеллект

08.08.2023 15:34

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.

OpenAI запустила веб-краулер GPTBot и добавила инструкции для его блокировки

Читайте также