Дослідники знайшли «‎магічний» інструмент для перевірки штучного інтелекту — і це… Гаррі Поттер

Опубликовал
Катерина Даньшина

Серію книжок про Гаррі Поттера використовують для того, щоб примусити ШІ забути певну інформацію, зокрема й ту, що порушує авторське право.

Джоан Роулінг познайомила світ зі своїм чарівним всесвітом понад два десятиліття тому, однак нині її книжки відроджують свою актуальність в зовсім іншій літературі — науковій. Все більше дослідників використовують тексти про Гаррі Поттера в експериментах з технологією штучного інтелекту, і згадують їх у цілій серії наукових досліджень та статей.

Один із нещодавніх прикладів — стаття «Хто такий Гаррі Поттер?», яка розповідає про технологію, що допомагає «‎забувати» великим мовним моделям певну інформацію, включно із проблемним контентом та контентом, захищеним авторським правом (використання таких навчальних даних вже призвело до низки позовів до розробників ШІ). Автори статті, дослідники Microsoft Марк Руссінович і Ронен Елдан, спробували видалити інформацію про існування книг про Гаррі Поттера (включаючи персонажів і сюжети) з відкритого коду мовної моделі Meta Llama 2-7B.

Вони розробили спеціальну техніку, що передбачає три кроки для усунення даних з моделі: на початку модель навчили на цільових даних (в цьому випадку на книгах про Гаррі Поттера), щоб ідентифікувати пов’язані з нею токени та порівняти прогнози з базовою моделлю; далі замінили унікальні вирази з Гаррі Поттера загальними аналогами та створили альтернативні прогнози, наближені до моделі без такого навчання; ну і врешті-решт точно налаштували базову модель на ці альтернативні прогнози, фактично стираючи оригінальний текст із пам’яті, коли його підказує контекст.

Онлайн-курс "QA Automation" від robot_dreams.
Це 70% практики, 30% теорії та проєкт у портфоліо.Навчіться запускати перевірку сотень опцій одночасно, натиснувши лише одну кнопку.
Детальніше про курс

Увага до книг Роулінг у першу чергу зумовлена великою популярністю її персонажів:

«Будь-хто може придумати підказки для моделі, які б перевірили, чи «знає» вона книги. Навіть люди, які не читали їх, знають елементи сюжету та персонажів», — каже Руссінович, головний технічний директор Microsoft Azure.

Роботи Роулінг також використовувались для перевірки інтелекту систем штучного інтелекту, таких як ті, що породили чатбота ChatGPT. Терренс Сейновскі, який керує лабораторією обчислювальної нейробіології в Інституті біологічних досліджень Солка, стверджував у статті, що чатботи просто відображають інтелект і упередження своїх користувачів, як Дзеркало Яцрес в першій книзі про Гаррі Поттера, що показує бажання людини.

Нині на arXiv, сховищі наукових досліджень із відкритим доступом, у переліку нещодавніх статей можна побачити такі назви: «Машинне навчання для розробки зілля в Гоґвортсі», «Великі мовні моделі знайомляться з Гаррі Поттером», «Виявлення заклинань у фентезійній літературі за допомогою штучного інтелекту» та інші.

Джерело: Bloomberg

Disqus Comments Loading...