Новини Технології 17.05.2023 о 13:14

DarkBERT — спеціалізована модель ШІ для дослідження даркнету

https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg *** https://itc.ua/wp-content/uploads/2022/08/photo_2022-08-08_12-53-42-96x96.jpg

Андрій Русанов

Автор сайту ITC.ua

Розвиток штучного інтелекту передбачає створення вузькоспеціалізованих мовних моделей. Вузька сфера навчання обумовлює адекватніші відповіді ШІ. Особливість даркнету в тому, що багато його ресурсів недоступні для звичайних браузерів – тому популярні мовні моделі можуть бути некомпетентними  щодо нього. Для дослідження даркнету у Південній Кореї створили модель DarkBERT на архітектурі RoBERTa. Мета – допомога дослідникам безпеки та правоохоронним органам.

Курс Англійської
Ваш викладач англійської нудний? Вивчайте мову із задоволенням. Підберемо викладача, який також любить Marvel, а не DC
Мені потрібен найкращий

Детальний опис моделі дає загальне уявлення про даркнет та методи роботи ШІ в ньому. RoBERTa була розроблена ще у 2019 році. Особливість її в тому, що вона здатна розпізнавати прийняті у Dark Web способи кодування інформації у повідомленнях і витягувати з них корисну інформацію.

DarkBERT ШІ ИИ даркнет Dark Web

Звернувшись до моделі зараз, дослідники виявили її великий потенціал та недостатнє тренування на ранніх етапах розвитку. Вони просканували Dark Web через систему анонімного доступу Tor, а потім відфільтрували необроблені дані (застосовуючи такі методи, як дедуплікація, балансування категорій та попередня обробка даних) для створення бази даних. DarkBERT – поєднання цієї бази та моделі RoBERTa.

Результат виправдав зусилля – знаючи специфічну «мову» даркнету та навчаючись у ній, DarkBERT перевершує інші мовні моделі у дослідженні та «розумінні» Dark Web. Навчання та налаштування моделі триває, вона має потенціал покращити власні результати.

Розробники Tor анонсували безпечний браузер Mullvad – клон FireFox з власним VPN, орієнтований на конфіденційність

Джерело: Tom’s Hardware


Завантаження коментарів...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: