Німецькі дослідники з Рурського університету та Інституту програмних систем Товариства Макса Планка з’ясували, що пошукові системи на базі штучного інтелекту частіше цитують маловідомі сайти, ніж традиційні джерела, такі як Google.
Дослідники порівняли стандартні результати пошуку у Google з відповідями AI Overviews, Gemini 2.5 Flash та двох варіантів вебпошуку GPT-4o. Результати аналізу продемонстрували, що ШІ частіше посилаються на сайти з нижчим рейтингом популярності. У багатьох випадках ці джерела не відображаються серед першої сотні результатів Google за тим самим пошуковим запитом.
Науковці використали низку тестових питань, включно з тими, які реальні користувачі ставили ChatGPT під час спілкування, а також на політичні теми та стосовно найпопулярніших товарів на Amazon. За даними інструмента ранжування доменів Tranco, джерела, які використовували системи на базі ШІ, ранжувались значно нижче за топрезультати пошукових запитів у Google. Результати Gemini мали медіанний ранг домену вище за першу тисячу.
Понад половина джерел, цитованих AI Overviews, були відсутні у першій десятці традиційних результатів. Близько 40% — взагалі не потрапили до першої сотні. Однак зсув у бік маловідомих джерел, ймовірно, не вплинув на якість інформації. Моделі на основі GPT часто цитували корпоративні сайти та енциклопедичний контент, уникаючи соціальних мереж.
Дослідження показало, що згенеровані ШІ результати пошуку містять приблизно той самий набір інформації, що й результати традиційних пошукових запитів. Однак оскільки моделі на базі ШІ переважно узагальнюють інформацію, а не посилаються окремо на кожне джерело, великі обсяги даних стискаються у короткі відповіді, що може призвести до втрати дрібних деталей.
За словами дослідників, ШІ-системи також мають труднощі з пошуком термінових або мінливих тем. Наприклад, гібридний режим GPT-4o іноді не надавав найактуальнішу інформацію при відповіді на запити про нещодавні події або популярні теми.
Фахівці з університетів Софії, Цюриха, Стенфорда та Карнегі-Меллона незалежно підтвердили те, що користувачі помічали давно — великі мовні моделі часто кажуть те, що людям хочеться почути, навіть коли це суперечить фактам або здоровому глузду. Нові дослідження показують: схильність ШІ до “підлабузництва” можна виміряти — і ця проблема справді поширена.

Повідомити про помилку
Текст, який буде надіслано нашим редакторам: