Новини WTF 30.12.2024 о 12:57 comment views icon

Нова китайська ШІ-модель вважає себе ChatGPT. Ось чому це відбувається

author avatar

Катерина Даньшина

Авторка новин

Нова китайська ШІ-модель вважає себе ChatGPT. Ось чому це відбувається
Кадр з фільму «Я, робот» / 20th Century Fox
Розділ Технології виходить за підтримки

Минулого тижня китайська лабораторія штучного інтелекту випустила нову «відкриту» модель штучного інтелекту під назвою DeepSeek, яка перевершує багатьох конкурентів за популярними тестами (зокрема в програмуванні й написанні есе), однак має одну цікаву особливість — вважає, що вона ChatGPT.

Низку дописів з подібними заявами DeepSeek поширили в X та Reddit. Модель також уточнює, до якого саме випуску належить — версії GPT-4, випущеної у 2023 році.

Чому це відбувається? Видання TechCrunch пише, що обидві моделі — ChatGPT і DeepSeek V3 — статичні системи, які навчаються на мільярдах прикладів із шаблонами, щоб робити прогнози по тексту (навіть в таких елементарних речах, як визначити, де поставити кому в реченні). Китайці не розкрили навчальних даних свої моделі, однак загальнодоступних наборів із текстом, створеним GPT-4 через ChatGPT, нині вдосталь — тож цілком можливо, що DeepSeek ними скористалася і просто відтворює вихідні дані дослівно.

«Очевидно, що в якийсь момент модель отримує необроблені відповіді від ChatGPT, але незрозуміло, звідки саме», — сказав у коментарів виданню Майк Кук, науковий співробітник Королівського коледжу Лондона, який спеціалізується на ШІ. «Це може бути “випадковістю”… але, на жаль, ми вже бачили випадки, коли люди навчали свої моделі на даних інших моделей, щоб спробувати використати ці знання».

Кук зазначив, що практика навчання моделей на результатах конкурентних систем штучного інтелекту може бути «дуже поганою» для якості моделі, оскільки це може призвести до галюцинацій і оманливих відповідей, подібних до наведених вище.

«Подібно до фотокопії, ми втрачаємо все більше інформації та зв’язку з реальністю», — додає Кук.

Це також може суперечити умовам обслуговування цих систем. Правила OpenAI, до прикладу, забороняють користувачам ChatGPT використовувати результати для розробки моделей, які конкурують із власними системами OpenAI.

Жодна з компаній не відповіла на запит журналістів, однак бос стартапу Сем Альтман у ті самі дні, коли поширились дописи з DeepSeek, написав:

«Відносно легко скопіювати те, що, як ви знаєте, вже працює. Надзвичайно важко робити щось нове та ризиковане, коли ти не знаєш, яким буде результат».

Насправді, DeepSeek V3 далеко не перша модель, яка помилково ідентифікувала себе. Google Gemini на запит китайською мовою відповідала, що вона є чатботом Wenxinyiyan китайської компанії Baidu.

Нова модель ChatGPT o1 «плела інтриги проти людей» і заважала себе вимкнути під час контрольних тестів, — Apollo Research

Розділ Технології виходить за підтримки

Favbet Tech – це ІТ-компанія зі 100% украі‌нською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологіи‌ та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.


Що думаєте про цю статтю?
Голосів:
Файно є
Файно є
Йой, най буде!
Йой, най буде!
Трясця!
Трясця!
Ну такої...
Ну такої...
Бісить, аж тіпає!
Бісить, аж тіпає!
Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: