Apple випустила OpenELM – сімейство моделей штучного інтелекту з відкритим кодом, призначених для запуску на пристрої

Опубликовал
Вадим Карпусь

Apple збирається приєднатися до компанії розробників моделей штучного інтелекту з власним сімейством OpenELM. Це лінійка великих мовних моделей (LLM) із відкритим кодом, які можуть працювати повністю на одному пристрої замість підключення до хмарних серверів.

OpenELM – це скорочення від Open-source Efficient Language Models. Вони націлені на застосунки на пристрої. Apple стверджує, що сімейство моделей «має на меті розширити можливості та зміцнювати відкриту дослідницьку спільноту, сприяючи майбутнім дослідницьким зусиллям». Моделі були попередньо навчені на загальнодоступних наборах даних із 1,8 трлн токенів із Reddit, Wikipedia, arXiv.org тощо.

OpenELM складається з невеликих моделей, призначених для ефективного виконання завдань зі створення тексту. Відповідний код опублікований у спільноті кодів штучного інтелекту Hugging Face. Загалом існує 8 моделей OpenELM: 4 попередньо навчені та 4 налаштовані за інструкціями. Вони охоплюють різні розміри параметрів – від 270 млн до 3 млрд параметрів.

Онлайн-інтенсив "Як створити рекомендаційну модель за 2 дні" від robot_dreams.
Ви пройдете етапи вибору, навчання, оцінки рекомендаційної моделі для електронної бібліотеки та отримаєте індивідуальний фідбек від лекторки.
Приєднатись до інтенсиву

Моделі OpenELM можуть працювати на звичайних користувацьких пристроях, таких як ноутбуки та смартфони. Apple зазначається, що тести проводилися на «робочій станції з процесором Intel i9-13900KF, оснащеній 64 ГБ пам’яті DDR5-4000 DRAM і графічним процесором NVIDIA RTX 4090 з 24 ГБ відеопам’яті під керуванням Ubuntu 22.04», а також «Apple MacBook Pro із вбудованою системою M2 Max і 64 ГБ оперативної пам’яті під керуванням macOS 14.4.1».

Apple пропонує свої моделі OpenELM у рамках так званої «ліцензії на зразок коду», а також надає різні контрольні точки з навчання, статистичні дані про ефективність моделей, а також інструкції щодо попереднього навчання, оцінювання, налаштування інструкцій і параметрів.

Ліцензія на зразок коду не забороняє комерційне використання чи модифікацію, лише встановлює, що «якщо ви розповсюджуєте програмне забезпечення Apple у повному обсязі та без змін, ви повинні зберегти це повідомлення, а також наступний текст і застереження в усіх таких розповсюдженнях програмного забезпечення Apple».

Крім того, компанія зазначає, що моделі «доступні без будь-яких гарантій безпеки. Отже, існує ймовірність того, що ці моделі створюватимуть неточні, шкідливі, упереджені або небажані результати у відповідь на запити користувача».

Джерело: venturebeat

Disqus Comments Loading...