Meta у партнерстві з Microsoft публікує вихідний код LLaMA 2 – своєї великої мовної моделі, яка навчена на 40% більшій кількості даних, ніж попередня версія.
Оголошення відбулось під час заходу Microsoft Inspire, де обидві компанії заявили про «зростаюче партнерство». LLaMa 2 з відкритим вихідним кодом буде доступна через платформу Azure, а також Amazon Web Services, Hugging Face та інших постачальників.
Qualcomm своєю чергою заявила, що співпрацює з Meta над впровадженням LLaMa на ноутбуки, телефони та гарнітури із 2024 року для програм на основі штучного інтелекту, які працюють без використання хмарних служб.
За даними Meta, LLaMa 2 отримала для навчання на 40% більше даних порівняно з LLaMa 1. Віцепрезидент компанії з ШІ Ахмад Аль-Дале каже, що використовувались два набори даних – загальнодоступні дані з Інтернету та набір даних, налаштований за відгуками тестувальників. Meta, як стверджується, не використовувала метадані користувачів в LLaMA 2 і виключила дані із сайтів, які містять багато особистої інформації.
Велика мовна модель також нібито «перевершує» інші LLM, такі як Falcon і MPT в «аргументації, написанні коду, кваліфікації та тестах».
Meta каже, що отримала понад 100 000 запитів від дослідників на використання першої моделі, але LLaMA 2 з відкритим кодом, ймовірно, матиме набагато більше охоплення.
«Ми вважаємо, що відкритий підхід є правильним для розробки сучасних моделей штучного інтелекту, особливо в генеративному просторі, де технологія швидко розвивається. Ціле покоління розробників і дослідників може їх протестувати під навантаженням, швидко виявляючи та розв’язуючи проблеми», – йдеться у заяві Meta.
- Meta вперше випустила свою модель LLaMA в лютому — як пакет з відкритим вихідним кодом, доступ до якого можуть отримати члени ШІ-спільноти. Однак за тиждень після того, як компанія почала приймати запити, торент для завантаження мовної моделі з’явився на сайті 4chan, а згодом поширився в інших спільнотах.
- Також компанія створила SAM — ШІ-модель сегментації зображень, яка може реагувати на підказки користувача (текстові або вказані курсором), щоб ідентифікувати певні об’єкти на зображенні чи відео; та пропонує розробникам відкритий код та набір даних із 180 000 зображень до ШІ-проєкту Animated Drawings, який допоможе анімувати звичайні малюнки.
Favbet Tech – це ІТ-компанія зі 100% украінською ДНК, що створює досконалі сервіси для iGaming і Betting з використанням передових технологіи та надає доступ до них. Favbet Tech розробляє інноваційне програмне забезпечення через складну багатокомпонентну платформу, яка здатна витримувати величезні навантаження та створювати унікальний досвід для гравців.
Повідомити про помилку
Текст, який буде надіслано нашим редакторам: