Dolly 2.0 — первая большая языковая модель с открытым исходным кодом и бесплатным набором данных для коммерческого использования

Опубликовал Катерина Даньшина

Американская компания по корпоративному программному обеспечению Databricks выпустила Dolly 2.0 – следующую версию своей большой языковой модели (LLM), с подобными ChatGPT функциями. Это первая LLM с открытым исходным кодом и набором инструкций для обучения в свободном доступе, что поможет компаниям использовать ИИ-технологию для собственных коммерческих проектов – без необходимости оплаты API или обмена данными с третьими сторонами.

В последние месяцы было выпущено немало языковых моделей, подобных GPT от OpenAI, которые по многим определениям можно было считать открытыми. Одна из таких – LLaMA от Meta, которой, в свою очередь, вдохновились Alpaca, Koala, Vicuna и Dolly 1.0

Однако многие из этих «открытых» моделей находились под контролем разработчиков систем — например, ИИ-проект команды из Стэнфорда Alpaca, который был обучен на инструкциях GPT-3.5 и создан на основе LLaMA 7B. Условия использования OpenAI включают правило о том, что исследователи не могут использовать продукты систем, конкурирующих с компанией.

Цель Databricks – решить эту проблему. Dolly 2.0 – это большая языковая модель с 12 миллиардами параметров, основанная на семействе моделей искусственного интеллекта Eleuther с открытым кодом и настроенная исключительно на небольшой блок инструкций (databricks-dolly-15k), созданный сотрудниками Databricks. Условия лицензирования этого набора данных позволяют использовать, изменять и расширять его для любых целей, включая академические или коммерческие программы.

В блоге Databricks подчеркивается, что, как и оригинальная Dolly, версия 2.0 не является самой современной, но «демонстрирует удивительно эффективный уровень выполнения инструкций, учитывая размер блока для обучения». В сообщении добавляется, что уровень усилий и затрат, необходимых для создания мощных технологий искусственного интеллекта, «значительно меньший, чем представлялось ранее»‎.

Загрузить модель Dolly 2.0 можно на странице Databricks Hugging Face, а инструкции – на GitHub. Компания также предлагает посетить 25 апреля ее вебинар, где разъяснят, как организации могут использовать LLM.

Контент сайту призначений для осіб віком від 21 року. Переглядаючи матеріали, ви підтверджуєте свою відповідність віковим обмеженням.

Cуб'єкт у сфері онлайн-медіа; ідентифікатор медіа - R40-06029.