DeepSeek відкрила код 3FS — файлової системи для серверів навчання штучного інтелекту
Під час Open Source Week DeepSeek зробила відкритою свою паралельну файлову систему Fire-Flyer Fire System (3FS). За словами компанії, 3FS досягає 7,3 ТБ/с сукупної швидкості читання на кластерах даних її власних…
ChatGPT «думає» китайською — користувачі помітили ієрогліфи в обґрунтованнях моделі
ChatGPT з мовною моделлю o1 витрачає «більше часу на роздуми» для кращої відповіді. Користувачі виявили, що «роздуми» іноді відбуваються китайською, незалежно від мови запиту.
Ютубер створив кластер з п’яти Apple Mac mini M4 — наскільки він ефективний?
Відеоблогер продемонстрував обчислювальний кластер з нових Apple Mac mini на процесорі M4. Іноді це краще, ніж потужна відеокарта.
Gemini 1.5 Flash — швидка мультимодальна модель Google із контекстним вікном у 2 млн токенів
Google оголосила про випуск Gemini 1.5 Flash — невеликої мультимодальної моделі, створеної для масштабування та вирішення вузьких високочастотних завдань.
Знайомтесь, MAI-1: нова ШІ-модель Microsoft із 500 млрд параметрів, яка прагне «побити» GPT
Microsoft, схоже, працює над власною великою мовною моделлю, яка потенційно стане головним конкурентом для ШІ Google, Anthropic і OpenAI — попри те, що корпорація сама інвестувала $10 млрд в розробника ChatGPT і…
Великі мовні моделі (LLM) штучного інтелекту стають «більш приховано расистськими» після людського втручання
Від самого початку було зрозуміло, що великі мовні моделі (LLM), як ChatGPT, вбирають расистські тези з мільйонів сторінок інтернету, на яких вони навчаються. Розробники відреагували на це,…
Google запускає PaLM 2 — наступне покоління власної великої мовної моделі, на якій працюватиме чатбот Bard
На конференції розробників Google I/O компанія оголосила про запуск наступного покоління власної великої мовної моделі PaLM, яка ляже в основу оновленого чатбота Bard і функціонуватиме як базова…
Dolly 2.0 — перша велика мовна модель з відкритим вихідним кодом та безплатним набором даних для комерційного використання
Американська компанія з корпоративного програмного забезпечення Databricks випустила Dolly 2.0 – наступну версію своєї великої мовної моделі (LLM) з подібними до ChatGPT функціями. Це перша LLM з відкритим…
Повідомити про помилку
Текст, який буде надіслано нашим редакторам: