Нова версія ШІ-моделі DeepSeek R1 зрівнялася із OpenAI o3

Китайська компанія DeepSeek поновила свою флагманську мовну модель R1. Судячи з проведених тестів, вона здатна конкурувати з o3 від OpenAI. Модель демонструє покращену логічну точність та справляється зі складними завданнями, що потребують глибокого аналізу.
Оновлена версія DeepSeek R1 налічує 685 мільярдів параметрів – це більш ніж у 3 рази більше, ніж у GPT-3. Такий обсяг робить її однією з найбільших відкритих моделей на сьогодні. Однак використовувати її на звичайних ПК без оптимізації не вийде, а ось для дослідницьких завдань та серверних рішень це потужний інструмент.
Модель вже доступна на Hugging Face під відкритою ліцензією MIT. Це означає, що розробники можуть використовувати її навіть у комерційних проектах без юридичних обмежень. Цікаво, що репозиторій на Hugging Face містить лише конфігураційні файли та ваги – це мінімально необхідна документація для роботи моделі, але ентузіасти вже можуть розпочати експерименти.
Користувачі вже протестували оновлену модель DeepSeek у написанні ігор, створенні анімацій та емуляції фізики.