Китайские учёные представили ИИ, который учится рассуждать без подсказок

DeepSeek-R1: искусственный интеллект, который сам придумал, как думать фото 1

В журнале Nature опубликовано исследование, которое уже называют прорывом в развитии искусственного интеллекта.

Китайская команда разработала DeepSeek-R1 — первую масштабную языковую модель, сумевшую осваивать навыки рассуждения без заранее прописанных примеров от человека.

Как раньше и что изменилось

До сих пор обучение подобных систем требовало колоссальных усилий: для каждой задачи учёные вручную создавали цепочки рассуждений, показывая ИИ пошаговый путь к ответу.

DeepSeek-R1 нарушила эти правила. Вместо готовых схем модель обучали по принципу «правильно/неправильно», оценивая только итоговый результат.

Ключевую роль сыграл алгоритм Group Relative Policy Optimization (GRPO). Он позволил системе не просто искать ответы, но и проверять промежуточные шаги, критиковать свои решения и менять стратегию при необходимости.

DeepSeek-R1: искусственный интеллект, который сам придумал, как думать фото 2

Результаты, которые впечатлили

В математическом тесте AIME точность модели выросла с 15% до 78%. А при включенной функции самопроверки — до 87%, что выше среднего уровня участников реальных олимпиад.

В задачах по программированию и STEM-дисциплинам DeepSeek-R1 обогнала все модели сопоставимого масштаба и приблизилась к куда более крупным конкурентам.

Не менее важно, что даже «облегчённые» версии сохраняют большую часть новых навыков, что открывает путь к практическому применению компактных моделей.

Ограничения и перспективы

Конечно, пока у системы есть слабые места: стиль ответов не всегда выдержан, встречается смешение языков, а гуманитарные дисциплины даются хуже.

Но исследователи уверены, что такие модели в будущем смогут самостоятельно открывать закономерности в науке, разрабатывать инженерные проекты и помогать образованию.