Группа «Т-Технологии» выпустила модель с гибридным режимом рассуждений T-Pro 2.0
Группа «Т-Технологии» представила T-Pro 2.0 — первую собственную большую языковую модель с гибридным режимом рассуждений, которая сочетает более высокое качество ответов на сложные запросы с экономией вычислительных ресурсов в 2 раза для запросов на русском языке по сравнению с аналогами Qwen3 и DeepSeek R1-Distil. Гибридные модели позволяют выбирать между быстрыми простыми ответами и глубоким анализом, что помогает оптимизировать расходы на вычисления при внедрении ИИ.
Суммарные затраты на разработку, включая расходы на вычислительные мощности для R&D и финального дообучения, а также зарплаты сотрудников, не превышают 120 млн руб.
За счет рассуждений модель научилась решать сложные аналитические задачи, структурно рассуждать и планировать свои действия, выдвигать гипотезы и опровергать их самостоятельно. Если раньше моделям можно было дать автономную задачу, на которую в среднем у человека уходит 30 секунд, то моделям с режимом рассуждений можно поручать задачи на которые у человека уходит в среднем 8 минут. Решения в таких моделях более прозрачны и воспроизводимы, что делает их технологической базой для агентов нового поколения, которые способны взаимодействовать с внешними интерфейсами и выполнять задачи без контроля человека. Например, в поддержке ИИ-агенты помогают не просто генерировать ответы, но и решать вопросы без привлечения оператора, в «Т-Банке» доля таких обращений уже достигла 45%.
«Т-Банк» планирует интегрировать новую модель в работу своих ИИ-ассистентов, которые доступны всем клиентам банка, а также применять для повышения эффективности операционных процессов за счет copilot-решений и автономных агентов.
Переход на внутреннюю версию T-Pro 2.0, обученную на собственных внутренних данных, уже повысил качество работы автономных агентов поддержки «Т-Банка»: они стали решать задачи пользователей без участия оператора на 10% чаще без дополнительных затрат на разработку или операционные процессы.
T-Pro 2.0 на 32 млрд параметров доступна на Hugging Face в открытом доступе под лицензией Apache 2.0, что позволяет компаниям свободно скачивать, использовать, адаптировать и дообучать на своих данных и интегрировать её в свои решения. Вместе с моделью опубликованы бенчмарки, а также впервые выложен инструктивный датасет T-Wix, который содержит около 500 тыс. примеров.
Ключевые характеристики T-Pro 2.0:
Гибридный режим рассуждений: модель позволяет выбрать стратегию ответа: дать его сразу при простых вопросах или использовать рассуждение для решения сложных задач, что позволяет использовать одну модель для разных бизнес-процессов и экономить ресурсы.
Лидерство в своем классе: T-Pro 2.0 демонстрирует более высокое качество на русскоязычных бенчмарках, включая MERA, ruMMLU, Ru Arena Hard, ru AIME, ru LCB по сравнению с другими открытыми моделями на 30 млрд параметров.
Экономия при внедрении: благодаря более плотной токенизации русского языка и ускорения генерации токенов большими языковыми моделями за счет использования дополнительной модели меньшего размера T-Pro 2.0 дает ответы в два раза быстрее, чем Qwen3 и модель DeepSeek R1 Distil аналогичных размеров, что уменьшает затраты на обработку информации и разработку решений на основе модели. В среднем модель позволяет генерировать ответ с рассуждениями на русском языке на типовом оборудовании в 2 раза дешевле.
Виктор Тарнавский, директор по искусственному интеллекту «Т-Банка», сказал: «T-Pro 2.0 сочетает лучшее качество среди открытых моделей в размере 30 миллиардов параметров с практичностью при внедрении – более быстрая генерация рассуждений на любом кириллическом языке дает в среднем двукратную экономию вычислительных ресурсов по сравнению с доступными аналогами. Мы продолжаем делиться своими лучшими разработками с индустрией – под лицензией Apache 2.0 каждая компания может свободно переиспользовать наши вложенные усилия и опыт, дообучить модель на своих данных, создать собственные решения».
Новая модель входит в Gen-T — семейство собственных больших языковых моделей группы «Т-Технологии». В 2024 г. компания выпустила первые большие языковые модели на 32 млрд параметров и на 7 млрд параметров: T-Pro и T-Lite. Сегодня это одни из самых популярных открытых моделей в ру-сегменте, которые ежемесячно скачивают более 15 тыс. раз.