Цифровизация ИТ в банках Искусственный интеллект axenix

29 Июля 2024 11:00 29 Июл 2024 11:00 |

Ученые из T-Bank AI Research и AIRI создали датасет для обучения искусственного интеллекта на 100 млрд демонстрационных действий

Ученые из лаборатории исследований искусственного интеллекта (ИИ) T-Bank AI Research и Института AIRI представили публичный набор данных для контекстного обучения с подкреплением — XLand-100B. Он поможет ученым быстрее и дешевле проводить исследования без привлечения узкопрофильных специалистов и ставить эксперименты на синтетических данных для анализа новых подходов в обучении ИИ. Об этом CNews сообщили представители «Т-банка».

Массив данных включает 100 млрд примеров действий ИИ-агента на 30 тыс. задач. Для создания такого датасета потребовалось суммарно около 50 тыс. GPU-часов. Такие вычислительные мощности недоступны большинству академических исследовательских лабораторий.

Контекстное обучение с подкреплением

Контекстное обучение с подкреплением (In-Сontext RL) — одна из наиболее перспективных областей машинного обучения. В этом случае ИИ взаимодействует с окружающей средой, учитывает ее контекст при принятии решений и имеет больше возможностей для адаптации к новым средам, то есть может решать большее количество задач. In-Сontext RL можно использовать для обучения ИИ во всех сферах: от игровой индустрии и здравоохранения до робототехники и промышленности.

Модели в In-Context RL обучаются на массивах данных с демонстрацией правильного решения конкретных задач. Так они узнают принципы поиска решения — и способны переносить их на ранее незнакомые задания.

Существующие наборы данных ограничивали исследования метода In-Context RL из-за своей простоты, структуры или малого количества задач. Кроме того, они часто закрыты для широкого использования, особенно самые подходящие. Все это снижает возможности ученых, работающих над развитием искусственного интеллекта.

Датасет XLand-100B

Для создания XLand-100B используется предыдущая работа ученых из лаборатории T-Bank AI Research и Института AIRI, где исследователи добились высокой эффективности и скорости в работе со средой XLand-Minigrid. Там производится начальное предобучение агента на 65 тыс. задач с контролем со стороны человека, чтобы вывести на приемлемый уровень качества и возможностей. Далее агентов дообучают еще на 30 тыс. задач уже без указания задачи.

Весь процесс обучения записывается. Впоследствии запись превращается в набор данных. Созданный датасет сохраняет все состояния среды, в которых был агент во время обучения, все его действия и награды. История обучения позволяет производить дальнейшее обучение моделей In-Context RL в нужном формате.

Какой дисплей для смартфона лучше: AMOLED или IPS?

Подписаться на новости

Короткая ссылка

Ученые из T-Bank AI Research и AIRI создали датасет для обучения искусственного интеллекта на 100 млрд демонстрационных действий

Другие материалы рубрики

Конференции

Современный цифровой офис 2025

Современные контакт-центры 2025

Миграция в облако

CNewsMarket

RPA

VPS

Colocation

Kubernetes

Техника

Битва голосовых помощников: Алиса, Маруся и Салют

Лучшая техника Dreame по уходу за волосами: выбор ZOOM

Обзор HUAWEI FreeBuds SE 4 ANC: доступные наушники с шумоподавлением

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Ученые из T-Bank AI Research и AIRI создали датасет для обучения искусственного интеллекта на 100 млрд демонстрационных действий

Другие материалы рубрики

Конференции

Современный цифровой офис 2025

Современные контакт-центры 2025

Миграция в облако

CNewsMarket

RPA

VPS

Colocation

Kubernetes

Техника

Битва голосовых помощников: Алиса, Маруся и Салют

Лучшая техника Dreame по уходу за волосами: выбор ZOOM

Обзор HUAWEI FreeBuds SE 4 ANC: доступные наушники с шумоподавлением

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

В некоторых областях уровень внедрения ИИ у нас сильно выше, чем в других странах

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока общего рынка

Импортозамещение4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО