Сбер представил нейросетевые модели, которые могут распознавать русский жестовый язык. Об этом на конференции AI Journey сообщил Андрей Белевцев, старший вице-президент, CTO и руководитель блока «Технологи» в Сбербанке.
Команда Vision RnD из Управления экспериментальных систем машинного обучения в SberDevices разрабатывает одно из таких решений и представила прототип общения с генеративной языковой моделью при помощи жестового языка в открытом доступе. Это стало возможно благодаря использованию GigaChat API, программного интерфейса доступа к сервису GigaChat.
Генеративная модель GigaChat способна самостоятельно понимать контекст распознанных жестов без необходимости дополнительных преобразований. Например, если распознаны отдельные слова «Я Идти Улица Гулять», сервис автоматически преобразует их в корректную фразу «Я пошел гулять на улицу», сохраняя контекст передачи информации.