Аналитики прогнозируют, что уже к 2027 году каждое третье онлайн-совещание будет преобразовываться в текстовую расшифровку в режиме реального времени. Для этого станут использовать алгоритмы искусственного интеллекта. Из речи в текст в режиме записи будут преобразовывать более 95% всех онлайн-встреч, в которых принимают участие свыше трех человек.

По словам заместителя президента – председателя правления банка ВТБ Вадима Кулика, на сегодняшний день в реальном времени расшифровывается не более 1% онлайн-конференций и до 10% в записи.

«Всю аудиторию сервисов видеоконференцсвязи (ВКС) мы оцениваем в 20 млн пользователей в РФ. Из них регулярно функцией преобразования речи в текст пользуется порядка 1% аудитории. К 2027 году, мы прогнозируем, этот показатель вырастет до 10% всех пользователей сервисов видеоконференций. Он может вырасти и до 20% – но в случае развития не только сервисов транскрибации, но в целом сегмента цифровых ассистентов», – отмечает Вадим Кулик.

Все, что говорят участники видео-встречи, алгоритм преобразовывает в письменные сообщения, разбитые на реплики. Сейчас на основе созданных ИТ-специалистами моделей тестируется функция саммаризации, когда пользователи могут получить краткое изложение прошедшей онлайн-конференции. А в дальнейшем появится функция автопротоколирования – автоматически генерируемого по итогам онлайн-встречи перечня поручений.

По оценке специалистов, компания со штатом в 10 тысяч человек может сэкономить до 7,5 тыс. часов в год, если вместо расшифровки онлайн-совещаний вручную будут использоваться нейросетевые алгоритмы.

Аналитики ВТБ отмечают большой потенциал в использовании генеративных моделей для развития вспомогательных сервисов: голосовых помощников, цифровых ассистентов и др.