Оффлайн распознование текста - Kaldi ASR
Попробовал недавно систему распознавания речи Kaldi и оказалось, что все не так уж плохо, а даже на удивление хорошо. Качество распознавания оказалась ненамного хуже чем это делают это Гугл и Яндекс в онлайн, при этом совершенно бесплатно, без регистрации и СМС. На хабре есть хорошая статья для на эту тему.
При этом голосовой движок находятся на локальном компьютере и неплохо справляется с поставленной задачей. Немного смущает количество ресурсов которые требуются для того чтобы скомпилировать софт. В моем случае я потратил вечер для того чтобы скомпилировать систему, но уже после все заработало как надо. Если компилировать самому не хочется, уже имеется скомпилированный Docker образ, но пока не понятно как к нему подключить языковую модель.
Имеется также и очень неплохая языковая русская модель. Если покопаться в сети можно найти модели и для других языков. Если покопаться в сети можно найти модели и для других языков.
Этот текст был наговорен в процессе движения на работу а затем распознан этой штуковиной. Да, я очень ленив.
разрешены только теги br, font, span, p, strong, u, p, blockquote, a, div, img - остальные будут безжалостно удаляться
комментарии: