Ён выкарыстоўвае API VOSK для запісу аўдыя на прыладзе, транскрыпцыі і адлюстравання ў выглядзе субтытраў.
Яго можна выкарыстоўваць для транскрыпцыі, калі гук недаступны.
Калі вы запускаеце праграму ў першы раз або калі дадаяце іншыя мовы, вам трэба будзе загрузіць файлы мадэлі, неабходныя для транскрыпцыі.
https://alphacephei.com/vosk/models
Ён выкарыстоўвае запіс экрана для запісу. Ён мае доступ толькі да аўдыя.
Ён таксама выкарыстоўвае службу пярэдняга плана, каб падтрымліваць транскрыпцыю ў фонавым рэжыме.
Гэта дадатак з адкрытым зыходным кодам
https://github.com/takusan23/Hiroid