Дадатак Аўдыяфайл у тэкст прызначаны для распазнавання гукавых файлаў з чалавечай гаворкай у тэкст (маўленне ў тэкст). Прыкладанне яшчэ не прызначана для запісу прамовы (выкарыстоўвайце для гэтага іншыя прыкладання, напрыклад, стандартны дыктафон).
Мы не рэкамендуем выкарыстоўваць для распазнавання слоў з песень, відэа і любых іншых запісаў, якія ўтрымліваюць старонні шум (за выключэннем голасу дынаміка), у гэтым выпадку распазнаванне, хутчэй за ўсё, будзе нездавальняючым.
Мы рэкамендуем выкарыстоўваць яго для распазнавання галасавых запісаў, зробленых з высокай якасцю гуку, калі дынамік знаходзіцца як мага бліжэй да запісвальнай прылады і без старонніх шумоў.
Асаблівасці прыкладання:
- Распазнаванне кароткіх аўдыёзапісаў (даўжынёй да 1 хвіліны)
- Распазнаванне доўгіх аўдыёзапісаў (даўжэй 1 хвіліны)
- Ён падтрымлівае распазнаванне з большасці аўдыёфарматаў - MP3, OGG (кодэк opus), AAC, MPEG, AMR, WAV, M4A, FLAC і іншыя. Але мы рэкамендуем выкарыстоўваць .FLAC
- Падтрымка распазнання са 120 моў
- "Аўта пунктуацыя" даступная для некаторых моў.
- Распазнаны тэкст захоўваецца ў дадатку.
- Магчымасць "Падзяліцца" тэкстам любымі даступнымі метадамі тэлефона
- Магчымасць рэдагавання тэксту ўручную
- Магчымасць экспарту ў тэкставыя фарматы (для Android <10 версіі)
- Распазнаванне аўдыяфайлаў пасля "Падзяліцца" з іншых прыкладанняў (напрыклад, Whats App - галасавыя паведамленні. І праграмы для прагляду файлаў).
Як гэта працуе:
1) Вы выбіраеце аўдыяфайл чалавека
2) Абярыце мову распазнавання і дадатковыя налады (калі такія ёсць для абранай мовы)
3) Націсніце кнопку «Пуск»
4) Аўдыяфайл загружаецца на сервер і яго фармат пераўтвараецца ў FLAC
5) Пасля пераўтварэння робіцца запыт на маўленне ў тэкст, і сервер вяртае вынікі распазнання
Распазнаванне гаворкі выкарыстоўвае воблачнае рашэнне Google - маўленне ў тэкст, якое патрабуе аплаты за распазнаванне адзінкі часу, таму прыкладанне не бясплатнае, і за кожнае распазнаванне мы вымушаны браць плату з карыстальнікаў. Калі ласка, паставіцеся да гэтага з разуменнем.