Ang application na Audio file sa teksto ay idinisenyo upang makilala ang mga file ng tunog na may pagsasalita ng tao sa teksto (pagsasalita sa teksto). Ang application ay hindi pa inilaan para sa pag-record ng pagsasalita (gumamit ng iba pang mga application para dito, halimbawa, isang karaniwang tagapag-record ng boses).
Hindi namin inirerekumenda upang magamit para sa pagkilala ng mga salita mula sa mga kanta, video at anumang iba pang mga pag-record na naglalaman ng labis na ingay (maliban sa tinig ng nagsasalita), sa kasong ito malamang na hindi kasiya-siya ang pagkilala.
Inirerekumenda namin na gamitin ito upang makilala ang mga pag-record ng boses na ginawa na may mataas na kalidad ng tunog kapag ang speaker ay mas malapit hangga't maaari sa recording device at walang labis na ingay.
Mga Tampok ng Application:
- Pagkilala sa mga maikling pag-record ng audio (hanggang sa 1 minuto ang haba)
- Pagkilala sa mahabang recording ng audio (mas mahaba sa 1 minuto)
- Sinusuportahan nito ang pagkilala mula sa karamihan ng mga format ng audio - MP3, OGG (opus Codec), AAC, MPEG, AMR, WAV, M4A, FLAC at iba pa. Ngunit inirerekumenda namin ang paggamit ng .FLAC
- Suporta sa pagkilala mula sa 120 mga wika
- Ang "Auto Punctuation" ay magagamit para sa ilang mga wika.
- Ang kinikilalang teksto ay nai-save sa application.
- Ang kakayahang "Ibahagi" ang teksto sa anumang magagamit na mga pamamaraan ng telepono
- Kakayahang manu-manong mag-edit ng teksto
- Kakayahang mag-export sa mga format ng teksto (para sa Android <10 bersyon)
- Pagkilala ng mga audio file pagkatapos ng "Ibahagi" mula sa iba pang mga application (Halimbawa, Ano ang App - mga mensahe sa boses. At mga application para sa pagtingin ng mga file).
Paano ito gumagana:
1) Pumili ka ng audio file ng isang tao
2) Pumili ng isang wika ng pagkilala at mga karagdagang setting (kung mayroon man para sa napiling wika)
3) Pindutin ang pindutang "Start"
4) Ang audio file ay na-download sa server at ang format nito ay na-convert sa FLAC
5) Pagkatapos ng conversion, isang kahilingan ay gagawin sa Speech-To-Text at ibabalik ng server ang mga resulta sa pagkilala
Gumagamit ang pagkilala sa pagsasalita ng cloud solution ng Google - Pagsasalita sa teksto, na nangangailangan ng pagbabayad para sa pagkilala sa isang yunit ng oras, samakatuwid ang application ay hindi libre at para sa bawat pagkilala napilitan kaming singilin ang mga gumagamit. Mangyaring pakitunguhan ito nang may pag-unawa.
Na-update noong
Peb 12, 2024