Gure hizketa ezagutzeko irtenbidea ordenagailuei edo gailuei giza hizkera interpretatu eta ulertzeko aukera ematen dien teknologia da. Erabiltzaileei gailu, aplikazio edo zerbitzuekin elkarreragiteko aukera ematen die ahotsa sarrera gisa idatzi edo ohiko idazketa-metodoak erabili beharrean.
Soluzio hauek osagai hauek izaten dituzte normalean:
Audio-sarrera: irtenbideak mikrofono edo audio-iturri baten bidez jasotzen du audio-sarrera.
Ahotsa ezagutzeko motorra: ahotsa ezagutzeko motorrak audio-sarrera prozesatzen du eta algoritmoak eta ereduak aplikatzen ditu ahozko hitzak testu bihurtzeko. Motor honek ikuspegi desberdinak erabil ditzake, hala nola eredu akustikoak eta hizkuntza ereduak, zehaztasuna hobetzeko eta hizkuntza edo azentu desberdinak maneiatzeko.
Hizkuntzaren prozesamendua: hizketa testu bihurtu ondoren, irtenbideak hizkuntza prozesatzeko zeregin gehigarriak egin ditzake, hala nola, hizkuntza naturalaren ulermena (NLU) edo analisi semantikoa. Prozesu hauek esanahia ateratzen, asmoak identifikatzen edo erantzun egokiak sortzen laguntzen dute aitortutako hizkeran oinarrituta.
Komandoa edo ekintzaren exekuzioa: aitortutako testua aplikazio edo sistema baten barruan ekintza edo komando zehatzak abiarazteko erabil daiteke. Adibidez, ahots-komandoak gailu adimendunak kontrolatzeko, informazioa bilatzeko, testu-mezuak idazteko edo beste zeregin batzuk egiteko erabil daitezke.
Azken eguneratzea
2024(e)ko ira. 8(a)