ကျွန်ုပ်တို့၏ စကားပြောအသိအမှတ်ပြုမှုဖြေရှင်းချက်သည် ကွန်ပျူတာများ သို့မဟုတ် စက်ပစ္စည်းများကို လူတို့၏စကားပြောဆိုမှုကို အနက်ပြန်နားလည်နိုင်စေမည့် နည်းပညာတစ်ခုဖြစ်သည်။ ၎င်းသည် အသုံးပြုသူများအား စာရိုက်ခြင်း သို့မဟုတ် သမားရိုးကျ ထည့်သွင်းမှုနည်းလမ်းများကို အသုံးပြုခြင်းအစား ၎င်းတို့၏ အသံထည့်သွင်းမှုကို အသုံးပြု၍ စက်ပစ္စည်းများ၊ အပလီကေးရှင်းများ သို့မဟုတ် ဝန်ဆောင်မှုများနှင့် အပြန်အလှန်တုံ့ပြန်နိုင်စေပါသည်။
ဤဖြေရှင်းချက်များတွင် ပုံမှန်အားဖြင့် အောက်ပါ အစိတ်အပိုင်းများ ပါဝင်သည်-
အသံထည့်သွင်းခြင်း- ဖြေရှင်းချက်သည် မိုက်ခရိုဖုန်း သို့မဟုတ် အသံအရင်းအမြစ်မှတစ်ဆင့် အသံထည့်သွင်းမှုကို ဖမ်းယူသည်။
Speech Recognition Engine- စကားပြောမှတ်သားမှုအင်ဂျင်သည် အသံထည့်သွင်းမှုကို လုပ်ဆောင်ပြီး စကားပြောသောစကားလုံးများကို စာသားအဖြစ်သို့ပြောင်းလဲရန် algorithms နှင့် မော်ဒယ်များကို အသုံးပြုသည်။ ဤအင်ဂျင်သည် အသံပိုင်းဆိုင်ရာနှင့် ဘာသာစကား မော်ဒယ်များကဲ့သို့ မတူညီသော ချဉ်းကပ်မှုများကို အသုံးချနိုင်ပြီး တိကျမှုနှင့် မတူညီသော ဘာသာစကားများ သို့မဟုတ် လေယူလေသိမ်းများကို ကိုင်တွယ်ရာတွင် တိကျမှုကို ပိုမိုကောင်းမွန်စေပါသည်။
ဘာသာစကား စီမံဆောင်ရွက်ခြင်း- စကားသံကို စာသားအဖြစ် ပြောင်းလဲပြီးနောက်၊ ဖြေရှင်းချက်သည် သဘာဝဘာသာစကား နားလည်မှု (NLU) သို့မဟုတ် ဝေါဟာရဆိုင်ရာ ခွဲခြမ်းစိတ်ဖြာမှုကဲ့သို့ နောက်ထပ် ဘာသာစကား လုပ်ဆောင်ခြင်း လုပ်ငန်းများကို လုပ်ဆောင်နိုင်သည်။ ဤလုပ်ငန်းစဉ်များသည် အဓိပ္ပါယ်ဖွင့်ဆိုရန်၊ ရည်ရွယ်ချက်များကို ဖော်ထုတ်ရန် သို့မဟုတ် အသိအမှတ်ပြုထားသော စကားအပေါ်အခြေခံ၍ သင့်လျော်သော တုံ့ပြန်မှုများကို ဖန်တီးပေးသည်။
Command သို့မဟုတ် Action Execution- အက်ပလီကေးရှင်း သို့မဟုတ် စနစ်အတွင်း သတ်သတ်မှတ်မှတ် လုပ်ဆောင်ချက်များ သို့မဟုတ် အမိန့်များကို အစပျိုးရန် အသိအမှတ်ပြုထားသော စာသားကို အသုံးပြုနိုင်သည်။ ဥပမာအားဖြင့်၊ စမတ်ကိရိယာများကို ထိန်းချုပ်ရန်၊ သတင်းအချက်အလက်ရှာဖွေရန်၊ စာသားမက်ဆေ့ချ်များရေးရန် သို့မဟုတ် အခြားလုပ်ဆောင်စရာများကို လုပ်ဆောင်ရန် အသံအမိန့်ပေးချက်များကို အသုံးပြုနိုင်သည်။
အပ်ဒိတ်လုပ်ခဲ့သည့်ရက်
၂၀၂၄ စက် ၈