Ang Papel sa Artipisyal nga Intelligence ug Machine Learning sa Speech Recognition

Papel sa Artipisyal nga Kaalam ug Pagkat-on sa Makina sa Pag-ila sa Speech

Sa dugay nga panahon, gusto sa mga tawo nga makasulti sa mga makina. Sukad nga nagsugod sila sa paghimo og mga kompyuter, ang siyentista ug mga inhenyero misulay sa pag-apil sa pag-ila sa sinultihan sa proseso. Sa tuig 1962, gipaila sa IBM ang Shoebox, usa ka makina sa pag-ila sa pagsulti nga makahimo sa yano nga mga kalkulasyon sa matematika. Kining bag-o nga himan nakaila ug mitubag sa 16 ka gisulti nga mga pulong, lakip ang napulo ka digit gikan sa “0” hangtod sa “9.” Sa diha nga ang usa ka numero ug command nga mga pulong sama sa "plus," "minus" ug "total" ang gisulti, ang Shoebox nagsugo sa usa ka pagdugang nga makina sa pagkalkulo ug pag-imprinta sa mga tubag sa yano nga mga problema sa aritmetika. Ang shoebox gipalihok pinaagi sa pagsulti ngadto sa mikropono, nga nag-convert sa mga tingog sa tingog ngadto sa electrical impulses. Giklasipikar sa usa ka sirkito sa pagsukod kini nga mga impulses sumala sa lainlaing klase sa mga tunog ug gi-aktibo ang gilakip nga makina sa pagdugang pinaagi sa usa ka sistema sa relay.

Sa paglabay sa panahon, kini nga teknolohiya milambo ug karon daghan kanato ang kanunay nga nakig-uban sa mga kompyuter pinaagi sa tingog. Ang labing inila nga voice assistants karon mao ang Alexa ni Amazon, Siri ni Apple, Google Assistant ug Cortana ni Microsoft. Kini nga mga katabang makahimo sa mga buluhaton o serbisyo alang sa usa ka indibidwal base sa mga mando o pangutana. Sila makahimo sa paghubad sa tawhanong sinultihan ug pagtubag pinaagi sa synthesized nga mga tingog. Ang mga tiggamit mahimong mangutana sa ilang mga katabang nga mga pangutana, makontrol ang mga gamit sa pag-automate sa balay ug pag-playback sa media pinaagi sa tingog, ug pagdumala sa ubang mga batakang buluhaton sama sa email, mga lista sa buhaton, ug mga kalendaryo nga adunay mga verbal nga mga mando. nagsalig sa artificial intelligence (AI) ug machine learning.

Artipisyal nga paniktik (AI)

1

Kung giingon nimo ang artificial intelligence (AI), daghang mga tawo ang tingali maghunahuna nga naghisgot ka bahin sa fiction sa siyensya, bisan kung ang AI nalakip kaayo sa atong adlaw-adlaw nga kinabuhi. Sa pagkatinuod, kini sulod na sa mga dekada. Apan ang tinuod mao, kini tinuod nga science fiction nga sa sinugdanan sa ika-20 nga siglo pamilyar sa publiko sa artipisyal nga intelihente sama sa tawo nga mga robot. Sa 50s ang mga konsepto sa AI miabut nga mas ug mas sa focus sa interes sa mga siyentipiko ug mga pilosopo. Niadtong panahona ang batan-ong British nga matematiko nga si Alan Turing misugyot nga walay rason nganong ang mga makina dili (sama sa mga tawo) makasulbad sa mga problema ug makahimog mga desisyon base sa anaa nga impormasyon. Apan niadtong panahona, ang mga kompyuter walay posibilidad sa pagsag-ulo nga maoy yawe sa paniktik. Ang ilang gibuhat mao ang pagpatuman sa mga sugo. Bisan pa, si Alan Turing ang nagtukod sa sukaranan nga katuyoan ug panan-awon sa artificial intelligence.

Ang kaylap nga giila nga amahan sa AI mao si John McCarthy nga nagmugna sa termino nga artificial intelligence . Alang kaniya ang AI mao ang: "ang siyensya ug inhenyeriya sa paghimo og mga makina nga makinaadmanon". Kini nga kahulugan gipresentar sa usa ka komperensya sa Dartmouth College kaniadtong 1956 ug kini nagpakita sa pagsugod sa panukiduki sa AI. Sukad niadto ang AI milambo.

Sa modernong kalibutan, ang artificial intelligence kaylap. Nahimo kini nga labi ka sikat salamat sa pagtaas sa mga volume sa datos, advanced algorithm, ug pag-uswag sa gahum sa pag-compute ug pagtipig. Kasagaran ang aplikasyon sa AI konektado sa mga buluhaton sa intelektwal. Gigamit namon ang AI alang sa paghubad, butang, pag-ila sa nawong ug sinultihan, pagtuki sa hilisgutan, pagtuki sa medikal nga imahe, pagproseso sa natural nga sinultian, pagsala sa social network, pagdula sa chess ug uban pa.

Pagkat-on sa makina

Ang pagkat-on sa makina usa ka aplikasyon sa artificial intelligence ug kini nagtumong sa mga sistema nga adunay katakus nga molambo gikan sa ilang kaugalingon nga kasinatian. Ang labing hinungdanon nga butang dinhi mao nga ang sistema kinahanglan mahibal-an kung giunsa ang pag-ila sa mga sumbanan. Aron mahimo kana ang sistema kinahanglan nga bansayon: ang algorithm nagpakaon sa daghang mga datos aron sa usa ka punto kini makahimo sa pag-ila sa mga sumbanan. Ang katuyoan mao ang pagtugot sa mga kompyuter nga awtomatiko nga makakat-on nga wala’y interbensyon o tabang sa tawo.

Kung maghisgot bahin sa pagkat-on sa makina, hinungdanon nga hisgutan ang lawom nga pagkat-on. Magsugod kita pinaagi sa pag-ingon nga usa sa mga nag-unang himan nga gigamit sa lawom nga pagkat-on mao ang mga artipisyal nga neural network. Mao kana ang mga algorithm nga giinspirar sa istruktura ug gimbuhaton sa utok, bisan kung kini lagmit nga static ug simbolo, ug dili plastik ug analog sama sa biolohikal nga utok. Mao nga, ang lawom nga pagkat-on usa ka espesyal nga porma sa pagkat-on sa makina nga gibase sa artipisyal nga neural network nga ang katuyoan mao ang pagkopya sa paagi sa pagkat-on sa mga tawo ug kini nagsilbi nga usa ka maayo nga himan aron makit-an ang mga pattern nga daghan kaayo alang sa usa ka programmer nga makatudlo sa makina. Sa miaging duha ka tuig adunay daghang mga paghisgot bahin sa mga walay drayber nga mga awto ug kung giunsa nila mabag-o ang atong kinabuhi. Ang lawom nga teknolohiya sa pagkat-on mao ang yawe dinhi, tungod kay kini makapamenos sa mga aksidente pinaagi sa pagpaarang sa awto sa pag-ila sa usa ka pedestrian gikan sa usa ka fire hydrant o sa pag-ila sa usa ka pula nga suga. Ang lawom nga teknolohiya sa pagkat-on nagdula usab sa panguna nga papel sa pagkontrol sa tingog sa mga aparato sama sa mga tablet, telepono, fridge, TV ug uban pa. Ang mga kompanya sa e-commerce kanunay nga naggamit mga artipisyal nga neural network ingon usa ka sistema sa pagsala nga naningkamot sa pagtagna ug pagpakita sa mga butang nga gusto sa usa ka tiggamit. pagpalit. Ang lawom nga teknolohiya sa pagkat-on gigamit usab sa natad sa medisina. Nakatabang kini sa mga tigdukiduki sa kanser nga awtomatiko nga makit-an ang mga selula sa kanser ug sa ingon nagrepresentar sa usa ka dako nga pag-uswag sa pagtambal sa kanser.

Pag-ila sa sinultihan

Ang teknolohiya sa pag-ila sa sinultihan nagsilbi sa pag-ila sa mga pulong ug hugpong sa mga pulong nga nagporma sa sinultihan nga pinulongan ug aron mabag-o kini sa usa ka mabasa nga pormat para sa makina. Samtang ang pipila ka mga programa makaila lamang sa limitado nga gidaghanon sa mga hugpong sa mga pulong, ang uban nga mas sopistikado nga mga programa sa pag-ila sa sinultihan makahubad sa natural nga sinultihan.

Aduna bay mga babag nga mabuntog?

Bisan kung kombenyente, ang teknolohiya sa pag-ila sa sinultihan dili kanunay nga hapsay ug kini adunay pipila ka mga isyu nga kinahanglan buhaton, tungod kay kini padayon nga gipalambo. Ang mga problema nga mahimong motumaw mahimong maglakip sa mga mosunod: ang kalidad sa pagrekord mahimong dili igo, mahimong adunay mga kasaba sa background nga makapalisud sa pagsabut sa mamumulong, usab ang mamumulong mahimong adunay kusog nga accent o dialekto (ikaw ba nakadungog na ba sa Geordie nga dialekto?), ug uban pa.

Ang pag-ila sa sinultihan daghan na kaayo nga naugmad, apan kini layo pa sa pagkahingpit. Dili ang tanan mahitungod lamang sa mga pulong, ang makina dili gihapon makahimo sa daghang mga butang nga mahimo sa tawo: dili sila makabasa sa lengguwahe sa lawas o makaila sa sarkastikong tono sa tingog sa usa ka tawo. Ang mga tawo sa kasagaran dili paglitok sa matag pulong sa husto nga paagi ug sila adunay pagmubo sa pipila ka mga pulong. Pananglitan, kung paspas ug dili pormal ang pagsulti, ang lumad nga mga mamumulong sa Ingles kanunay nga naglitok sa "pag-adto" sama sa "gonna." Ang tanan nga naa sa ibabaw, hinungdan sa mga babag sa mga makina nga ilang gipaningkamutan nga mabuntog, apan layo pa sa ilang atubangan. Mahinungdanon nga ipasiugda nga samtang nagkadaghan ang datos nga gipakaon sa mga piho nga algorithm; ang mga hagit daw nagkunhod. Ang kaugmaon sa automated speech recognition daw hayag.

Ang voice-powered user interface nahimong mas magamit ug popular sa mga panimalay. Mahimo pa gani kini nga sunod nga plataporma sa teknolohiya.

Ang Gglot nagtanyag og automated speech recognition sa porma sa automated transcription services – among gi-convert ang mga speech ngadto sa text. Ang among serbisyo yano ra nga gamiton, dili kini gasto ug dali kini buhaton!