Unsa man gyud ang Speech Recognition?
Pag-ila sa sinultihan
Ang kinahanglan nimong masayran bahin sa pag-ila sa sinultihan
Kung naghisgot kami bahin sa pag-ila sa sinultihan, kasagaran nagpasabut kami usa ka software nga adunay katakus sa pag-ila sa gisulti nga pulong ug isulat kini sa usa ka programa aron sa katapusan naa nimo ang tanan nga gisulti sa usa ka sinulat nga pormat. Kanunay usab kini nga gitawag nga "speech-to-text". Sa sinugdanan kana nga software adunay limitado nga mga posibilidad, aron mahimo nimo nga mabag-o ang limitado nga gidaghanon sa mga hugpong sa mga pulong. Sa paglabay sa panahon, ang teknolohiya luyo sa software sa pag-ila sa sinultihan nag-uswag ug labi na karon nga labi ka sopistikado, aron kini makaila sa lainlaing mga pinulongan ug bisan sa lainlaing mga accent. Apan siyempre, aduna pa'y trabaho nga kinahanglan buhaton niini nga natad.
Mahinungdanon usab nga matikdan nga ang pag-ila sa sinultihan dili parehas sa pag-ila sa tingog, bisan kung usahay gigamit sa mga tawo ang duha ka termino alang sa parehas nga butang. Ang pag-ila sa tingog gigamit para sa pag-ila sa tawo nga nagsulti ug dili aron mamatikdan kung unsa ang gisulti.
Usa ka mubo nga kasaysayan sa pag-ila sa sinultihan ug may kalabutan nga teknolohiya
Niini nga artikulo, among ipasabut sa daklit ang kasaysayan ug teknolohiya luyo sa pagtaas sa pag-ila sa sinultihan.
Sukad pa sa kaadlawon sa digital age, ang mga tawo adunay gana nga sa usa ka paagi makahimo sa pagpakigsulti sa mga makina. Human naimbento ang unang matang sa digital nga kompyuter, daghang siyentista ug mga inhenyero ang misulay sa nagkalain-laing mga paagi aron mapatuman ang speech recognition niini nga proseso. Usa ka hinungdanon nga tuig sa kini nga proseso mao ang 1962, sa dihang gipadayag sa IBM ang Shoebox, usa ka sukaranan nga makina sa pagkilala sa sinultihan nga nakahimo sa yano nga mga kalkulasyon sa matematika. Kung ang tiggamit niini nga proto-computer nagsulti sa usa ka mikropono, kini nga makina makahimo sa pag-ila hangtod sa unom ka kontrol nga mga pulong sama sa "plus" o "minus". Sa paglabay sa panahon, ang teknolohiya sa luyo niini naugmad ug karon komon kaayo nga bahin sa pagpakig-uban sa mga kompyuter pinaagi sa tingog. Adunay daghang bantog nga mga makina sa pag-ila sa sinultihan sama sa Siri o Alexa. Mahinungdanon nga hinumdoman nga kini nga mga aparato nga gipadagan sa tingog nagsalig sa artificial intelligence (AI) ug pagkat-on sa makina.
Kung ang artificial intelligence (AI) ang hisgutan, kini mahimong sama sa usa ka salida sa science fiction, apan ang tinuod mao nga sa karon nga panahon ug edad AI adunay dako nga papel sa atong kalibutan. Sa tinuud, ang AI naa na kaayo sa atong adlaw-adlaw nga kinabuhi, tungod kay daghang mga programa ug apps ang naggamit na niini. Apan kadto maoy science fiction sa sinugdanan sa ika-20 nga siglo, sa dihang mitungha ang termino. Sa ulahing bahin sa 1950 ang mga konsepto sa AI nahimong mas prominente ug mao ang sentro sa interes sa daghang mga siyentipiko ug mga pilosopo. Nianang panahona, ang usa ka ambisyoso kaayo nga British mathematician nga gitawag ug Alan Turing nakamugna ug usa ka proposisyon nga ang mga makina makasulbad sa mga problema ug makahimog mga desisyon nga sila ra, base sa input sa available nga impormasyon. Ang problema mao nga ang mga kompyuter wala pa ang posibilidad sa pagsag-ulo sa mga datos, nga usa ka hinungdanon nga lakang alang sa pagpalambo sa artipisyal nga paniktik. Ang mahimo ra nila kaniadto mao ang pagpatuman sa yano nga mga mando.
Ang laing importante nga ngalan sa pagpalambo sa AI mao si John McCarthy, kinsa unang nagmugna sa mismong termino nga "artipisyal nga paniktik". Gipahayag ni McCarthy nga ang AI mao: "ang siyensya ug inhenyeriya sa paghimo og mga makina nga intelihenteng". Kini nga kahulugan nahayag sa usa ka seminal nga komperensya sa Dartmouth College kaniadtong 1956. Sukad niadto ang AI nagsugod sa pag-uswag sa kusog nga tulin.
Karon, ang artificial intelligence sa lainlaing porma niini anaa bisan asa. Mitubo kini ngadto sa masa nga pagsagop, nag-una tungod sa pagtaas sa kinatibuk-ang gidaghanon sa datos nga gibaylo sa tibuok kalibutan kada adlaw. Gigamit kini sa mga advanced algorithm, ug kini nagpatunghag mga kalamboan sa storage ug computing power. Ang AI gigamit alang sa daghang mga katuyoan, pananglitan sa paghubad, transkripsyon, sinultihan, pag-ila sa nawong ug butang, pagtuki sa medikal nga mga imahe, pagproseso sa natural nga mga sinultian, lainlaing mga filter sa social network ug uban pa. Hinumdomi nga ang duwa sa chess tali sa grandmaster Gari Kasparov ug Deep Blue chess AI?
Ang pagkat-on sa makina usa pa ka hinungdanon nga aplikasyon sa artificial intelligence. Sa laktud, kini nagtumong sa bisan unsang mga sistema nga adunay katakus sa pagkat-on ug pag-uswag gikan sa database sa ilang kaugalingon nga kasinatian. Naglihok kini pinaagi sa pag-ila sa mga sumbanan. Aron mahimo ang sistema kinahanglan kini nga mabansay. Ang algorithm sa sistema nakadawat usa ka input sa daghang mga datos, ug sa usa ka punto kini makahimo sa pag-ila sa mga sumbanan gikan sa kana nga datos. Ang katapusan nga katuyoan niini nga proseso mao ang paghimo sa kini nga mga sistema sa kompyuter nga makakat-on nga independente, nga wala kinahanglana ang bisan unsang interbensyon sa tawo o tabang.
Ang laing butang nga hinungdanon kaayo nga hisgutan kauban ang pagkat-on sa makina mao ang lawom nga pagkat-on. Usa sa labing hinungdanon nga himan sa proseso sa lawom nga pagkat-on mao ang gitawag nga artipisyal nga neural network. Sila mga advanced algorithm, susama sa istruktura ug gimbuhaton sa utok sa tawo. Bisan pa, sila static ug simbolo, dili sama sa biolohikal nga utok nga plastik ug labi ka analogue. Sa laktud, kining lawom nga pagkat-on usa ka espesyal kaayo nga paagi sa pagkat-on sa makina, panguna nga gibase sa mga artipisyal nga neural network. Ang tumong sa lawom nga pagkat-on mao ang hugot nga pagsundog sa mga proseso sa pagkat-on sa tawo. Ang lawom nga teknolohiya sa pagkat-on mapuslanon kaayo, ug kini adunay hinungdanon nga papel sa lainlaing mga aparato nga kontrolado sa tingog - mga tablet, TV, smartphone, fridge ug uban pa. Ang mga artipisyal nga neural network gigamit usab ingon usa ka matang sa sistema sa pagsala nga nagtumong sa pagtagna sa mga butang nga paliton sa tiggamit sa umaabot. Ang lawom nga teknolohiya sa pagkat-on kaylap usab nga gigamit sa natad sa medisina. Importante kaayo kini sa mga tigdukiduki sa kanser, tungod kay makatabang kini nga awtomatik nga makit-an ang mga selula sa kanser.
Karon kita mobalik sa speech recognition. Kini nga teknolohiya, sama sa among nahisgotan na, nagtumong sa pag-ila sa lain-laing mga pulong ug hugpong sa mga pulong sa sinultihan nga pinulongan. Pagkahuman gibag-o kini sa usa ka format nga mabasa sa makina. Ang sukaranan nga mga programa nag-ila lamang sa gamay nga gidaghanon sa yawe nga mga hugpong sa mga pulong, apan ang uban nga mas abante nga software sa pag-ila sa sinultihan makahimo sa paghubad sa tanang matang sa natural nga sinultihan. Ang teknolohiya sa pag-ila sa sinultihan sayon sa kadaghanan sa mga kaso, apan usahay makasugat kini og mga problema kung ang kalidad sa pagrekord dili maayo o kung adunay mga kasaba sa background nga makapalisud sa pagsabut sa mamumulong sa husto. Mahimo usab nga makasugat og pipila ka mga problema kung ang mamumulong adunay kusog nga accent o usa ka dialekto. Ang pag-ila sa sinultihan kanunay nga nag-uswag, apan kini dili pa hingpit. Dili ang tanan mahitungod sa mga pulong, ang mga makina dili gihapon makahimo sa daghang mga butang nga mahimo sa tawo, pananglitan dili sila makahimo sa paghubad sa pinulongan sa lawas o sa tono sa tingog sa usa ka tawo. Bisan pa, tungod kay daghang mga datos ang gihubad sa kini nga mga advanced nga algorithm, ang pipila niini nga mga hagit ingon og mikunhod ang kalisud. Kinsay nahibalo kon unsay mahitabo sa umaabot? Lisud matagna kung asa matapos ang speech recognition. Pananglitan, ang Google daghan na nga nagmalampuson sa pag-implementar sa speech recognition software sa Google Translate nga mga makina, ug ang makina padayon nga nagkat-on ug nag-uswag. Tingali usa ka adlaw ilang pulihan sa hingpit ang tawhanong mga maghuhubad. O tingali dili, ang adlaw-adlaw nga mga sitwasyon sa pagsulti komplikado kaayo alang sa bisan unsang matang sa makina nga dili makabasa sa giladmon sa kalag sa tawo.
Kanus-a gamiton ang speech recognition?
Karon halos tanan adunay smartphone o tablet. Ang pag-ila sa sinultihan usa ka sagad nga bahin sa mga aparato. Gigamit kini aron mabag-o ang sinultihan sa usa ka tawo ngadto sa aksyon. Kung gusto nimong tawagan ang imong lola, igo na nga mosugo ka sa "tawagan si Lola" ug ang imong smartphone nag-dial na sa numero nga wala nimo kinahanglana nga mag-type sa imong mga lista sa kontak. Kini ang speech recognition. Ang laing maayong pananglitan niini, mao si Alexa o Siri. Naa usab nila kini nga bahin nga hard-wired sa ilang sistema. Gihatagan ka usab sa Google og kapilian sa pagpangita sa bisan unsang butang pinaagi sa tingog, nga wala mag-type sa bisan unsang butang.
Tingali nakuryoso ka karon kon sa unsang paagi kining tanan molihok. Aw, aron kini molihok, ang mga sensor sama sa mga mikropono kinahanglan nga itukod sa software aron ang mga sound wave sa gisulti nga mga pulong mailhan, analisahon ug mabag-o sa digital nga format. Ang digital nga impormasyon unya kinahanglan nga itandi sa ubang mga impormasyon nga gitipigan sa usa ka matang sa mga pulong ug mga ekspresyon repository. Kung adunay usa ka tugma ang software makaila sa mando ug molihok sumala niana.
Usa pa ka butang nga kinahanglan nga hisgutan sa kini nga punto mao ang gitawag nga WER (word error rate). Kini usa ka pormula diin imong gibahin ang numero sa sayup sa kinatibuk-an nga mga pulong. Busa, sa pagbutang niini sa yano nga mga termino, kini adunay daghang kalabotan sa katukma. Ang tumong mao ang siyempre nga adunay ubos nga WER, tungod kay kini nagpasabot nga ang transkripsyon sa gisulti nga pulong mas tukma.
Ang pag-ila sa sinultihan gikinahanglan na karon. Kung kinahanglan nimo usab nga i-convert ang gisulti nga pulong gikan sa pag-ingon nga usa ka narekord nga audio file ngadto sa teksto, mahimo kang modangop sa Gglot. Kami usa ka tighatag sa serbisyo sa transkripsyon nga nagtanyag tukma nga mga transkrip alang sa patas nga presyo. Busa, ayaw pagpanuko sa pagkontak pinaagi sa among user-friendly nga website.