Ang Tungkulin ng Artificial Intelligence at Machine Learning sa Speech Recognition

Tungkulin ng Artificial Intelligence at Machine Learning sa Speech Recognition

Sa loob ng mahabang panahon, nais ng mga tao na makausap ang mga makina. Mula noong nagsimula silang bumuo ng mga computer, sinubukan ng siyentipiko at mga inhinyero na isama ang pagkilala sa pagsasalita sa proseso. Noong taong 1962, ipinakilala ng IBM ang Shoebox, isang speech recognition machine na maaaring gumawa ng mga simpleng kalkulasyon sa matematika. Kinikilala at tumugon ang makabagong device na ito sa 16 na binibigkas na salita, kabilang ang sampung digit mula sa "0" hanggang "9." Kapag ang isang numero at mga command na salita tulad ng "plus," "minus" at "kabuuan" ay binigkas, ang Shoebox ay nag-utos sa isang makina ng pagdaragdag upang kalkulahin at i-print ang mga sagot sa mga simpleng problema sa aritmetika. Ang shoebox ay pinaandar sa pamamagitan ng pagsasalita sa isang mikropono, na nag-convert ng mga tunog ng boses sa mga electrical impulses. Inuri ng isang pangsukat na circuit ang mga impulses na ito ayon sa iba't ibang uri ng mga tunog at isinaaktibo ang nakakabit na makina sa pamamagitan ng isang relay system.

Sa paglipas ng panahon, nabuo ang teknolohiyang ito at ngayon marami sa atin ang regular na nakikipag-ugnayan sa mga computer sa pamamagitan ng boses. Ang pinakasikat na voice assistant ngayon ay ang Alexa ng Amazon, Siri ng Apple, Google Assistant at Cortana ng Microsoft. Ang mga katulong na ito ay maaaring magsagawa ng mga gawain o serbisyo para sa isang indibidwal batay sa mga utos o tanong. Nagagawa nilang bigyang-kahulugan ang pagsasalita ng tao at tumugon sa pamamagitan ng mga synthesized na boses. Maaaring magtanong ang mga user sa kanilang mga katulong, kontrolin ang mga device sa home automation at pag-playback ng media sa pamamagitan ng boses, at pamahalaan ang iba pang pangunahing gawain gaya ng email, mga listahan ng gagawin, at mga kalendaryo na may mga verbal na utos. nakadepende sa artificial intelligence (AI) at machine learning.

Artificial intelligence (AI)

1

Kapag sinabi mong artificial intelligence (AI), maraming tao ang maaaring mag-isip na pinag-uusapan mo ang tungkol sa science fiction, kahit na napaka-embed ng AI sa ating pang-araw-araw na buhay. Sa katunayan, ito ay para sa mga dekada. Ngunit ang katotohanan ay, ito ay talagang science fiction na sa simula ng ika-20 siglo ay naging pamilyar sa publiko sa mga artipisyal na matalinong tulad ng mga robot. Noong 50s, ang mga konsepto ng AI ay dumating nang higit pa sa pokus ng interes ng mga siyentipiko at pilosopo. Noong panahong iyon, iminungkahi ng batang British mathematician na si Alan Turing na walang dahilan kung bakit hindi kayang lutasin ng mga makina (tulad ng mga tao) ang mga problema at gumawa ng mga desisyon batay sa magagamit na impormasyon. Ngunit sa panahong iyon, ang mga computer ay walang posibilidad na magsaulo na siyang susi para sa katalinuhan. Ang ginawa lang nila ay execute commands. Ngunit gayon pa man, si Alan Turing ang nagtatag ng pangunahing layunin at pananaw ng artificial intelligence.

Malawakang kinikilala bilang ama ng AI si John McCarthy na lumikha ng terminong artificial intelligence . Para sa kanya ang AI ay: "ang agham at engineering ng paggawa ng mga matatalinong makina". Ang kahulugan na ito ay iniharap sa isang kumperensya sa Dartmouth College noong 1956 at ipinahiwatig nito ang simula ng pananaliksik sa AI. Mula noon ay umunlad ang AI.

Sa modernong mundo, ang artificial intelligence ay nasa lahat ng dako. Ito ay naging mas sikat dahil sa tumaas na dami ng data, mga advanced na algorithm, at mga pagpapahusay sa computing power at storage. Karamihan sa AI application ay konektado sa mga intelektwal na gawain. Gumagamit kami ng AI para sa pagsasalin, object, face at speech recognition, pagtuklas ng paksa, pagsusuri ng medikal na imahe, pagproseso ng natural na wika, pag-filter ng social network, paglalaro ng chess atbp.

Pag-aaral ng makina

Ang machine learning ay isang application ng artificial intelligence at ito ay tumutukoy sa mga system na may kakayahang umunlad mula sa kanilang sariling karanasan. Ang pinakamahalagang bagay dito ay kailangang malaman ng system kung paano makilala ang mga pattern. Upang magawa iyon, kailangang sanayin ang system: ang algorithm ay nagpapakain ng malalaking halaga ng data upang sa isang punto ay nagagawa nitong matukoy ang mga pattern. Ang layunin ay payagan ang mga computer na awtomatikong matuto nang walang interbensyon o tulong ng tao.

Kapag pinag-uusapan ang tungkol sa machine learning, mahalagang banggitin ang malalim na pag-aaral. Magsimula tayo sa pagsasabing ang isa sa mga pangunahing tool na ginagamit sa malalim na pag-aaral ay ang mga artipisyal na neural network. Iyon ay mga algorithm na inspirasyon ng istraktura at pag-andar ng utak, kahit na sila ay may posibilidad na maging static at simboliko, at hindi plastik at analog tulad ng biological na utak. Kaya, ang malalim na pag-aaral ay isang espesyal na paraan ng pag-aaral ng makina batay sa artipisyal na neural network na ang layunin ay upang kopyahin ang paraan ng pagkatuto ng mga tao at ito ay nagsisilbing isang mahusay na tool upang makahanap ng mga pattern na napakarami para sa isang programmer na magturo sa makina. Sa nakalipas na dalawang taon, maraming pinag-uusapan ang tungkol sa mga walang driver na sasakyan at kung paano nito mababago ang ating buhay. Ang malalim na teknolohiya sa pag-aaral ay ang susi dito, dahil binabawasan nito ang mga aksidente sa pamamagitan ng pagpapagana ng kotse na makilala ang isang pedestrian mula sa isang fire hydrant o makilala ang isang pulang ilaw. Ang teknolohiya ng malalim na pag-aaral ay gumaganap din ng pangunahing papel sa kontrol ng boses sa mga device tulad ng mga tablet, telepono, refrigerator, TV atbp. Ang mga kumpanya ng e-commerce ay kadalasang gumagamit ng mga artipisyal na neural network bilang isang sistema ng pag-filter na sumusubok na hulaan at ipakita ang mga item na gustong gawin ng isang user. bumili. Ang teknolohiya ng malalim na pag-aaral ay ginagamit din sa larangang medikal. Tinutulungan nito ang mga mananaliksik ng kanser na awtomatikong makita ang mga selula ng kanser at sa gayon ay kumakatawan sa isang napakalaking pag-unlad sa paggamot sa kanser.

Pagkilala sa pagsasalita

Ang teknolohiya sa pagkilala sa pagsasalita ay nagsisilbing tukuyin ang mga salita at parirala na bumubuo sa sinasalitang wika at i-convert ang mga ito sa isang nababasang format para sa makina. Habang ang ilang mga programa ay maaari lamang tumukoy ng isang limitadong bilang ng mga parirala, ang ilang mga mas sopistikadong programa sa pagkilala sa pagsasalita ay maaaring matukoy ang natural na pananalita.

Mayroon bang mga hadlang na dapat lagpasan?

Bagama't maginhawa, ang teknolohiya sa pagkilala sa pagsasalita ay hindi palaging tumatakbo nang maayos at mayroon pa itong ilang mga isyu na dapat lutasin, dahil ito ay patuloy na binuo. Ang mga problemang maaaring lumitaw ay maaaring kabilang sa iba pa ang mga sumusunod: ang kalidad ng pag-record ay maaaring hindi sapat, maaaring may mga ingay sa background na nagpapahirap sa pag-unawa sa nagsasalita, pati na rin ang nagsasalita ay maaaring magkaroon ng isang malakas na accent o diyalekto (ikaw ba ay narinig mo na ba ang diyalektong Geordie?), atbp.

Ang pagkilala sa pagsasalita ay napakarami na, ngunit malayo pa rin ito sa pagiging perpekto. Hindi lahat ay tungkol lamang sa mga salita, hindi pa rin nagagawa ng makina ang maraming bagay na kaya ng mga tao: hindi nila nababasa ang wika ng katawan o nakikilala ang sarkastikong tono sa boses ng isang tao. Ang mga tao ay madalas na hindi binibigkas ang bawat salita sa tamang paraan at sila ay may posibilidad na paikliin ang ilang mga salita. Halimbawa, kapag mabilis at impormal ang pagsasalita, ang mga katutubong nagsasalita ng Ingles ay madalas na binibigkas ang "pupunta sa" tulad ng "gonna." Ang lahat ng nasa itaas, ay nagiging sanhi ng mga hadlang para sa mga makina na sinusubukan nilang malampasan, ngunit mayroon pa ring mahabang paraan sa harap nila. Mahalagang i-highlight iyon habang dumarami ang data na pinapakain sa mga partikular na algorithm na iyon; ang mga hamon ay tila nababawasan. Mukhang maliwanag ang hinaharap ng awtomatikong pagkilala sa pagsasalita.

Ang mga user interface na pinapagana ng boses ay lalong nagiging available at popular sa mga sambahayan. Maaari pa itong maging ANG susunod na plataporma sa teknolohiya.

Nag-aalok ang Gglot ng automated na speech recognition sa anyo ng mga automated na serbisyo ng transkripsyon – kino-convert namin ang mga speech sa text. Ang aming serbisyo ay madaling gamitin, hindi ka gaanong gagastusin at ito ay gagawin nang mabilis!