Menene ainihin Gane Magana?

Gane magana

Abin da kuke buƙatar sani game da fahimtar magana

Lokacin da muke magana game da fahimtar magana, yawanci muna nufin software ce da ke da ikon gane kalmar magana da rubuta ta a cikin shirin don haka a ƙarshe kuna da duk abin da aka faɗa a rubuce. Har ila yau, ana kiransa da "magana-zuwa-rubutu". A farkon wannan software yana da iyakataccen damar, ta yadda za ku iya jujjuya iyakacin adadin jimloli. Tare da lokaci, fasahar da ke tattare da software na tantance magana ta haɓaka da yawa kuma a yanzu ta fi ƙwarewa, ta yadda za ta iya gane harsuna daban-daban har ma da lafuzza daban-daban. Amma tabbas akwai sauran aiki da ya kamata a yi a wannan fanni.

Yana da mahimmanci a lura cewa fahimtar magana baya ɗaya da tantance murya, kodayake wasu lokuta mutane suna amfani da kalmomin biyu don abu ɗaya. Ana amfani da tantance murya don tantance mutumin da ke magana ba don lura da abin da ake faɗa ba.

Takaitaccen tarihin gane magana da fasaha mai alaƙa

A cikin wannan labarin, za mu yi bayani a taƙaice game da tarihi da fasahar da ke tattare da haɓaka fahimtar magana.

Tun daga farkon wayewar zamani na dijital, mutane suna da sha'awar ko ta yaya su sami damar sadarwa da injuna. Bayan da aka ƙirƙiro nau'in kwamfuta ta farko ta dijital, masana kimiyya da injiniyoyi da yawa sun yi ƙoƙari ta hanyoyi daban-daban don aiwatar da fahimtar magana cikin wannan tsari. Shekara mai mahimmanci na wannan tsari ita ce 1962, lokacin da IBM ya bayyana Shoebox, na'ura mai gane magana mai mahimmanci wanda ya iya yin lissafin lissafi mai sauƙi. Idan mai amfani da wannan na'ura mai kwakwalwa ya yi magana a cikin makirufo, wannan na'ura ta iya gane kalmomin sarrafawa har guda shida kamar "da" ko "raguwa". A tsawon lokaci, fasahar da ke bayan wannan ta haɓaka kuma a yau abu ne na kowa don mu'amala da kwamfutoci ta hanyar murya. Akwai shahararrun injunan gane magana kamar Siri ko Alexa. Yana da mahimmanci a lura cewa waɗannan na'urorin da ke motsa murya sun dogara da basirar wucin gadi (AI) da koyan na'ura.

Lokacin da aka ambaci hankali na wucin gadi (AI), yana iya zama kamar wani abu daga fim ɗin almara na kimiyya, amma gaskiyar ita ce a zamanin yau AI yana taka rawa sosai a duniyarmu. A gaskiya ma, AI ya riga ya kasance a cikin rayuwarmu ta yau da kullum, tun da yawancin shirye-shirye da apps sun riga sun yi amfani da shi. Amma almarar kimiyya ce a farkon karni na 20, lokacin da kalmar ta bayyana. A ƙarshen 1950 ra'ayoyin AI sun zama mafi shahara kuma shine abin da masana kimiyya da masana falsafa da yawa suka mayar da hankali kan sha'awar. A wancan lokacin, wani masanin lissafi dan kasar Burtaniya mai suna Alan Turing ya fito da wata shawara cewa injuna za su iya magance matsaloli da kuma yanke shawara da kansu, bisa shigar da bayanan da ake da su. Matsalar ita ce har yanzu kwamfutoci ba su da yuwuwar haddar wannan bayanan, wanda wani muhimmin mataki ne na bunkasa fasahar kere-kere. Duk abin da za su iya yi a lokacin shine aiwatar da umarni masu sauƙi.

Wani muhimmin suna a cikin ci gaban AI shine John McCarthy, wanda ya fara ƙirƙirar ainihin kalmar "hankali na wucin gadi". McCarthy ya bayyana cewa AI shine: "kimiyya da injiniya na kera injuna masu hankali". Wannan ma'anar ta fito ne a wani taro na seminal a Kwalejin Dartmouth a 1956. Daga nan AI ya fara haɓaka cikin sauri.

A yau, fasaha na wucin gadi a cikin nau'i daban-daban yana samuwa a ko'ina. Ya girma har zuwa karɓowar jama'a, musamman saboda haɓaka yawan adadin bayanan da ake musayar a duniya kowace rana. Ana amfani da shi a cikin manyan algorithms, kuma ya haifar da haɓakawa a cikin ajiya da ikon sarrafa kwamfuta. Ana amfani da AI don dalilai da yawa, alal misali fassarar, kwafi, magana, sanin fuska da abu, nazarin hotunan likita, sarrafa harsunan halitta, matattarar hanyar sadarwar zamantakewa daban-daban da sauransu. Ka tuna cewa wasan dara tsakanin grandmaster Gari Kasparov da Deep Blue Chess AI?

Mai taken 71

Koyon inji wani muhimmin aikace-aikacen basirar wucin gadi ne. A taƙaice, yana nufin duk wani tsarin da ke da ikon koyo da haɓakawa daga bayanan bayanan abubuwan da suka samu. Wannan yana aiki ta hanyar gane alamu. Don tsarin yin hakan yana buƙatar samun damar horarwa. Algorithm na tsarin yana karɓar shigarwar bayanai masu yawa, kuma a wani lokaci ya zama mai iya gano alamu daga wannan bayanan. Ƙarshen manufar wannan tsari ita ce ba wa waɗannan na'urorin kwamfuta damar koyo da kansu, ba tare da buƙatar wani sa hannun mutum ko taimako ba.

Wani abu da ke da matukar mahimmanci a ambata tare da koyon injin shine zurfin ilmantarwa. Ɗaya daga cikin mahimman kayan aiki a cikin tsarin ilmantarwa mai zurfi shine abin da ake kira cibiyoyin sadarwa na wucin gadi. Algorithms ne na ci gaba, kama da tsari da aikin kwakwalwar ɗan adam. Duk da haka, su a tsaye ne kuma na alama, sabanin kwakwalwar halittu wanda ke da filastik kuma mafi tushen analog. A takaice, wannan zurfafan koyo wani salo ne na musamman na koyon injin, da farko bisa hanyoyin sadarwa na wucin gadi. Manufar zurfafa ilmantarwa ita ce a kwaikwayi tsarin ilmantarwa na ɗan adam. Fasahar ilmantarwa mai zurfi tana da amfani sosai, kuma tana taka muhimmiyar rawa a cikin na'urori daban-daban waɗanda muryar ke sarrafa su - tablets, TVs, smart phones, fridges da dai sauransu. Hakanan ana amfani da hanyoyin sadarwa na wucin gadi a matsayin tsarin tacewa wanda ke nufin hasashen abubuwan. wanda mai amfani zai saya a nan gaba. Hakanan ana amfani da fasahar koyo mai zurfi sosai a fannin likitanci. Yana da matukar muhimmanci ga masu binciken ciwon daji, domin yana taimakawa wajen gano kwayoyin cutar kansa ta atomatik.

Yanzu za mu dawo ga fahimtar magana. Wannan fasaha, kamar yadda muka ambata a baya, yana da nufin gano kalmomi da jimloli daban-daban na harshen magana. Bayan haka yana mayar da su zuwa tsarin da injin ke iya karantawa. Shirye-shirye na asali kawai suna gano ƙananan jimlolin maɓalli ne kawai, amma wasu ƙarin software na gane magana na ci gaba suna iya tantance kowane nau'in magana na zahiri. Fasahar tantance magana ta dace a mafi yawan lokuta, amma a wasu lokuta takan fuskanci matsaloli lokacin da ingancin rikodin bai yi kyau ba ko kuma lokacin da surutai na baya-bayan nan ke haifar da wahalar fahimtar mai magana da kyau. Har ila yau yana iya fuskantar wasu matsaloli yayin da mai magana yana da babban lafazi ko yare. Ƙimar magana yana haɓaka koyaushe, amma har yanzu bai cika cika ba. Ba komai ya shafi kalmomi ba, injuna har yanzu ba su iya yin abubuwa da yawa da mutane za su iya yi, misali ba sa iya tantance harshen jiki ko sautin muryar wani. Duk da haka, yayin da ƙarin bayanai ke warwarewa ta waɗannan ci-gaba na Algorithms, wasu daga cikin waɗannan ƙalubalen suna da alama suna raguwa cikin wahala. Wanene ya san abin da zai faru nan gaba? Yana da wuya a iya hasashen inda tantancewar magana zai ƙare. Misali, Google ya riga ya sami nasara mai yawa wajen aiwatar da software na tantance magana a cikin injunan Google Translate, kuma injin yana ci gaba da koyo da haɓakawa. Wataƙila wata rana za su maye gurbin masu fassarar mutane gaba ɗaya. Ko watakila a'a, yanayin maganganun yau da kullun yana da rikitarwa ga kowane nau'in injin da ba zai iya karanta zurfin ruhin ɗan adam ba.

Lokacin amfani da gane magana?

A zamanin yau kusan kowa yana da wayar hannu ko kwamfutar hannu. Gane magana siffa ce ta gama gari a waɗannan na'urorin. Ana amfani da su don canza magana ta mutum zuwa aiki. Idan kana so ka kira kakarka, ya isa ka ba da umarnin "kira Grandma" kuma wayar salularka ta riga ta buga lambar ba tare da ka rubuta ta jerin sunayenka ba. Wannan shine gane magana. Wani kyakkyawan misali na shi, shine Alexa ko Siri. Hakanan suna da wannan siffa mai ƙarfi a cikin tsarin su. Google kuma yana ba ku zaɓi don bincika komai ta hanyar murya, ba tare da buga komai ba.

Mai taken 81

Wataƙila yanzu kuna sha'awar yadda duk waɗannan ke aiki. To, don yin aiki, dole ne a gina na'urori masu auna firikwensin kamar microphones a cikin software ta yadda za a gane raƙuman sauti na kalmomin da aka faɗa, a bincika su kuma canza su zuwa tsarin dijital. Sa'an nan kuma dole ne a kwatanta bayanan dijital da sauran bayanan da aka adana a cikin wasu nau'ikan kalmomi da ma'ajiyar maganganu. Lokacin da wasa software zata iya gane umarnin kuma tayi aiki daidai.

Wani abu kuma da ya kamata a ambata a wannan lokaci shine abin da ake kira WER (ƙirar kuskuren kalmomi). Wannan dabara ce da zaku raba lambar kuskure tare da jimlar kalmomi. Don haka, don sanya shi cikin sauƙi, yana da alaƙa da yawa tare da daidaito. Manufar ita ce a sami ƙananan WER, saboda wannan yana nufin cewa fassarar kalmar magana ta fi dacewa.

Ana buƙatar gane magana yanzu kamar koyaushe. Idan kuma kuna buƙatar canza kalmar magana daga bari mu faɗi fayil ɗin mai jiwuwa da aka yi rikodi zuwa rubutu, zaku iya juya zuwa Gglot. Mu mai bada sabis ne na kwafi wanda ke ba da ingantattun kwafi akan farashi mai kyau. Don haka, kar a yi jinkirin tuntuɓar mu ta gidan yanar gizon mu mai sauƙin amfani.