Cad é go díreach Aitheantas Cainte?

Aitheantas cainte

Cad is gá duit a bheith ar an eolas faoi aithint cainte

Nuair a bhíonn muid ag caint faoi aithint cainte, is éard atá i gceist againn go hiondúil bogearraí a bhfuil ar a gcumas an focal labhartha a aithint agus é a scríobh síos i gclár ionas go mbeidh gach rud a labhraítear i bhfoirm scríofa agat sa deireadh. Tugtar “óráid go téacs” air go minic freisin. Ar dtús, bhí féidearthachtaí an-teoranta ag bogearraí, ionas nach mbeifeá in ann ach líon teoranta frásaí a thiontú. Le himeacht ama, tá an teicneolaíocht taobh thiar de bhogearraí aitheantais cainte forbartha go leor agus tá sé i bhfad níos sofaisticiúla anois, ionas gur féidir leis teangacha éagsúla agus fiú variant éagsúla a aithint. Ach ar ndóigh, tá obair fós le déanamh sa réimse seo.

Tá sé tábhachtach a thabhairt faoi deara freisin nach ionann aithint cainte agus aithint gutha, cé go n-úsáideann daoine uaireanta an dá théarma don rud céanna. Baintear úsáid as aithint gutha chun an duine atá ag labhairt a aithint agus ní chun an méid a bhí á rá a thabhairt faoi deara.

Tá stair ghairid ar aithint cainte agus ar theicneolaíocht ghaolmhar

San Airteagal seo, míneoimid go hachomair an stair agus an teicneolaíocht atá taobh thiar den ardú ar aitheantas cainte.

Ó thús na haoise digití, bhí fonn ar dhaoine a bheith in ann cumarsáid a dhéanamh le meaisíní ar bhealach éigin. Tar éis an chéad chineál ríomhaire digiteach a chumadh, rinne go leor eolaithe agus innealtóirí iarracht ar bhealaí éagsúla aitheantas cainte a chur i bhfeidhm ar bhealach éigin sa phróiseas seo. Bliain ríthábhachtach den phróiseas seo ba ea 1962, nuair a nocht IBM Shoebox, meaisín aitheantais cainte bunúsach a bhí in ann ríomhaireachtaí simplí matamaitice a dhéanamh. Má labhair úsáideoir an ríomhaire proto-ríomhaire seo isteach i micreafón, bhí an meaisín seo in ann suas le sé fhocal rialaithe cosúil le “plus” nó “lúide” a aithint. Le himeacht ama, d'fhorbair an teicneolaíocht taobh thiar de seo agus inniu is gné an-choitianta é idirghníomhú le ríomhairí trí ghuth. Tá go leor innill aitheanta cainte cáiliúla cosúil le Siri nó Alexa. Tá sé tábhachtach a thabhairt faoi deara go bhfuil na gléasanna gutha-tiomáinte seo ag brath ar intleacht shaorga (AI) agus foghlaim meaisín.

Nuair a luaitear intleacht shaorga (AI), d'fhéadfadh sé a bheith cosúil le rud éigin ó scannán ficsean eolaíochta, ach is é an fhírinne go bhfuil ról mór ag AI sa lá atá inniu ann agus in aois an lae inniu. Go deimhin, tá AI an-láthair cheana féin inár saol laethúil, ós rud é go n-úsáideann go leor cláir agus apps é cheana féin. Ach ficsean eolaíochta a bhí ann ag tús an 20ú haois, nuair a tháinig an téarma chun cinn. I ndeireadh na 1950í d’éirigh coincheapa AI níos suntasaí agus bhí go leor eolaithe agus fealsúna mar ábhar spéise acu. San am sin, tháinig matamaiticeoir Briotánach an-uaillmhianach darbh ainm Alan Turing suas le moladh gur féidir le meaisíní fadhbanna a réiteach agus cinntí a dhéanamh leo féin, bunaithe ar ionchur na faisnéise atá ar fáil. Ba í an fhadhb a bhí ann nach raibh an fhéidearthacht ag ríomhairí fós na sonraí sin a chur de ghlanmheabhair, rud atá ina chéim ríthábhachtach d'fhorbairt na hintleachta saorga. Is é an rud a d'fhéadfadh siad a dhéanamh ar ais ansin ná orduithe simplí a fhorghníomhú.

Ainm tábhachtach eile i bhforbairt AI ná John McCarthy, a chum an téarma “intleacht shaorga” den chéad uair. Dúirt McCarthy gurb é AI: “an eolaíocht agus an innealtóireacht a bhaineann le meaisíní cliste a dhéanamh”. Tháinig an sainmhíniú seo chun solais ag comhdháil cheannródaíoch i gColáiste Dartmouth i 1956. As sin amach thosaigh AI ag forbairt ag luas frantic.

Sa lá atá inniu ann, tá hintleachta saorga ina bhfoirm éagsúla i láthair i ngach áit. D'fhás sé go dtí olluchtú, go príomha mar gheall ar mhéadú ar mhéid iomlán na sonraí a mhalartaítear ar fud an domhain gach lá. Úsáidtear é i halgartaim chun cinn, agus tháinig feabhsuithe ar chumhacht stórála agus ríomhaireachta dá bharr. Úsáidtear AI chun críocha go leor, mar shampla aistriúchán, trascríobh, urlabhra, aithint aghaidh agus réad, anailís ar íomhánna leighis, próiseáil teangacha nádúrtha, scagairí líonra sóisialta éagsúla agus mar sin de. Cuimhnigh go bhfuil cluiche fichille idir an grandmaster Gari Kasparov agus Deep Blue fichille AI?

Gan teideal 7 1

Feidhm an-tábhachtach eile a bhaineann le hintleacht shaorga is ea foghlaim meaisín. I mbeagán focal, tagraíonn sé d’aon chórais a bhfuil an cumas acu foghlaim agus feabhsú ón mbunachar sonraí dá dtaithí féin. Oibríonn sé seo trí phatrúin a aithint. Chun é sin a dhéanamh ní mór don chóras a bheith in ann a bheith oilte. Faigheann algartam an chórais ionchur de mhéideanna móra sonraí, agus ag pointe amháin bíonn sé in ann patrúin a aithint ó na sonraí sin. Is é sprioc deiridh an phróisis seo ná cur ar chumas na gcóras ríomhaireachta seo foghlaim go neamhspleách, gan gá le haon idirghabháil ná cúnamh daonna.

Rud eile atá an-tábhachtach a lua taobh le meaisínfhoghlama ná foghlaim dhomhain. Ar cheann de na huirlisí is tábhachtaí i bpróiseas na foghlama domhain tá na líonraí néaracha saorga mar a thugtar orthu. Is halgartaim chun cinn iad, atá cosúil le struchtúr agus feidhm na hinchinne daonna. Mar sin féin, tá siad statach agus siombalach, murab ionann agus inchinn bhitheolaíoch atá bunaithe ar phlaisteach agus níos analógach. I mbeagán focal, is modh foghlama meaisín an-speisialaithe an fhoghlaim dhomhain seo, bunaithe go príomha ar líonraí néaracha saorga. Is é sprioc na foghlama domhain ná próisis foghlama daonna a mhacasamhlú go dlúth. Tá teicneolaíocht domhainfhoghlama an-úsáideach, agus imríonn sé ról tábhachtach i bhfeistí éagsúla atá á rialú ag an nguth – táibléad, teilifíseáin, fóin chliste, cuisneoirí srl. go gceannódh an t-úsáideoir sa todhchaí. Úsáidtear teicneolaíocht domhainfhoghlama go forleathan i réimse an leighis freisin. Tá sé an-tábhachtach do thaighdeoirí ailse, toisc go gcabhraíonn sé le cealla ailse a bhrath go huathoibríoch.

Anois tiocfaimid ar ais chuig aithint cainte. Tá sé mar aidhm ag an teicneolaíocht seo, mar a luadh muid cheana, focail agus frásaí éagsúla den teanga labhartha a aithint. Ina dhiaidh sin athraíonn sé iad go formáid a bhfuil an meaisín in ann a léamh. Ní shainaithníonn cláir bhunúsacha ach líon beag eochairfhrásaí, ach tá roinnt bogearraí aitheanta cainte níos forbartha in ann gach cineál cainte nádúrtha a thuiscint. Tá teicneolaíocht aitheantais cainte áisiúil i bhformhór na gcásanna, ach bíonn fadhbanna ann uaireanta nuair nach bhfuil cáilíocht an taifeadta maith go leor nó nuair a bhíonn torann cúlra ann a fhágann go bhfuil sé deacair an cainteoir a thuiscint i gceart. D’fhéadfadh sé teacht ar roinnt fadhbanna freisin nuair a bhíonn blas láidir nó canúint ag an gcainteoir. Tá aitheantas cainte ag forbairt i gcónaí, ach níl sé fós foirfe go leor. Ní bhaineann gach rud le focail, níl meaisíní fós in ann go leor rudaí is féidir le daoine a dhéanamh, mar shampla níl siad in ann teanga choirp nó tuin ghutha duine a thuiscint. Mar sin féin, de réir mar a dhíscaoileann na hardalgartaim seo níos mó sonraí, tá an chuma ar an scéal go bhfuil deacrachtaí ag baint le roinnt de na dúshláin seo. Cé a fhios cad a thabharfaidh an todhchaí? Tá sé deacair a thuar cá gcríochnóidh an t-aitheantas cainte. Mar shampla, tá an-rath ar Google cheana féin maidir le bogearraí aitheantais cainte a chur i bhfeidhm in innill Google Translate, agus tá an meaisín ag foghlaim agus ag forbairt i gcónaí. B'fhéidir lá amháin go dtiocfaidh siad in ionad aistritheoirí daonna go hiomlán. Nó b'fhéidir nach bhfuil, tá cásanna cainte laethúla ró-chasta d'aon chineál meaisín nach bhfuil in ann doimhneacht anam an duine a léamh.

Cathain is ceart aithint cainte a úsáid?

Sa lá atá inniu ann tá fón cliste nó táibléad ag beagnach gach duine. Gné choitianta sna gléasanna sin is ea aithint cainte. Úsáidtear iad chun urlabhra duine a thiontú ina gníomh. Más mian leat glaoch a chur ar do sheanmháthair, is leor go n-ordaíonn tú “glaoch ar Mamó” agus tá an uimhir á dhiailiú ag d’fhón cliste cheana féin gan ort do liostaí teagmhála a chlóscríobh. Aitheantas cainte é seo. Sampla maith eile de, is ea Alexa nó Siri. Tá an ghné seo fite fuaite ina gcóras freisin. Tugann Google an rogha duit freisin cuardach a dhéanamh ar rud ar bith trí ghuth, gan aon rud a chlóscríobh.

Gan teideal 8 1

B'fhéidir go bhfuil tú fiosrach anois faoi conas a oibríonn sé seo ar fad. Bhuel, le go n-oibreoidh sé, ní mór braiteoirí cosúil le micreafóin a chur isteach sna bogearraí chun tonnta fuaime na bhfocal labhartha a aithint, a anailísiú agus a thiontú go formáid dhigiteach. Ní mór an fhaisnéis dhigiteach a chur i gcomparáid le faisnéis eile a stóráiltear i stór focal agus nathanna cainte de shaghas éigin. Nuair a bhíonn cluiche ann is féidir leis na bogearraí an t-ordú a aithint agus gníomhú dá réir.

Rud amháin eile nach mór a lua ag an bpointe seo ná an WER (ráta earráide focal). Is foirmle í seo ina roinneann tú an uimhir earráide le iomlán na bhfocal. Mar sin, chun é a chur i dtéarmaí simplí, tá go leor le déanamh aige le cruinneas. Is é an sprioc ar ndóigh ná WER íseal a bheith ann, mar ciallaíonn sé seo go bhfuil tras-scríobh an fhocail labhartha níos cruinne.

Tá éileamh ar aitheantas cainte anois chomh mór agus a bhí riamh. Más gá duit an focal labhartha a thiontú ó chomhad fuaime taifeadta go téacs, is féidir leat dul go Gglot. Is soláthraí seirbhíse trascríobh muid a thairgeann tras-scríbhinní cruinne ar phraghas cothrom. Mar sin, ná bíodh leisce ort teagmháil a dhéanamh tríd ár suíomh Gréasáin atá éasca le húsáid.