Hlutverk gervigreindar og vélanáms í talgreiningu

Hlutverk gervigreindar og vélanáms í talgreiningu

Lengi vel vildi fólk geta talað við vélar. Allt frá því að þeir byrjuðu að smíða tölvur hafa vísindamenn og verkfræðingar reynt að fella talgreiningu inn í ferlið. Árið 1962 kynnti IBM Shoebox, talgreiningarvél sem gat gert einfalda stærðfræðiútreikninga. Þetta nýstárlega tæki þekkti og svaraði 16 töluðum orðum, þar á meðal tíu tölustafi frá „0“ til „9“. Þegar tölu- og skipunarorð eins og „plús“, „mínus“ og „samtals“ voru töluð, gaf Shoebox fyrirmæli um að bæta við vél til að reikna út og prenta svör við einföldum reiknidæmum. Shoebox var stjórnað með því að tala í hljóðnema, sem breytti raddhljóðum í rafboð. Mælirás flokkaði þessar hvatir eftir mismunandi gerðum hljóða og virkjaði meðfylgjandi viðbótarvél í gegnum gengiskerfi.

Með tímanum þróaðist þessi tækni og í dag hafa mörg okkar reglulega samskipti við tölvur með rödd. Vinsælustu raddaðstoðarmennirnir í dag eru Alexa frá Amazon, Siri frá Apple, Google Assistant og Cortana frá Microsoft. Þessir aðstoðarmenn geta framkvæmt verkefni eða þjónustu fyrir einstakling út frá skipunum eða spurningum. Þeir eru færir um að túlka mannlegt tal og bregðast við með tilbúnum röddum. Notendur geta spurt aðstoðarmenn sína spurninga, stjórnað heimilis sjálfvirkum tækjum og fjölmiðlaspilun með rödd og stjórnað öðrum grunnverkefnum eins og tölvupósti, verkefnalistum og dagatölum með munnlegum skipunum. Því meira sem við notum þessi radddrifnu tæki því meira verðum við háð gervigreind (AI) og vélanámi.

Gervigreind (AI)

1

Þegar þú segir gervigreind (AI), gætu margir haldið að þú sért að tala um vísindaskáldskap, jafnvel þó að gervigreind sé mjög innbyggt í daglegu lífi okkar. Það hefur reyndar verið í áratugi. En sannleikurinn er sá að það var svo sannarlega vísindaskáldskapur sem í upphafi 20. aldar kynnti almenningi gervigreind manneskjulík vélmenni. Á fimmta áratugnum komu hugtökin um gervigreind meira og meira í brennidepli vísindamanna og heimspekinga. Á þeim tíma sagði ungi breski stærðfræðingurinn Alan Turing að það væri ekki ástæða fyrir því að vélar gætu ekki (rétt eins og menn) leyst vandamál og tekið ákvarðanir byggðar á tiltækum upplýsingum. En á þeim tíma höfðu tölvur ekki möguleika á að leggja á minnið sem er lykillinn að greind. Það eina sem þeir gerðu var að framkvæma skipanir. En samt var það Alan Turing sem setti grundvallarmarkmið og sýn gervigreindar.

Víða viðurkenndur sem faðir gervigreindar er John McCarthy sem fann upp hugtakið gervigreind . Fyrir honum var gervigreind: „vísindin og verkfræðin við að búa til greindar vélar“. Þessi skilgreining var kynnt á ráðstefnu í Dartmouth College árið 1956 og gaf til kynna upphaf gervigreindarrannsókna. Upp frá því blómstraði gervigreind.

Í nútíma heimi er gervigreind alls staðar. Það hefur orðið vinsælli þökk sé auknu gagnamagni, háþróuðum reikniritum og endurbótum á tölvuorku og geymslu. Aðallega AI forrit er tengt við vitsmunaleg verkefni. Við notum gervigreind til þýðinga, hlut-, andlits- og talgreiningar, efnisgreiningar, læknisfræðilegrar myndgreiningar, náttúrulegrar málvinnslu, síun á samfélagsnetum, skák o.fl.

Vélnám

Vélnám er beiting gervigreindar og það vísar til kerfa sem hafa getu til að bæta sig út frá eigin reynslu. Það mikilvægasta hér er að kerfið þarf að vita hvernig á að þekkja mynstur. Til að geta gert það þarf að þjálfa kerfið: reikniritið er að fæða mikið magn af gögnum svo á einhverjum tímapunkti er hægt að bera kennsl á mynstur. Markmiðið er að leyfa tölvunum að læra sjálfkrafa án mannlegrar íhlutunar eða aðstoðar.

Þegar talað er um vélanám er mikilvægt að nefna djúpt nám. Við skulum byrja á því að segja að eitt helsta verkfærin sem notuð eru í djúpnámi eru gervi tauganet. Þetta eru reiknirit sem eru innblásin af uppbyggingu og starfsemi heilans, jafnvel þó þau hafi tilhneigingu til að vera kyrrstæð og táknræn, en ekki plast og hliðstæð eins og líffræðilegi heilinn. Svo, djúpnám er sérhæft form vélanáms sem byggir á gervi tauganeti sem hefur það að markmiði að endurtaka hvernig menn læra og þetta þjónar sem frábært tæki til að finna mynstur sem eru allt of mörg til að forritari geti kennt vélinni. Undanfarin tvö ár hefur mikið verið rætt um ökumannslausa bíla og hvernig þeir gætu breytt lífi okkar. Djúpnámstækni er lykillinn hér því hún dregur úr slysum með því að gera bílnum kleift að greina gangandi vegfaranda frá brunahana eða þekkja rautt ljós. Djúpnámstækni gegnir einnig aðalhlutverki í raddstýringu í tækjum eins og spjaldtölvum, símum, ísskápum, sjónvörpum osfrv. Rafræn viðskipti nota oft gervi taugakerfi sem síunarkerfi sem reynir að spá fyrir um og sýna hluti sem notandi vill kaupa. Djúpnámstækni er einnig notuð á læknasviði. Það hjálpar krabbameinsfræðingum að greina krabbameinsfrumur sjálfkrafa og táknar því gríðarlega framfarir í krabbameinsmeðferð.

Talgreining

Talgreiningartækni þjónar til að bera kennsl á orð og orðasambönd úr talaða tungumálinu og breyta þeim í læsilegt snið fyrir vélina. Þó að sum forrit geti aðeins borið kennsl á takmarkaðan fjölda orðasambanda, geta sum flóknari talgreiningarforrit leyst náttúrulegt tal.

Eru hindranir til að yfirstíga?

Þó að það sé þægilegt gengur talgreiningartæknin ekki alltaf snurðulaust fyrir sig og hún hefur enn nokkur vandamál sem þarf að vinna í, þar sem hún er stöðugt þróuð. Vandamál sem geta komið upp geta meðal annars verið eftirfarandi: gæði upptökunnar gætu verið ófullnægjandi, það gæti verið hávaði í bakgrunni sem gerir það erfitt að skilja hátalarann, einnig gæti hátalarinn haft mjög sterkan hreim eða mállýsku (varstu einhvern tíma heyrt Geordie mállýskuna?), o.s.frv.

Talgreining hefur þróast töluvert en er samt langt frá því að vera fullkomin. Ekki snýst allt bara um orð, vél getur samt ekki gert marga hluti sem menn geta: þeir geta ekki lesið líkamstjáningu eða þekkt kaldhæðnina í rödd einhvers. Fólk ber oft ekki fram hvert orð á réttan hátt og það hefur tilhneigingu til að stytta sum orð. Til dæmis, þegar þeir tala hratt og óformlega, bera enskumælandi móðurmál oft fram „að fara að“ eins og „ætla“. Allt ofangreint veldur hindrunum fyrir vélar sem þeir eru að reyna að yfirstíga, en enn er langt framundan. Það er mikilvægt að undirstrika að eftir því sem fleiri og fleiri gögn berast til þessara tilteknu reiknirita; áskorunum virðist minnka. Framtíð sjálfvirkrar talgreiningar virðist vera björt.

Raddknúin notendaviðmót verða sífellt aðgengilegri og vinsælli á heimilum. Það gæti jafnvel orðið næsti vettvangur í tækni.

Gglot býður upp á sjálfvirka talgreiningu í formi sjálfvirkrar umritunarþjónustu – við umbreytum ræðum í texta. Þjónustan okkar er einföld í notkun, það mun ekki kosta þig mikið og það verður gert hratt!