Roli i inteligjencës artificiale dhe mësimit të makinës në njohjen e të folurit
Roli i inteligjencës artificiale dhe mësimit të makinës në njohjen e të folurit
Për një kohë të gjatë, njerëzit donin të ishin në gjendje të flisnin me makina. Që kur filluan të ndërtonin kompjuterë, shkencëtarët dhe inxhinierët janë përpjekur të përfshijnë njohjen e të folurit në proces. Në vitin 1962, IBM prezantoi Shoebox, një makinë për njohjen e të folurit që mund të bënte llogaritje të thjeshta matematikore. Kjo pajisje novatore njohu dhe iu përgjigj 16 fjalëve të folura, duke përfshirë dhjetë shifrat nga "0" në "9". Kur thuhej një numër dhe fjalë komanduese si "plus", "minus" dhe "total", Shoebox udhëzoi një makinë shtuese për të llogaritur dhe printuar përgjigjet për problemet e thjeshta aritmetike. Shoebox operohej duke folur në një mikrofon, i cili konvertonte tingujt e zërit në impulse elektrike. Një qark matës i klasifikoi këto impulse sipas llojeve të ndryshme të tingujve dhe aktivizoi makinën shtesë të bashkangjitur përmes një sistemi rele.
Me kalimin e kohës, kjo teknologji u zhvillua dhe sot shumë prej nesh ndërveprojnë në mënyrë rutinore me kompjuterë me zë. Asistentët më të njohur të zërit sot janë Alexa nga Amazon, Siri nga Apple, Google Assistant dhe Cortana nga Microsoft. Këta asistentë mund të kryejnë detyra ose shërbime për një individ bazuar në komanda ose pyetje. Ata janë në gjendje të interpretojnë fjalimin njerëzor dhe të përgjigjen përmes zërave të sintetizuar. Përdoruesit mund t'u bëjnë pyetje asistentëve të tyre, të kontrollojnë pajisjet e automatizimit të shtëpisë dhe riprodhimin e mediave nëpërmjet zërit dhe të menaxhojnë detyra të tjera bazë si emaili, listat e detyrave dhe kalendarët me komanda verbale. Sa më shumë t'i përdorim këto pajisje të drejtuara nga zëri, aq më shumë bëhemi varur nga inteligjenca artificiale (AI) dhe mësimi i makinerive.
Inteligjenca artificiale (AI)
Kur thoni inteligjencën artificiale (AI), shumë njerëz mund të mendojnë se po flisni për fantashkencë, edhe pse AI është shumë i ngulitur në jetën tonë të përditshme. Në fakt, ka qenë prej dekadash. Por e vërteta është se ishte vërtet fantashkencë ajo që në fillim të shekullit të 20 - të e njohu publikun me robotë artificialisht inteligjentë të ngjashëm me njeriun. Në vitet 50, konceptet e AI erdhën gjithnjë e më shumë në fokusin e interesit të shkencëtarëve dhe filozofëve. Në atë kohë, matematikani i ri britanik Alan Turing sugjeroi se nuk kishte një arsye pse makinat (ashtu si njerëzit) nuk mund të zgjidhnin problemet dhe të merrnin vendime bazuar në informacionin e disponueshëm. Por në atë kohë, kompjuterët nuk kishin mundësinë e memorizimit që është çelësi për inteligjencën. Gjithçka që ata bënë ishte ekzekutimi i komandave. Por megjithatë, ishte Alan Turing ai që krijoi qëllimin dhe vizionin themelor të inteligjencës artificiale.
I njohur gjerësisht si babai i AI është John McCarthy i cili shpiku termin inteligjencë artificiale . Për të AI ishte: "shkenca dhe inxhinieria e krijimit të makinave inteligjente". Ky përkufizim u prezantua në një konferencë në Kolegjin Dartmouth në 1956 dhe tregoi fillimin e kërkimit të AI. Që atëherë e tutje AI lulëzoi.
Në botën moderne, inteligjenca artificiale është e pranishme kudo. Është bërë më popullor falë rritjes së vëllimeve të të dhënave, algoritmeve të avancuara dhe përmirësimeve në fuqinë kompjuterike dhe ruajtjen. Kryesisht aplikacioni i AI është i lidhur me detyra intelektuale. Ne përdorim AI për përkthim, njohjen e objekteve, fytyrës dhe të folurit, zbulimin e temave, analizën e imazheve mjekësore, përpunimin e gjuhës natyrore, filtrimin e rrjeteve sociale, lojërat e shahut etj.
Mësimi i makinerisë
Mësimi i makinerisë është një aplikim i inteligjencës artificiale dhe i referohet sistemeve që kanë aftësinë të përmirësohen nga përvoja e tyre. Gjëja më e rëndësishme këtu është se sistemi duhet të dijë të njohë modelet. Për të qenë në gjendje ta bëjë këtë, sistemi duhet të trajnohet: algoritmi ushqen sasi të mëdha të dhënash, kështu që në një moment ai është në gjendje të identifikojë modelet. Qëllimi është të lejohen kompjuterët të mësojnë automatikisht pa ndërhyrje ose ndihmë njerëzore.
Kur flasim për mësimin e makinerive, është e rëndësishme të përmendim mësimin e thellë. Le të fillojmë duke thënë se një nga mjetet kryesore të përdorura në mësimin e thellë janë rrjetet nervore artificiale. Këto janë algoritme që frymëzohen nga struktura dhe funksioni i trurit, edhe pse priren të jenë statike dhe simbolike, dhe jo plastike dhe analoge si truri biologjik. Pra, mësimi i thellë është një formë e specializuar e të mësuarit të makinerive bazuar në rrjetin nervor artificial, qëllimi i të cilit është të përsërisë mënyrën se si njerëzit mësojnë dhe kjo shërben si një mjet i shkëlqyeshëm për të gjetur modele që janë shumë të shumta për një programues për të mësuar makinën. Në dy vitet e fundit është folur shumë për makinat pa shofer dhe se si ato mund të ndryshojnë jetën tonë. Teknologjia e mësimit të thellë është çelësi këtu, sepse redukton aksidentet duke i mundësuar makinës të dallojë një këmbësor nga një hidrant zjarri ose të njohë një dritë të kuqe. Teknologjia e të mësuarit të thellë luan gjithashtu rolin kryesor në kontrollin e zërit në pajisje si tabletët, telefonat, frigoriferët, televizorët etj. Kompanitë e tregtisë elektronike shpesh përdorin rrjete nervore artificiale si një sistem filtri që përpiqet të parashikojë dhe të tregojë artikujt që një përdorues do të donte të blej. Teknologjia e të mësuarit të thellë përdoret gjithashtu në fushën mjekësore. Ai i ndihmon studiuesit e kancerit të zbulojnë automatikisht qelizat e kancerit dhe kështu përfaqëson një përparim të jashtëzakonshëm në trajtimin e kancerit.
Njohja e të folurit
Teknologjia e njohjes së të folurit shërben për të identifikuar fjalët dhe frazat nga gjuha e folur dhe për t'i kthyer ato në një format të lexueshëm për makinën. Ndërsa disa programe mund të identifikojnë vetëm një numër të kufizuar frazash, disa programe më të sofistikuara të njohjes së të folurit mund të deshifrojnë fjalimin natyral.
A ka pengesa për të kapërcyer?
Ndonëse është e përshtatshme, teknologjia e njohjes së të folurit nuk ecën gjithmonë pa probleme dhe ka ende disa probleme për të zgjidhur, pasi zhvillohet vazhdimisht. Problemet që mund të lindin mund të përfshijnë ndër të tjera si në vijim: cilësia e regjistrimit mund të jetë e pamjaftueshme, mund të ketë zhurma në sfond që e bëjnë të vështirë kuptimin e folësit, gjithashtu folësi mund të ketë një theks ose dialekt vërtet të fortë (a keni dëgjuar ndonjëherë dialektin Geordie?), etj.
Njohja e të folurit është zhvilluar mjaft, por është ende larg të qenit perfekt. Jo gjithçka ka të bëjë vetëm me fjalët, makina ende nuk mund të bëjë shumë gjëra që njerëzit munden: ata nuk mund të lexojnë gjuhën e trupit ose të njohin tonin sarkastik në zërin e dikujt. Njerëzit shpesh nuk e shqiptojnë çdo fjalë në mënyrën e duhur dhe ata priren të shkurtojnë disa fjalë. Për shembull, kur flasin shpejt dhe joformalisht, folësit amtare anglisht shpesh shqiptojnë "going to" si "gonna". Të gjitha sa më sipër, shkaktojnë pengesa për makineritë të cilat ata po përpiqen t'i kapërcejnë, por ka ende një rrugë të gjatë përpara tyre. Është e rëndësishme të theksohet se sa më shumë të dhëna ushqehen me ato algoritme specifike; sfidat duket se po pakësohen. E ardhmja e njohjes së automatizuar të të folurit duket të jetë e ndritshme.
Ndërfaqet e përdoruesit me fuqi zanore po bëhen gjithnjë e më të disponueshme dhe të njohura në familje. Madje mund të bëhet platforma tjetër në teknologji.
Gglot ofron njohje të automatizuar të të folurit në formën e shërbimeve të transkriptimit të automatizuar - ne i konvertojmë fjalimet në tekst. Shërbimi ynë është i thjeshtë në përdorim, nuk do t'ju kushtojë shumë dhe do të bëhet shpejt!