Jukumu la Akili Bandia na Kujifunza kwa Mashine katika Utambuzi wa Usemi

Jukumu la Akili Bandia na Kujifunza kwa Mashine katika Utambuzi wa Usemi

Kwa muda mrefu, watu walitaka kuwa na uwezo wa kuzungumza na mashine. Tangu walipoanza kuunda kompyuta, wanasayansi na wahandisi wamejaribu kujumuisha utambuzi wa usemi katika mchakato huo. Mnamo mwaka wa 1962, IBM ilianzisha Shoebox, mashine ya utambuzi wa usemi ambayo inaweza kufanya hesabu rahisi za hesabu. Kifaa hiki cha ubunifu kilitambua na kujibu maneno 16 yaliyotamkwa, kutia ndani tarakimu kumi kutoka “0” hadi “9.” Wakati nambari na maneno ya amri kama vile "plus," "minus" na "jumla" yalitamkwa, Shoebox iliagiza mashine ya kuongeza kukokotoa na kuchapisha majibu kwa matatizo rahisi ya hesabu. Sanduku la viatu liliendeshwa kwa kuongea kwenye maikrofoni, ambayo ilibadilisha sauti za sauti kuwa misukumo ya umeme. Saketi ya kupimia iliainisha misukumo hii kulingana na aina mbalimbali za sauti na kuwezesha mashine ya kuongeza iliyoambatishwa kupitia mfumo wa relay.

Baada ya muda, teknolojia hii ilikua na leo wengi wetu huingiliana mara kwa mara na kompyuta kwa sauti. Wasaidizi maarufu wa sauti leo ni Alexa na Amazon, Siri na Apple, Msaidizi wa Google na Cortana na Microsoft. Wasaidizi hawa wanaweza kumfanyia mtu kazi au huduma kulingana na amri au maswali. Wana uwezo wa kutafsiri hotuba ya binadamu na kujibu kupitia sauti zilizounganishwa. Watumiaji wanaweza kuuliza wasaidizi wao maswali, kudhibiti vifaa vya kiotomatiki vya nyumbani na uchezaji wa maudhui kupitia sauti, na kudhibiti kazi nyingine za msingi kama vile barua pepe, orodha za mambo ya kufanya na kalenda zenye amri za maneno. Kadiri tunavyotumia vifaa hivi vinavyoendeshwa kwa sauti ndivyo tunavyozidi kuwa. inategemea akili bandia (AI) na ujifunzaji wa mashine.

Akili Bandia (AI)

1

Unaposema akili ya bandia (AI), watu wengi wanaweza kufikiri kwamba unazungumza kuhusu hadithi za kisayansi, ingawa AI imejikita sana katika maisha yetu ya kila siku. Kwa kweli, imekuwa kwa miongo kadhaa. Lakini ukweli ni kwamba, ilikuwa kweli hadithi za kisayansi ambazo mwanzoni mwa karne ya 20 zilifahamisha umma na roboti zenye akili za kibinadamu kama za kibinadamu. Katika miaka ya 50 dhana za AI zilikuja zaidi na zaidi katika mwelekeo wa maslahi ya wanasayansi na wanafalsafa. Wakati huo mwanahisabati mchanga Mwingereza Alan Turing alipendekeza kwamba hakuna sababu kwa nini mashine hazingeweza (kama wanadamu) kutatua matatizo na kufanya maamuzi kulingana na taarifa zilizopo. Lakini wakati huo, kompyuta hazikuwa na uwezekano wa kukariri ambayo ni muhimu kwa akili. Walichofanya ni kutekeleza amri. Lakini bado, ni Alan Turing ambaye alianzisha lengo la msingi na maono ya akili ya bandia.

Anayetambulika sana kama baba wa AI ni John McCarthy ambaye aliunda neno akili bandia . Kwake AI ilikuwa: "sayansi na uhandisi wa kutengeneza mashine zenye akili". Ufafanuzi huu uliwasilishwa katika mkutano katika Chuo cha Dartmouth mnamo 1956 na ulionyesha mwanzo wa utafiti wa AI. Kuanzia hapo AI ilistawi.

Katika ulimwengu wa kisasa, akili ya bandia iko kila mahali. Imekuwa maarufu zaidi kutokana na kuongezeka kwa idadi ya data, algoriti za hali ya juu, na uboreshaji wa nguvu na uhifadhi wa kompyuta. Mara nyingi programu ya AI imeunganishwa na kazi za kiakili. Tunatumia AI kwa tafsiri, kitu, utambuzi wa uso na usemi, utambuzi wa mada, uchanganuzi wa picha za matibabu, uchakataji wa lugha asilia, uchujaji wa mitandao ya kijamii, kucheza chess n.k.

Kujifunza kwa mashine

Kujifunza kwa mashine ni matumizi ya akili bandia na inarejelea mifumo ambayo ina uwezo wa kuboreshwa kutoka kwa uzoefu wao wenyewe. Jambo muhimu zaidi hapa ni kwamba mfumo unahitaji kujua jinsi ya kutambua mifumo. Ili uweze kufanya hivyo mfumo unahitaji kufunzwa: algoriti ni kulisha kiasi kikubwa cha data kwa hivyo wakati fulani inaweza kutambua ruwaza. Lengo ni kuruhusu kompyuta kujifunza kiotomatiki bila uingiliaji kati wa binadamu au usaidizi.

Wakati wa kuzungumza juu ya kujifunza kwa mashine, ni muhimu kutaja kujifunza kwa kina. Wacha tuanze kwa kusema kwamba moja ya zana kuu zinazotumiwa katika ujifunzaji wa kina ni mitandao ya neva bandia. Hizo ni algoriti ambazo zimechochewa na muundo na utendaji kazi wa ubongo, ingawa zinaelekea kuwa tuli na za ishara, na si za plastiki na analogi kama ubongo wa kibayolojia. Kwa hivyo, kujifunza kwa kina ni aina maalum ya kujifunza kwa mashine kulingana na mtandao wa neva bandia lengo lake ni kuiga jinsi wanadamu wanavyojifunza na hii hutumika kama zana nzuri ya kupata mifumo ambayo ni nyingi sana kwa programu kufundisha mashine. Katika miaka michache iliyopita kumekuwa na mazungumzo mengi kuhusu magari yasiyo na dereva na jinsi yanavyoweza kubadilisha maisha yetu. Teknolojia ya kujifunza kwa kina ndiyo ufunguo hapa, kwa sababu inapunguza ajali kwa kuwezesha gari kutofautisha mtembea kwa miguu na bomba la kuzima moto au kutambua taa nyekundu. Teknolojia ya kujifunza kwa kina pia ina jukumu kuu katika udhibiti wa sauti katika vifaa kama vile kompyuta za mkononi, simu, friji, TV n.k. Kampuni za biashara ya mtandaoni mara nyingi hutumia mitandao ya neva bandia kama mfumo wa kuchuja ambao hujaribu kutabiri na kuonyesha vitu ambavyo mtumiaji angependa kuvitumia. kununua. Teknolojia ya kujifunza kwa kina pia hutumiwa katika uwanja wa matibabu. Inasaidia watafiti wa saratani kugundua kiotomatiki seli za saratani na kwa hivyo inawakilisha maendeleo makubwa katika matibabu ya saratani.

Utambuzi wa hotuba

Teknolojia ya utambuzi wa usemi hutumika kutambua maneno na vifungu vya maneno kuunda lugha inayozungumzwa na kuzibadilisha kuwa umbizo linaloweza kusomeka kwa mashine. Ingawa baadhi ya programu zinaweza tu kutambua idadi ndogo ya vifungu vya maneno, baadhi ya programu za kisasa zaidi za utambuzi wa usemi zinaweza kubainisha usemi asilia.

Je, kuna vikwazo vya kushinda?

Ingawa ni rahisi, teknolojia ya utambuzi wa usemi haiendi vizuri kila wakati na bado ina masuala machache ya kushughulikia, kwani inaendelezwa kila mara. Matatizo yanayoweza kutokea yanaweza kujumuisha miongoni mwa mengine yafuatayo: ubora wa rekodi unaweza kuwa hautoshi, kunaweza kuwa na kelele chinichini ambazo hufanya iwe vigumu kumwelewa mzungumzaji, pia mzungumzaji anaweza kuwa na lafudhi au lahaja kali sana ( je! umewahi kusikia lahaja ya Geordie?), nk.

Utambuzi wa usemi umekua sana, lakini bado uko mbali na kuwa mkamilifu. Sio yote ni maneno tu, mashine bado haiwezi kufanya mambo mengi ambayo wanadamu wanaweza: hawawezi kusoma lugha ya mwili au kutambua sauti ya kejeli katika sauti ya mtu. Mara nyingi watu hawatamki kila neno kwa njia ifaayo na huwa wanafupisha baadhi ya maneno. Kwa mfano, wakati wa kuzungumza kwa haraka na kwa njia isiyo rasmi, wazungumzaji asilia wa Kiingereza mara nyingi hutamka "kwenda" kama "gonna." Yote ya hapo juu, husababisha vikwazo kwa mashine ambayo wanajaribu kushinda, lakini bado kuna njia ndefu mbele yao. Ni muhimu kuangazia kwamba data zaidi na zaidi hulishwa kwa kanuni hizo maalum; changamoto zinaonekana kupungua. Mustakabali wa utambuzi wa usemi wa kiotomatiki unaonekana kuwa mzuri.

Violesura vya watumiaji vinavyotumia sauti vinazidi kupatikana na kuwa maarufu katika kaya. Inaweza hata kuwa jukwaa linalofuata katika teknolojia.

Gglot inatoa utambuzi wa usemi otomatiki katika mfumo wa huduma za unukuzi za kiotomatiki - tunabadilisha hotuba kuwa maandishi. Huduma yetu ni rahisi kutumia, haitagharimu sana na itafanyika haraka!