AI և մեքենայական ուսուցում. հեղափոխական խոսքի ճանաչում

Արհեստական ինտելեկտի և մեքենայական ուսուցման դերը խոսքի ճանաչման գործում

Երկար ժամանակ մարդիկ ցանկանում էին, որ կարողանան խոսել մեքենաների հետ։ Այն պահից ի վեր, երբ նրանք սկսեցին համակարգիչներ կառուցել, գիտնականներն ու ինժեներները փորձել են գործընթացում ներառել խոսքի ճանաչումը: 1962 թվականին IBM-ը ներկայացրեց Shoebox-ը՝ խոսքի ճանաչման մեքենա, որը կարող էր կատարել պարզ մաթեմատիկական հաշվարկներ։ Այս նորարարական սարքը ճանաչեց և արձագանքեց 16 ասված բառին, ներառյալ «0»-ից «9»-ի տասը թվանշանները: Երբ արտասանվում էին թվեր և հրամանային բառեր, ինչպիսիք են «գումարած», «մինուս» և «ընդհանուր», Shoebox-ը հանձնարարեց գումարող մեքենային հաշվարկել և տպել պարզ թվաբանական խնդիրների պատասխանները: Shoebox-ը գործարկվում էր խոսափողի մեջ խոսելու միջոցով, որը ձայնային ձայները վերածում էր էլեկտրական ազդակների: Չափիչ սխեման դասակարգեց այս իմպուլսները ըստ տարբեր տեսակի ձայների և ակտիվացրեց կցված ավելացնող մեքենան ռելեային համակարգի միջոցով:

Ժամանակի ընթացքում այս տեխնոլոգիան զարգացավ, և այսօր մեզանից շատերը սովորական ձայնով շփվում են համակարգիչների հետ: Այսօր ամենատարածված ձայնային օգնականներն են Alexa-ն Amazon-ից, Siri-ն Apple-ից, Google Assistant-ը և Cortana-ն Microsoft-ից: Այս օգնականները կարող են առաջադրանքներ կամ ծառայություններ կատարել անհատի համար՝ հրամանների կամ հարցերի հիման վրա: Նրանք կարողանում են մեկնաբանել մարդկային խոսքը և արձագանքել սինթեզված ձայների միջոցով: Օգտատերերը կարող են հարցեր տալ իրենց օգնականներին, կառավարել տնային ավտոմատացման սարքերը և մեդիա նվագարկումը ձայնի միջոցով և կառավարել այլ հիմնական առաջադրանքներ, ինչպիսիք են էլ. փոստը, անելիքների ցուցակները և օրացույցները բանավոր հրամաններով: Որքան շատ ենք մենք օգտագործում ձայնային սարքերը, այնքան ավելի ենք դառնում: կախված արհեստական ինտելեկտից (AI) և մեքենայական ուսուցումից:

Արհեստական ինտելեկտ (AI)

Երբ դուք ասում եք արհեստական ինտելեկտ (AI), շատերը կարող են մտածել, որ դուք խոսում եք գիտաֆանտաստիկայի մասին, չնայած որ AI-ն շատ ներկառուցված է մեր առօրյա կյանքում: Փաստորեն, դա եղել է տասնամյակների ընթացքում: Բայց ճշմարտությունն այն է, որ իսկապես գիտաֆանտաստիկա էր, որը 20 ^-րդ դարի սկզբին հանրությանը ծանոթացրեց արհեստականորեն խելացի մարդանման ռոբոտներին: 50-ականներին արհեստական ինտելեկտի գաղափարներն ավելի ու ավելի էին հայտնվում գիտնականների և փիլիսոփաների հետաքրքրության կենտրոնում: Այդ ժամանակ երիտասարդ բրիտանացի մաթեմատիկոս Ալան Թյուրինգը ենթադրեց, որ պատճառ չկա, թե ինչու մեքենաները (ինչպես մարդիկ) չեն կարող լուծել խնդիրները և որոշումներ կայացնել՝ հիմնվելով առկա տեղեկատվության վրա: Բայց այդ ժամանակ համակարգիչները անգիր անելու հնարավորություն չունեին, ինչը բանականության համար կարևոր է: Նրանք ընդամենը հրամաններ կատարելն էր: Այնուամենայնիվ, Ալան Թյուրինգն էր, ով հաստատեց արհեստական ինտելեկտի հիմնարար նպատակն ու տեսլականը:

Լայնորեն ճանաչված է որպես AI-ի հայր Ջոն Մաքքարթին, ով հորինել է արհեստական ինտելեկտ տերմինը: Նրա համար AI-ն «խելացի մեքենաներ պատրաստելու գիտությունն ու ճարտարագիտությունն էր»: Այս սահմանումը ներկայացվել է 1956 թվականին Դարտմութ քոլեջում տեղի ունեցած կոնֆերանսի ժամանակ և ցույց է տվել արհեստական ինտելեկտի հետազոտության սկիզբը: Այդ ժամանակվանից AI-ն ծաղկեց:

Ժամանակակից աշխարհում արհեստական ինտելեկտը ամենուր տարածված է: Այն ավելի տարածված է դարձել տվյալների ծավալների ավելացման, առաջադեմ ալգորիթմների և հաշվողական հզորության և պահեստավորման բարելավումների շնորհիվ: Հիմնականում AI հավելվածը կապված է ինտելեկտուալ խնդիրների հետ: Մենք օգտագործում ենք AI թարգմանության, առարկաների, դեմքերի և խոսքի ճանաչման, թեմաների հայտնաբերման, բժշկական պատկերների վերլուծության, բնական լեզվի մշակման, սոցիալական ցանցերի զտման, շախմատ խաղալու և այլնի համար:

Մեքենայի ուսուցում

Մեքենայական ուսուցումը արհեստական ինտելեկտի կիրառություն է և վերաբերում է համակարգերին, որոնք կարող են կատարելագործվել սեփական փորձից: Այստեղ ամենակարևորն այն է, որ համակարգը պետք է իմանա, թե ինչպես ճանաչել օրինաչափությունները: Դա անելու համար համակարգը պետք է վերապատրաստվի. ալգորիթմը մեծ քանակությամբ տվյալներ է տալիս, այնպես որ ինչ-որ պահի այն կարող է նույնականացնել օրինաչափությունները: Նպատակն է թույլ տալ համակարգիչներին ավտոմատ կերպով սովորել առանց մարդու միջամտության կամ օգնության:

Մեքենայական ուսուցման մասին խոսելիս կարևոր է նշել խորը ուսուցումը։ Սկսենք նրանից, որ խորը ուսուցման մեջ օգտագործվող հիմնական գործիքներից են արհեստական նեյրոնային ցանցերը։ Սրանք ալգորիթմներ են, որոնք ոգեշնչված են ուղեղի կառուցվածքից և ֆունկցիայից, թեև դրանք հակված են լինել ստատիկ և խորհրդանշական, այլ ոչ թե պլաստիկ և անալոգային, ինչպես կենսաբանական ուղեղը: Այսպիսով, խորը ուսուցումը մեքենայական ուսուցման մասնագիտացված ձև է, որը հիմնված է արհեստական նեյրոնային ցանցի վրա, որի նպատակն է կրկնել մարդկանց սովորելու ձևը, և սա հիանալի գործիք է օրինաչափություններ գտնելու համար, որոնք չափազանց շատ են ծրագրավորողի համար մեքենան սովորեցնելու համար: Վերջին մի քանի տարիների ընթացքում շատ է խոսվել անվարորդ մեքենաների և այն մասին, թե ինչպես դրանք կարող են փոխել մեր կյանքը: Խորը ուսուցման տեխնոլոգիան այստեղ առանցքային է, քանի որ այն նվազեցնում է վթարները՝ հնարավորություն տալով մեքենային տարբերել հետիոտնին հրշեջ հիդրանտից կամ ճանաչել կարմիր լույսը: Խորը ուսուցման տեխնոլոգիան նաև հիմնական դերն է խաղում ձայնային կառավարման մեջ այնպիսի սարքերում, ինչպիսիք են պլանշետները, հեռախոսները, սառնարանները, հեռուստացույցները և այլն: Էլեկտրոնային առևտրի ընկերությունները հաճախ օգտագործում են արհեստական նեյրոնային ցանցեր՝ որպես զտիչ համակարգ, որը փորձում է կանխատեսել և ցույց տալ այն իրերը, որոնք օգտատերը կցանկանար: գնել. Խորը ուսուցման տեխնոլոգիան կիրառվում է նաև բժշկական ոլորտում։ Այն օգնում է քաղցկեղի հետազոտողներին ինքնաբերաբար հայտնաբերել քաղցկեղի բջիջները և այդպիսով ներկայացնում է հսկայական առաջընթաց քաղցկեղի բուժման գործում:

Խոսքի ճանաչում

Խոսքի ճանաչման տեխնոլոգիան ծառայում է խոսակցական լեզվից բառերն ու արտահայտությունները նույնականացնելու և դրանք մեքենայի համար ընթեռնելի ձևաչափի վերածելու համար: Թեև որոշ ծրագրեր կարող են ճանաչել միայն սահմանափակ թվով արտահայտություններ, խոսքի ճանաչման որոշ ավելի բարդ ծրագրեր կարող են վերծանել բնական խոսքը:

Կա՞ն հաղթահարելու խոչընդոտներ:

Թեև խոսքի ճանաչման տեխնոլոգիան հարմար է, բայց միշտ չէ, որ հարթ է ընթանում, և այն դեռևս մի քանի խնդիրներ ունի լուծելու, քանի որ այն շարունակաբար զարգանում է: Խնդիրները, որոնք կարող են առաջանալ, կարող են ներառել, ի թիվս այլոց, հետևյալը. ձայնագրության որակը կարող է անբավարար լինել, ֆոնի վրա կարող են լինել աղմուկներ, որոնք դժվարացնում են խոսակցին հասկանալը, ինչպես նաև խոսողը կարող է իսկապես ուժեղ առոգանություն կամ բարբառ ունենալ (արդյո՞ք դուք երբևէ լսե՞լ եք գեորդի բարբառը) և այլն:

Խոսքի ճանաչումը բավականին զարգացել է, բայց դեռ շատ հեռու է կատարյալ լինելուց։ Ամեն ինչ միայն բառերով չէ, մեքենան դեռևս չի կարող անել շատ բաներ, որոնք կարող են մարդիկ. նրանք չեն կարողանում կարդալ մարմնի լեզուն կամ ճանաչել ինչ-որ մեկի ձայնի հեգնական տոնը: Մարդիկ հաճախ ամեն բառ ճիշտ չեն արտասանում և հակված են որոշ բառեր կրճատելու: Օրինակ, երբ խոսում են արագ և ոչ պաշտոնական, բնիկ անգլերեն խոսողները հաճախ արտասանում են «going to», ինչպես «gonna»: Վերոնշյալ բոլորը մեքենաների համար խոչընդոտներ են առաջացնում, որոնք նրանք փորձում են հաղթահարել, բայց նրանց առջև դեռ երկար ճանապարհ կա: Կարևոր է ընդգծել, որ քանի որ ավելի ու ավելի շատ տվյալներ են սնվում այդ հատուկ ալգորիթմներին. մարտահրավերները կարծես թե նվազում են։ Խոսքի ավտոմատ ճանաչման ապագան կարծես թե պայծառ է:

Ձայնային ինտերֆեյսները դառնում են ավելի մատչելի և տարածված տնային տնտեսություններում: Այն կարող է նույնիսկ դառնալ տեխնոլոգիայի հաջորդ հարթակը:

Gglot-ն առաջարկում է խոսքի ավտոմատ ճանաչում ավտոմատացված տառադարձման ծառայությունների տեսքով. մենք ելույթները փոխակերպում ենք տեքստի: Մեր ծառայությունը հեշտ է օգտագործել, այն ձեզ շատ չի կարժենա և արագ կկատարվի:

Արհեստական ինտելեկտի և մեքենայական ուսուցման դերը խոսքի ճանաչման գործում

Ստեղծել

Համեմատեք

Իրավական