Шинохти нутқ маҳз чист?
Шинохти нутқ
Он чизе ки шумо бояд дар бораи шинохти нутқ донед
Вақте ки мо дар бораи шинохти нутқ сухан меронем, одатан мо нармафзореро дар назар дорем, ки қобилияти шинохтани калимаи гуфтугӯ ва навиштани онро дар барнома дорад, то дар ниҳоят шумо ҳама чизеро, ки дар формати хаттӣ гуфта шудааст, дошта бошед. Онро аксар вақт "сухан ба матн" низ меноманд. Дар ибтидо, нармафзор имкониятҳои хеле маҳдуд дошт, то шумо метавонед танҳо шумораи маҳдуди ибораҳоро табдил диҳед. Бо гузашти вақт, технологияи паси нармафзори шинохти нутқ хеле рушд кард ва ҳоло он хеле мураккабтар шудааст, то забонҳои гуногун ва ҳатто аксентҳои гуногунро эътироф кунад. Вале, албатта, дар ин соха хануз корхое хастанд, ки бояд анчом дода шаванд.
Инчунин бояд қайд кард, ки шинохти нутқ бо шинохти овоз яксон нест, гарчанде ки баъзан одамон ин ду истилоҳро барои як чиз истифода мебаранд. Шинохти овоз барои муайян кардани шахсе, ки сухан мегӯяд ва на барои қайд кардани он чизе, ки гуфта мешавад, истифода мешавад.
Таърихи мухтасари шинохти нутқ ва технологияи алоқаманд
Дар ин мақола, мо ба таври мухтасар таърих ва технологияи паси афзоиши шинохти нутқро шарҳ медиҳем.
Аз оғози асри рақамӣ, одамон хоҳиш доштанд, ки бо ягон роҳ бо мошинҳо муошират кунанд. Пас аз ихтироъ шудани навъи якуми компютерҳои рақамӣ, олимон ва муҳандисони сершумор бо роҳҳои гуногун кӯшиш карданд, ки шинохти нутқро дар ин раванд татбиқ кунанд. Соли ҳалкунандаи ин раванд соли 1962 буд, вақте ки IBM Shoebox-ро кашф кард, як мошини асосии шинохти нутқ, ки қодир буд ҳисобҳои оддии риёзиро анҷом диҳад. Агар корбари ин протокомпютер бо микрофон сухан гӯяд, ин мошин тавонист то шаш калимаи идоракуниро ба мисли "плюс" ё "минус" эътироф кунад. Бо мурури замон, технологияи паси ин таҳия ва имрӯз хусусияти хеле маъмули муошират бо компютерҳо тавассути овоз аст. Бисёр муҳаррикҳои машҳури шинохтани нутқ мавҷуданд, ба монанди Siri ё Alexa. Бояд қайд кард, ки ин дастгоҳҳои бо овоз идорашаванда ба зеҳни сунъӣ (AI) ва омӯзиши мошинҳо вобастаанд.
Вақте ки зеҳни сунъӣ (AI) ёдовар мешавад, он метавонад ба як филми фантастикӣ монанд бошад, аммо ҳақиқат ин аст, ки дар имрӯз ва синну соли AI дар ҷаҳони мо нақши бузург дорад. Дар асл, AI аллакай дар ҳаёти ҳаррӯзаи мо хеле мавҷуд аст, зеро бисёр барномаҳо ва барномаҳо аллакай онро истифода мебаранд. Аммо ин фантастикаи илмӣ дар ибтидои асри 20 буд, вақте ки истилоҳ пайдо шуд. Дар охири соли 1950 мафҳумҳои AI бештар намоён шуданд ва дар маркази таваҷҷӯҳи бисёр олимон ва файласуфон қарор гирифтанд. Дар он вақт, математики хеле шӯҳратпарасти бритониёӣ Алан Тюринг пешниҳод кард, ки мошинҳо метавонанд дар асоси вуруди иттилооти мавҷуда мушкилотро ҳал кунанд ва худашон қарор қабул кунанд. Мушкилот дар он буд, ки компютерҳо то ҳол имкони дар хотир нигоҳ доштани ин маълумотро надоштанд, ки ин як қадами муҳим барои рушди зеҳни сунъӣ мебошад. Он вақт ҳама коре, ки онҳо карда метавонистанд, иҷрои фармонҳои оддӣ буд.
Номи дигари муҳим дар рушди AI Ҷон МакКарти мебошад, ки бори аввал худи истилоҳи "зеҳни сунъӣ"-ро ба вуҷуд овардааст. Маккарти изҳор дошт, ки AI ин аст: "илм ва муҳандисии сохтани мошинҳои интеллектуалӣ". Ин таъриф соли 1956 дар як конфронси муҳим дар Коллеҷи Дартмут маълум шуд. Аз он вақт инҷониб AI бо суръати шадид инкишоф ёфт.
Имрӯз, зеҳни сунъӣ дар шакли гуногуни худ дар ҳама ҷо мавҷуд аст. Он ба қабули оммавӣ расид, асосан аз ҳисоби афзоиши ҳаҷми умумии маълумот, ки ҳамарӯза дар саросари ҷаҳон мубодила мешавад. Он дар алгоритмҳои пешрафта истифода мешавад ва он боиси беҳбудиҳо дар нигоҳдорӣ ва қудрати ҳисоббарорӣ гардид. AI барои мақсадҳои зиёд истифода мешавад, масалан тарҷума, транскрипсия, сухан, шинохти чеҳра ва ашё, таҳлили тасвирҳои тиббӣ, коркарди забонҳои табиӣ, филтрҳои гуногуни шабакаҳои иҷтимоӣ ва ғайра. Дар хотир доред, ки бозии шоҳмот байни гроссмейстер Гари Каспаров ва Deep Blue chess AI?
Омӯзиши мошинсозӣ боз як барномаи муҳими зеҳни сунъӣ мебошад. Хулоса, он ба ҳама гуна системаҳое дахл дорад, ки қобилияти омӯхтан ва такмил додани пойгоҳи додаҳои таҷрибаи худро доранд. Ин тавассути шинохти намунаҳо кор мекунад. Барои он ки система ин корро кунад, он бояд омӯзонида шавад. Алгоритми система вуруди миқдори зиёди маълумотро қабул мекунад ва дар як лаҳза он метавонад намунаҳоро аз ин маълумот муайян кунад. Ҳадафи ниҳоии ин раванд ин аст, ки ин системаҳои компютерӣ бидуни ниёз ба дахолат ё кӯмаки инсон мустақилона омӯхта шаванд.
Чизи дигаре, ки дар баробари омӯзиши мошинсозӣ хеле муҳим аст, омӯзиши амиқ аст. Яке аз воситаҳои муҳимтарини раванди омӯзиши амиқ ин шабакаҳои нейронҳои сунъӣ мебошанд. Онҳо алгоритмҳои пешрафта мебошанд, ки ба сохтор ва вазифаи майнаи инсон монанданд. Аммо, онҳо бар хилофи майнаи биологӣ, ки пластикӣ ва аналогӣ асос ёфтааст, статикӣ ва рамзӣ мебошанд. Хулоса, ин омӯзиши амиқ як усули хеле махсуси омӯзиши мошинсозӣ мебошад, ки пеш аз ҳама ба шабакаҳои нейронии сунъӣ асос ёфтааст. Ҳадафи омӯзиши амиқ ин такрор кардани равандҳои омӯзиши инсон аст. Технологияи омӯзиши амиқ хеле муфид аст ва он дар дастгоҳҳои гуногуне, ки тавассути овоз идора карда мешаванд - планшетҳо, телевизорҳо, смартфонҳо, яхдонҳо ва ғайра нақши муҳим мебозад. Шабакаҳои нейронии сунъӣ инчунин ҳамчун як намуди системаи филтркунӣ истифода мешаванд, ки ҳадафи он пешгӯии ашё мебошад. ки корбар дар оянда мехарад. Технологияи омӯзиши амиқ дар соҳаи тиб низ хеле васеъ истифода мешавад. Ин барои муҳаққиқони саратон хеле муҳим аст, зеро он барои ошкор кардани ҳуҷайраҳои саратон кӯмак мекунад.
Акнун мо ба шинохти нутқ бармегардем. Ин технология, тавре ки мо аллакай зикр кардем, ҳадафи муайян кардани калимаҳо ва ибораҳои гуногуни забони гуфтугӯ мебошад. Баъдан, он онҳоро ба формате табдил медиҳад, ки мошин қодир аст онро бихонад. Барномаҳои асосӣ танҳо шумораи ками ибораҳои калидиро муайян мекунанд, аммо баъзе нармафзори пешрафтаи шинохти нутқ қодир аст, ки ҳама навъҳои нутқи табииро фаҳмад. Технологияи шинохти нутқ дар аксари мавридҳо қулай аст, аммо он гоҳ баъзан бо мушкилоте рӯбарӯ мешавад, ки сифати сабт ба қадри кофӣ хуб нест ё ҳангоми мавҷуд будани садоҳои пасзамина, ки дуруст фаҳмидани сухангӯро мушкил мекунад. Он инчунин метавонад ба баъзе мушкилот дучор ояд, вақте ки сухангӯ як лаҳҷаи воқеан қавӣ ё лаҳҷа дорад. Шинохти нутқ пайваста инкишоф меёбад, аммо он ҳанӯз ҳам комил нест. На ҳама чиз дар бораи калимаҳост, мошинҳо то ҳол ба бисёр корҳое, ки одамон карда метавонанд, қодир нестанд, масалан онҳо наметавонанд забони бадан ё оҳанги овози касеро фаҳманд. Бо вуҷуди ин, вақте ки маълумоти бештар аз ҷониби ин алгоритмҳои пешрафта рамзкушоӣ карда мешавад, баъзе аз ин мушкилот ба назар мерасад, ки душворӣ кам мешавад. Кӣ медонад, ки оянда чӣ меорад? Пешгӯӣ кардан душвор аст, ки шинохти нутқ ба куҷо мерасад. Масалан, Google аллакай дар татбиқи нармафзори шинохти нутқ дар муҳаррикҳои Google Translate муваффақияти зиёд ба даст овардааст ва мошин пайваста омӯхта ва рушд мекунад. Шояд рӯзе онҳо тарҷумони инсониро комилан иваз кунанд. Ё шояд не, ҳолатҳои суханронии ҳаррӯза барои ҳама гуна мошине, ки қобилияти хондани умқи рӯҳи инсонро надорад, хеле мураккаб аст.
Шинохти нутқро кай бояд истифода кард?
Имрӯзҳо қариб ҳама дорои смартфон ё планшет мебошанд. Шинохти нутқ як хусусияти маъмули ин дастгоҳҳост. Онҳо барои табдил додани сухани шахс ба амал истифода мешаванд. Агар шумо хоҳед, ки ба бибии худ занг занед, бас аст, ки шумо фармони "ба бибии занг занед" ва смартфони шумо аллакай рақамро занг мезанад, бидуни ворид кардани рӯйхати тамосҳои худ. Ин эътирофи нутқ аст. Мисоли дигари хуби он, Alexa ё Siri мебошад. Онҳо инчунин ин хусусиятро дар системаи худ доранд. Google инчунин ба шумо имкон медиҳад, ки чизеро бо овоз, бидуни ворид кардани чизе ҷустуҷӯ кунед.
Шояд шумо ҳоло дар бораи он ки ҳамаи ин кор мекунад, кунҷкоб бошед. Хуб, барои кор кардани он, сенсорҳо ба монанди микрофонҳо бояд дар нармафзор сохта шаванд, то мавҷҳои садои калимаҳои гуфташуда эътироф, таҳлил ва ба формати рақамӣ табдил дода шаванд. Пас аз он иттилооти рақамӣ бояд бо дигар иттилооте, ки дар як навъ анбори калимаҳо ва ифодаҳо нигоҳ дошта мешавад, муқоиса карда шавад. Вақте ки мувофиқат вуҷуд дорад, нармафзор метавонад фармонро эътироф кунад ва мувофиқи он амал кунад.
Як чизи дигаре, ки бояд дар ин лаҳза зикр шавад, ин ба истилоҳ WER (дараҷаи хатогии калима) мебошад. Ин формулаест, ки дар он шумо рақами хаторо бо умумии калимаҳо тақсим мекунед. Пас, ба ибораи оддй гуем, он ба дакикат алокаи зиёд дорад. Ҳадаф албатта паст будани WER аст, зеро ин маънои онро дорад, ки транскрипсияи калимаи гуфтор дақиқтар аст.
Шинохти нутқ ҳоло мисли пештара талабот аст. Агар ба шумо низ лозим ояд, ки калимаи гуфтугӯиро аз файли аудиоии сабтшуда ба матн табдил диҳед, шумо метавонед ба Gglot муроҷиат кунед. Мо як провайдери хидматрасонии транскрипсия ҳастем, ки транскриптҳои дақиқро бо нархи одилона пешниҳод мекунад. Аз ин рӯ, шарм надоред, ки тавассути вебсайти барои корбар дӯстонаи мо тамос гиред.