Кепти таануу деген эмне?

Кепти таануу

Кепти таануу жөнүндө эмнени билишиңиз керек

Кепти таануу жөнүндө сөз кылганда, адатта, биз айтылган сөздү таануу жана аны программага жазуу жөндөмүнө ээ программалык камсыздоону түшүнөбүз, андыктан сизде жазылган форматта айтылгандардын бардыгы болот. Ал ошондой эле көп учурда "кеп-текст" деп аталат. Башында бул программалык камсыздоонун мүмкүнчүлүктөрү чектелүү болчу, андыктан сиз фразаларды чектелген санда гана айландыра аласыз. Убакыттын өтүшү менен кепти таануу программалык камсыздоосунун артындагы технология бир топ өнүккөн жана ал ар кандай тилдерди, ал тургай, ар кандай акценттерди тааный тургандай кылып, бир топ татаалдашкан. Бирок, албетте, бул жаатта дагы эле жасала турган иштер бар.

Кээде адамдар бир эле нерсе үчүн эки терминди колдонушса да, кеп таануу үн таануу менен бирдей эмес экенин белгилей кетүү маанилүү. Үн таануу сүйлөп жаткан адамды идентификациялоо жана айтылып жаткан нерсени байкабоо үчүн колдонулат.

Кепти таануунун кыска тарыхы жана ага байланыштуу технология

Бул макалада биз кепти таануунун өсүшүнүн тарыхын жана технологиясын кыскача түшүндүрөбүз.

Санариптик доордун таңынан бери адамдар кандайдыр бир жол менен машиналар менен байланышууга умтулушчу. Санариптик компьютердин биринчи түрү ойлоп табылгандан кийин, көптөгөн илимпоздор жана инженерлер бул процесске сөз таанууну кандайдыр бир жол менен киргизүүгө аракет кылышкан. Бул процесстин чечүүчү жылы 1962-жыл болду, анда IBM жөнөкөй математикалык эсептөөлөрдү жасай алган негизги кеп таануучу Shoebox машинасын ачкан. Эгерде бул протокомпьютердин колдонуучусу микрофонго сүйлөсө, бул машина "плюс" же "минус" сыяктуу алтыга чейин башкаруучу сөздөрдү тааный алган. Убакыттын өтүшү менен, мунун артында технология иштелип чыккан жана бүгүнкү күндө компьютерлер менен үн аркылуу өз ара аракеттенүү абдан кеңири таралган өзгөчөлүк болуп саналат. Siri же Alexa сыяктуу көптөгөн атактуу кеп таануу кыймылдаткычтары бар. Бул үн менен башкарылган түзмөктөр жасалма интеллект (AI) жана машина үйрөнүү көз каранды экенин белгилей кетүү маанилүү.

Жасалма интеллект (AI) жөнүндө сөз болгондо, бул илимий фантастикалык фильмдегидей угулушу мүмкүн, бирок чындык бүгүнкү күндө жана жашта AI биздин дүйнөдө чоң роль ойнойт. Чынында, AI биздин күнүмдүк жашообузда абдан көп, анткени көптөгөн программалар жана колдонмолор аны колдонушат. Бирок бул термин пайда болгон 20-кылымдын башында илимий фантастика болчу. 1950-жылдын аягында AI түшүнүктөрү көбүрөөк көрүнүктүү болуп, көптөгөн окумуштуулардын жана философтордун кызыгуусунун чордону болгон. Ошол убакта Алан Тюринг деген абдан дымактуу британ математики машиналар колдо болгон маалыматтын негизинде өз алдынча маселелерди чечип, чечим чыгара алат деген сунушту айткан. Көйгөй компьютерлерде ал маалыматтарды эстеп калуу мүмкүнчүлүгү жок болчу, бул жасалма интеллектти өнүктүрүү үчүн чечүүчү кадам болуп саналат. Ошол убакта алар жөнөкөй буйруктарды аткара алышкан.

AI өнүгүүсүндөгү дагы бир маанилүү ысым - "жасалма интеллект" терминин биринчи жолу киргизген Джон Маккарти. Маккарти AI бул: "акылдуу машиналарды жасоо илими жана инженериясы" деп айткан. Бул аныктама 1956-жылы Дартмут колледжинде өткөн негизги конференцияда ачыкка чыккан. Ошондон тартып AI катуу темп менен өнүгө баштаган.

Бүгүнкү күндө жасалма интеллект ар кандай формада бардык жерде бар. Ал, негизинен, күн сайын дүйнө жүзү боюнча алмашып жаткан маалыматтардын жалпы көлөмүнүн көбөйүшүнө байланыштуу, массалык түрдө кабыл алынган. Ал өнүккөн алгоритмдерде колдонулат жана бул сактоо жана эсептөө күчүн жакшыртууга шарт түздү. AI көптөгөн максаттар үчүн колдонулат, мисалы, котормо, транскрипция, сүйлөө, бетти жана объектти таануу, медициналык сүрөттөрдү талдоо, табигый тилдерди иштетүү, ар кандай социалдык тармактардын чыпкалары жана башкалар. Гроссмейстер Гари Каспаров менен Deep Blue шахматынын AI ортосундагы шахмат беттеши эсиңиздеби?

Аталышы жок 7 1

Машина үйрөнүү - бул жасалма интеллекттин дагы бир маанилүү колдонмосу. Кыскача айтканда, бул өз тажрыйбасынын базасынан үйрөнүү жана жакшыртуу мүмкүнчүлүгүнө ээ болгон ар кандай системаларды билдирет. Бул үлгүлөрдү таануу аркылуу иштейт. Система бул үчүн аны үйрөтүү керек. Системанын алгоритми чоң көлөмдөгү маалыматтардын киришин алат жана бир учурда ал ошол маалыматтардан үлгүлөрдү аныктоого жөндөмдүү болуп калат. Бул процесстин акыркы максаты – бул компьютердик системалардын эч кандай адамдын кийлигишүүсүн же жардамын талап кылбастан, өз алдынча үйрөнүүгө мүмкүнчүлүк берүү.

Машина үйрөнүү менен бирге айта кете турган дагы бир нерсе - бул терең үйрөнүү. Терең үйрөнүү процессиндеги эң маанилүү инструменттердин бири жасалма нейрон тармактары деп аталат. Алар адамдын мээсинин түзүлүшүнө жана функциясына окшош өнүккөн алгоритмдер. Бирок, алар пластикалык жана аналогдук негиздеги биологиялык мээден айырмаланып, статикалык жана символдук болуп саналат. Кыскача айтканда, бул терең үйрөнүү, биринчи кезекте, жасалма нейрон тармактарына негизделген, машина үйрөнүүнүн абдан адистештирилген ыкмасы болуп саналат. Терең окутуунун максаты адамдын окуу процесстерин тыгыз кайталоо болуп саналат. Терең окутуу технологиясы абдан пайдалуу жана үн менен башкарылган ар кандай түзүлүштөрдө – планшеттерде, сыналгыларда, смартфондордо, муздаткычтарда жана башкаларда маанилүү роль ойнойт. Жасалма нейрон тармактары ошондой эле предметтерди алдын ала айтууга багытталган чыпкалоо системасынын бир түрү катары колдонулат. колдонуучу келечекте сатып ала турган. Терең окутуу технологиясы медицина тармагында да абдан кеңири колдонулат. Бул рак изилдөөчүлөрү үчүн абдан маанилүү, анткени ал рак клеткаларын автоматтык түрдө аныктоого жардам берет.

Эми кепти таанууга кайтып келебиз. Бул технология, биз айтып өткөндөй, сүйлөө тилинин ар кандай сөздөрдү жана сөз айкаштарын аныктоого багытталган. Андан кийин аларды машина окуй ала турган форматка айлантат. Негизги программалар бир аз гана негизги фразаларды аныктайт, бирок кепти таануунун кээ бир өркүндөтүлгөн программасы табигый кептин бардык түрлөрүн чечмелей алат. Кепти таануу технологиясы көпчүлүк учурларда ыңгайлуу, бирок ал кээде жаздыруунун сапаты жетиштүү эмес болгондо же спикерди туура түшүнүүнү кыйындаткан фондо ызы-чуу болгондо көйгөйлөргө туш болот. Баяндамачы чындап эле күчтүү акцентке же диалектиге ээ болгондо дагы эле кээ бир көйгөйлөргө туш болушу мүмкүн. Кепти таануу тынымсыз өнүгүп жатат, бирок ал дагы эле идеалдуу эмес. Баардыгы сөздөн эмес, машиналар дагы эле адамдар жасай ала турган көп нерселерди жасай албайт, мисалы, алар дене тилин же бирөөнүн үнүнүн тонун чечмелей алышпайт. Бирок, бул өркүндөтүлгөн алгоритмдер менен көбүрөөк маалымат чечмеленет, бул кыйынчылыктардын айрымдары кыйынчылыктан азаят окшойт. Келечекте эмне болорун ким билет? Кепти таануу кайда бүтөөрүн алдын ала айтуу кыйын. Мисалы, Google мурунтан эле Google Translate кыймылдаткычтарында кеп таануу программасын ишке ашырууда көп ийгиликтерге жетишүүдө жана машина тынымсыз үйрөнүп, өнүгүп жатат. Балким, бир күнү алар адам котормочуларды толугу менен алмаштырышат. Же болбосо, күнүмдүк сүйлөө кырдаалдары адамдын жан дүйнөсүнүн тереңдигин окуй албаган ар кандай машина үчүн өтө татаал.

Кеп таанууну качан колдонуу керек?

Бүгүнкү күндө дээрлик ар бир адамдын смартфону же планшети бар. Кепти таануу бул түзмөктөрдө жалпы функция болуп саналат. Алар адамдын сөзүн иш-аракетке айландыруу үчүн колдонулат. Эгерде сиз чоң энеңизге чалууну кааласаңыз, анда "чоң энеңизге чал" деген буйрукту бергениңиз жетиштүү жана смартфонуңуз байланыш тизмелери аркылуу тербей эле номерди терип жатат. Бул кеп таануу. Анын дагы бир жакшы мисалы, Alexa же Siri. Алардын системасында бул өзгөчөлүк да бар. Google сизге эч нерсе тербестен үн менен каалаган нерсени издөө мүмкүнчүлүгүн берет.

Аталышы жок 8 1

Балким, сиз азыр мунун баары кантип иштээри жөнүндө кызыктырарсыз. Анын иштеши үчүн микрофондор сыяктуу сенсорлор программалык камсыздоого орнотулушу керек, ошондо айтылган сөздөрдүн үн толкундары таанылып, анализденип, санарип форматка айландырылат. Андан кийин санариптик маалыматты кандайдыр бир сөздөрдүн жана туюнтмалардын репозиторийинде сакталган башка маалымат менен салыштыруу керек. Дал келген учурда программалык камсыздоо буйрукту таанып, ошого жараша иш-аракет кыла алат.

Бул жерде дагы бир айта кетүүчү нерсе WER (сөз катасынын ылдамдыгы) деп аталган. Бул ката санын сөздөрдүн жалпы санына бөлгөн формула. Демек, жөнөкөй тил менен айтканда, анын тактыкка көп тиешеси бар. Максаты, албетте, WERдин төмөн болушу, анткени бул айтылган сөздүн транскрипциясы такыраак экенин билдирет.

Кепти таануу азыр мурдагыдай эле суроо-талапка ээ. Эгер сиз ошондой эле айтылган сөздү жазылган аудио файлдан текстке айландырышыңыз керек болсо, Gglotго кайрылсаңыз болот. Биз адилеттүү баада так транскрипцияларды сунуштаган транскрипция кызматын камсыздоочубуз. Андыктан, биздин колдонуучуга ыңгайлуу веб-сайтыбыз аркылуу байланышуудан тартынбаңыз.