Nitqin tanınması tam olaraq nədir?
Nitqin tanınması
Nitqin tanınması haqqında nə bilmək lazımdır
Nitqin tanınması haqqında danışarkən, ümumiyyətlə danışıq sözü tanımaq və onu proqrama yazmaq qabiliyyətinə malik proqram təminatı nəzərdə tutulur ki, sonda yazılı formatda danışılan hər şey var. Buna tez-tez "nitqdən mətnə" də deyilir. Başlanğıcda proqramın çox məhdud imkanları var idi ki, siz yalnız məhdud sayda ifadələri çevirə bildiniz. Vaxt keçdikcə nitqin tanınması proqramının arxasında duran texnologiya çox inkişaf etdi və o, müxtəlif dilləri və hətta fərqli vurğuları tanıya bilməsi üçün indi daha təkmilləşdi. Amma təbii ki, bu sahədə hələ görüləsi işlər var.
Bəzən insanlar eyni şey üçün iki termindən istifadə etsələr də, nitqin tanınması səsin tanınması ilə eyni olmadığını qeyd etmək də vacibdir. Səsin tanınması danışan şəxsin kimliyini müəyyən etmək və deyilənləri qeyd etmək üçün istifadə olunur.
Nitqin tanınması və əlaqəli texnologiyanın qısa tarixi
Bu yazıda nitqin tanınmasının yüksəlişinin tarixi və texnologiyasını qısaca izah edəcəyik.
Rəqəmsal əsrin başlanğıcından bəri insanlarda maşınlarla ünsiyyət qurmaq istəyi var idi. Birinci növ rəqəmsal kompüter ixtira edildikdən sonra çoxsaylı alim və mühəndislər nitqin tanınmasını bu prosesə hansısa şəkildə tətbiq etmək üçün müxtəlif yollarla cəhd etdilər. Bu prosesin həlledici ili 1962-ci il idi, o zaman IBM sadə riyazi hesablamalar apara bilən əsas nitqin tanınması maşını olan Shoebox-u nümayiş etdirdi. Bu proto-kompüterin istifadəçisi mikrofonla danışarsa, bu maşın "plus" və ya "minus" kimi altı nəzarət sözünü tanıya bilirdi. Zaman keçdikcə bunun arxasında olan texnologiya inkişaf etdi və bu gün kompüterlərlə səslə qarşılıqlı əlaqə yaratmaq çox yaygın bir xüsusiyyətdir. Siri və ya Alexa kimi bir çox məşhur nitqin tanınması mühərrikləri var. Bu səslə idarə olunan cihazların süni intellektdən (AI) və maşın öyrənməsindən asılı olduğunu qeyd etmək vacibdir.
Süni intellektdən (AI) bəhs edildikdə, bu, elmi fantastika filmindən bir şey kimi səslənə bilər, lakin həqiqət budur ki, bu gün və yaşda AI dünyamızda böyük rol oynayır. Əslində, süni intellekt artıq gündəlik həyatımızda çox mövcuddur, çünki bir çox proqram və proqramlar ondan artıq istifadə edir. Ancaq bu terminin ortaya çıxdığı 20-ci əsrin əvvəllərində elmi fantastika idi. 1950-ci ilin sonlarında süni intellekt anlayışları daha qabarıq oldu və bir çox alim və filosofun maraq mərkəzi oldu. O dövrdə Alan Turinq adlı çox iddialı bir İngilis riyaziyyatçısı, maşınların mövcud məlumatların daxil edilməsinə əsaslanaraq, problemləri həll edə və qərarlar qəbul edə biləcəyinə dair bir təklif irəli sürdü. Problem onda idi ki, kompüterlərin həmin məlumatları yadda saxlamaq imkanı hələ yox idi ki, bu da süni intellektin inkişafı üçün mühüm addımdır. O vaxtlar onların edə bildiyi tək şey sadə əmrləri yerinə yetirmək idi.
Süni intellektin inkişafında digər mühüm ad, ilk dəfə "süni intellekt" terminini işlədən Con Makkartidir. McCarthy qeyd etdi ki, süni intellekt “ağıllı maşınların yaradılması elmi və mühəndisliyidir”. Bu tərif 1956-cı ildə Dartmut Kollecində keçirilən əsas konfransda ortaya çıxdı. O vaxtdan süni intellekt böyük sürətlə inkişaf etməyə başladı.
Bu gün müxtəlif formada süni intellekt hər yerdə mövcuddur. Əsasən hər gün dünya miqyasında mübadilə edilən məlumatların ümumi həcminin artması səbəbindən o, kütləvi şəkildə mənimsənildi. Qabaqcıl alqoritmlərdə istifadə olunur və bu, saxlama və hesablama gücündə təkmilləşdirmələrə səbəb oldu. Süni intellekt bir çox məqsədlər üçün istifadə olunur, məsələn, tərcümə, transkripsiya, nitq, üz və obyektin tanınması, tibbi təsvirlərin təhlili, təbii dillərin emalı, müxtəlif sosial şəbəkə filtrləri və s. Qrossmeyster Qari Kasparov və Deep Blue şahmat AI arasındakı şahmat matçını xatırlayırsınız?
Maşın öyrənməsi süni intellektin digər çox vacib tətbiqidir. Bir sözlə, bu, öz təcrübələrinin verilənlər bazasından öyrənmək və təkmilləşdirmək qabiliyyətinə malik olan istənilən sistemlərə aiddir. Bu nümunələrin tanınması ilə işləyir. Sistemin bunu etməsi üçün onun təlim keçməsi lazımdır. Sistemin alqoritmi böyük həcmli məlumatların daxil edilməsini qəbul edir və bir anda həmin verilənlərdən nümunələri müəyyən edə bilir. Bu prosesin son məqsədi bu kompüter sistemlərinin heç bir insan müdaxiləsi və ya köməyinə ehtiyac olmadan müstəqil şəkildə öyrənmələrini təmin etməkdir.
Maşın öyrənməsi ilə yanaşı qeyd edilməli olan başqa bir şey də dərin öyrənmədir. Dərin öyrənmə prosesində ən vacib vasitələrdən biri süni neyron şəbəkələridir. Onlar insan beyninin strukturuna və funksiyasına bənzəyən qabaqcıl alqoritmlərdir. Bununla birlikdə, plastik və daha çox analoq əsaslı olan bioloji beyindən fərqli olaraq, onlar statik və simvolikdir. Bir sözlə, bu dərin öyrənmə, ilk növbədə süni neyron şəbəkələrinə əsaslanan maşın öyrənməsinin çox xüsusi bir üsuludur. Dərin öyrənmənin məqsədi insanın öyrənmə proseslərini yaxından təkrarlamaqdır. Dərin öyrənmə texnologiyası çox faydalıdır və səslə idarə olunan müxtəlif cihazlarda – planşetlərdə, televizorlarda, smartfonlarda, soyuducularda və s.-də mühüm rol oynayır. Süni neyron şəbəkələri həm də elementləri proqnozlaşdırmaq məqsədi daşıyan bir növ filtrasiya sistemi kimi istifadə olunur. istifadəçinin gələcəkdə satın alacağı. Dərin öyrənmə texnologiyası tibb sahəsində də çox geniş istifadə olunur. Xərçəng tədqiqatçıları üçün çox vacibdir, çünki xərçəng hüceyrələrini avtomatik aşkar etməyə kömək edir.
İndi nitqin tanınmasına qayıdaq. Bu texnologiya, artıq qeyd etdiyimiz kimi, danışıq dilinin müxtəlif söz və ifadələrini müəyyən etmək məqsədi daşıyır. Daha sonra onları maşının oxuya biləcəyi formata çevirir. Əsas proqramlar yalnız az sayda əsas ifadələri müəyyən edir, lakin bəzi daha təkmil nitqin tanınması proqramı bütün növ təbii nitqi deşifrə etməyə qadirdir. Nitqin tanınması texnologiyası əksər hallarda əlverişlidir, lakin bəzən qeydin keyfiyyəti kifayət qədər yaxşı olmadıqda və ya natiqin düzgün başa düşülməsini çətinləşdirən fon səsləri olduqda problemlərlə qarşılaşır. Natiqin həqiqətən güclü vurğu və ya ləhcəsi olduqda o, hələ də bəzi problemlərlə üzləşə bilər. Nitqin tanınması daim inkişaf edir, lakin hələ də mükəmməl deyil. Hər şey sözlərdən ibarət deyil, maşınlar hələ də insanların edə biləcəyi bir çox şeyə qadir deyil, məsələn, bədən dilini və ya kiminsə səs tonunu deşifrə edə bilmirlər. Bununla belə, bu qabaqcıl alqoritmlər tərəfindən daha çox məlumat deşifrə edildiyi üçün bu çətinliklərdən bəzilərinin çətinliyi azalır. Gələcəyin nə gətirəcəyini kim bilir? Nitqin tanınmasının hara bitəcəyini proqnozlaşdırmaq çətindir. Məsələn, Google artıq Google Translate mühərriklərində nitqin tanınması proqramının tətbiqində bir çox uğur qazanır və maşın daim öyrənir və inkişaf edir. Bəlkə bir gün insan tərcüməçiləri tamamilə əvəz edəcəklər. Və ya bəlkə də, gündəlik nitq vəziyyətləri insan ruhunun dərinliyini oxuya bilməyən hər hansı bir maşın üçün çox mürəkkəbdir.
Nitqin tanınmasından nə vaxt istifadə edilməlidir?
İndi demək olar ki, hər kəsin smartfonu və ya planşeti var. Nitqin tanınması bu cihazlarda ümumi xüsusiyyətdir. Onlar bir insanın nitqini hərəkətə çevirmək üçün istifadə olunur. Əgər nənənizə zəng etmək istəyirsinizsə, “Nənəmə zəng et” əmrini verməyiniz kifayətdir və smartfonunuz artıq kontakt siyahılarınıza daxil olmadan nömrəni yığır. Bu nitqin tanınmasıdır. Bunun başqa bir yaxşı nümunəsi Alexa və ya Siri-dir. Onların sistemlərində də bu xüsusiyyət var. Google sizə heç nə yazmadan səslə istənilən şeyi axtarmaq imkanı da verir.
Bəlkə indi bütün bunların necə işlədiyi ilə maraqlanırsınız. Yaxşı, onun işləməsi üçün mikrofonlar kimi sensorlar proqrama daxil edilməlidir ki, danışılan sözlərin səs dalğaları tanınsın, təhlil edilsin və rəqəmsal formata çevrilsin. Rəqəmsal məlumat daha sonra bir növ söz və ifadələr anbarında saxlanılan digər məlumatlarla müqayisə edilməlidir. Uyğunluq olduqda proqram təminatı əmri tanıya və ona uyğun hərəkət edə bilər.
Bu nöqtədə qeyd edilməli olan daha bir şey WER (söz xətası dərəcəsi) adlanır. Bu, səhv sayını sözlərin cəminə böldüyünüz bir düsturdur. Deməli, sadə dillə desək, bunun dəqiqliklə çox əlaqəsi var. Məqsəd, əlbəttə ki, aşağı WER-ə sahib olmaqdır, çünki bu, danışılan sözün transkripsiyasının daha dəqiq olması deməkdir.
Nitqin tanınması indi həmişə olduğu kimi tələb olunur. Əgər siz də şifahi sözü tutaq ki, qeydə alınmış audio fayldan mətnə çevirməlisinizsə, Gglot-a müraciət edə bilərsiniz. Biz ədalətli qiymətə dəqiq transkripsiya təklif edən transkripsiya xidməti təminatçısıyıq. Beləliklə, istifadəçi dostu veb saytımız vasitəsilə əlaqə saxlamaqdan çəkinməyin.