Nitqin tanınmasında süni intellektin və maşın öyrənmənin rolu
Nitqin tanınmasında süni intellektin və maşın öyrənmənin rolu
Uzun müddət insanlar maşınlarla danışa bilmək istəyirdilər. Alim və mühəndislər kompüterlər yaratmağa başlayandan bəri nitqin tanınmasını prosesə daxil etməyə çalışıblar. 1962-ci ildə IBM sadə riyazi hesablamalar apara bilən nitqin tanınması maşını olan Shoebox-u təqdim etdi. Bu innovativ cihaz “0”-dan “9”-a qədər olan on rəqəm daxil olmaqla 16 danışıq sözü tanıdı və cavab verdi. “Artı”, “mənfi” və “cəmi” kimi bir ədəd və əmr sözləri deyildikdə, Shoebox sadə arifmetik məsələlərə cavabları hesablamaq və çap etmək üçün əlavə maşına göstəriş verdi. Shoebox səs səslərini elektrik impulslarına çevirən mikrofona danışaraq idarə olunurdu. Bir ölçmə sxemi bu impulsları müxtəlif səs növlərinə görə təsnif etdi və bir rele sistemi vasitəsilə əlavə edilmiş əlavə maşını işə saldı.
Vaxt keçdikcə bu texnologiya inkişaf etdi və bu gün bir çoxumuz müntəzəm olaraq kompüterlərlə səslə əlaqə saxlayırıq. Bu gün ən populyar səs köməkçiləri Amazon tərəfindən Alexa, Apple tərəfindən Siri, Google Assistant və Microsoft tərəfindən Cortana-dır. Bu köməkçilər əmrlər və ya suallar əsasında fərd üçün tapşırıq və ya xidmətləri yerinə yetirə bilər. Onlar insan nitqini şərh edə və sintez edilmiş səslər vasitəsilə cavab verə bilirlər. İstifadəçilər öz köməkçilərinə suallar verə, ev avtomatlaşdırma cihazlarına və səs vasitəsilə medianın oxudulmasına nəzarət edə və şifahi əmrlərlə e-poçt, görüləcək işlər siyahıları və təqvimlər kimi digər əsas vəzifələri idarə edə bilərlər. Bu səslə idarə olunan cihazlardan nə qədər çox istifadə etsək, bir o qədər çox oluruq. süni intellektdən (AI) və maşın öyrənməsindən asılıdır.
Süni intellekt (AI)
Süni intellekt (AI) dedikdə, bir çox insanlar süni intellektin gündəlik həyatımıza çox yerləşdiyinə baxmayaraq, elmi fantastika haqqında danışdığınızı düşünə bilər. Əslində, bu, onilliklərdir. Ancaq həqiqət budur ki, 20- ci əsrin əvvəllərində süni intellektli insana bənzər robotlarla ictimaiyyəti tanış edən elmi fantastika idi. 50-ci illərdə süni intellekt anlayışları getdikcə daha çox elm adamlarının və filosofların marağına səbəb oldu. O dövrdə gənc britaniyalı riyaziyyatçı Alan Turinq, maşınların (eynilə insanlar kimi) problemləri həll edə bilməməsi və mövcud məlumatlara əsaslanaraq qərarlar qəbul edə bilməməsinin heç bir səbəbi olmadığını təklif etdi. Lakin o dövrdə kompüterlərin zəka üçün əsas olan əzbərləmək imkanı yox idi. Onların etdikləri yalnız əmrləri yerinə yetirmək idi. Ancaq yenə də süni intellektin əsas məqsədini və vizyonunu quran Alan Turinq idi.
Süni intellekt termininin müəllifi Con Makkarti süni intellektin atası kimi geniş tanınır. Onun üçün süni intellekt “ağıllı maşınların yaradılması elmi və mühəndisliyi” idi. Bu tərif 1956-cı ildə Dartmut Kollecində keçirilən konfransda təqdim edildi və bu, süni intellekt tədqiqatının başlanğıcını göstərdi. O vaxtdan AI inkişaf etdi.
Müasir dünyada süni intellekt hər yerdə mövcuddur. Artan məlumat həcmi, qabaqcıl alqoritmlər və hesablama gücü və saxlama sahəsində təkmilləşdirmələr sayəsində daha populyarlaşdı. Əsasən AI tətbiqi intellektual tapşırıqlarla əlaqələndirilir. Tərcümə, obyekt, üz və nitqin tanınması, mövzu aşkarlanması, tibbi təsvirin təhlili, təbii dilin işlənməsi, sosial şəbəkələrin filtrasiyası, şahmat oyunu və s. üçün süni intellektdən istifadə edirik.
Maşın öyrənməsi
Maşın öyrənməsi süni intellektin tətbiqidir və bu, öz təcrübələrindən təkmilləşdirmək qabiliyyətinə malik sistemlərə aiddir. Burada ən vacib şey sistemin nümunələri necə tanıyacağını bilməsi lazımdır. Bunu etmək üçün sistemin öyrədilməsi lazımdır: alqoritm böyük həcmdə məlumatları qidalandırır, ona görə də müəyyən bir nöqtədə nümunələri müəyyən edə bilir. Məqsəd kompüterlərin insan müdaxiləsi və ya köməyi olmadan avtomatik öyrənməsinə imkan yaratmaqdır.
Maşın öyrənməsi haqqında danışarkən dərin öyrənməni qeyd etmək vacibdir. Başlayaq ki, dərin öyrənmədə istifadə olunan əsas vasitələrdən biri süni neyron şəbəkələridir. Bunlar beynin strukturu və funksiyasından ilhamlanan alqoritmlərdir, baxmayaraq ki, onlar bioloji beyin kimi plastik və analoq deyil, statik və simvolik olmağa meyllidirlər. Beləliklə, dərin öyrənmə süni neyron şəbəkəsinə əsaslanan maşın öyrənməsinin ixtisaslaşdırılmış formasıdır, məqsədi insanların öyrənmə üsulunu təkrarlamaqdır və bu, bir proqramçının maşını öyrətmək üçün çox sayda nümunələri tapmaq üçün əla vasitə kimi xidmət edir. Son bir neçə ildə sürücüsüz avtomobillər və onların həyatımızı necə dəyişdirə biləcəyi haqqında çox danışılır. Dərin öyrənmə texnologiyası burada əsasdır, çünki o, avtomobilə piyadanı yanğın hidrantından ayırmaq və ya qırmızı işığı tanımaq imkanı verməklə qəzaları azaldır. Dərin öyrənmə texnologiyası həmçinin planşetlər, telefonlar, soyuducular, televizorlar və s. kimi cihazlarda səslə idarə olunmasında əsas rol oynayır. Elektron ticarət şirkətləri tez-tez süni neyron şəbəkələrindən istifadəçinin görmək istədiyi elementləri proqnozlaşdırmağa və göstərməyə çalışan filtrləmə sistemi kimi istifadə edirlər. almaq. Dərin öyrənmə texnologiyasından tibb sahəsində də istifadə olunur. O, xərçəng tədqiqatçılarına xərçəng hüceyrələrini avtomatik aşkarlamağa kömək edir və bununla da xərçəngin müalicəsində böyük irəliləyişi təmsil edir.
Nitqin tanınması
Nitqin tanınması texnologiyası danışıq dilindən söz və ifadələri müəyyən etməyə və onları maşın üçün oxuna bilən formata çevirməyə xidmət edir. Bəzi proqramlar yalnız məhdud sayda ifadələri müəyyən edə bilsə də, bəzi daha təkmil nitqin tanınması proqramları təbii nitqi deşifrə edə bilər.
Aradan qaldırılması üçün maneələr varmı?
Rahat olsa da, nitqin tanınması texnologiyası həmişə rəvan getmir və davamlı olaraq inkişaf etdirildiyi üçün hələ də həll edilməli bir neçə problemi var. Yarana biləcək problemlər digərləri arasında aşağıdakıları əhatə edə bilər: yazının keyfiyyəti qeyri-adekvat ola bilər, fonda natiqin başa düşülməsini çətinləşdirən səslər ola bilər, həmçinin natiqin həqiqətən güclü vurğu və ya ləhcəsi ola bilər (siz? heç Geordie dialektini eşitmisiniz?) və s.
Nitqin tanınması kifayət qədər inkişaf edib, lakin hələ də mükəmməl olmaqdan uzaqdır. Hər şey yalnız sözlərdən ibarət deyil, maşın hələ də insanların edə biləcəyi bir çox şeyi edə bilmir: bədən dilini oxuya bilmir və ya birinin səsindəki istehzalı tonu tanıya bilmir. İnsanlar çox vaxt hər sözü düzgün tələffüz etmirlər və bəzi sözləri qısaltmağa meyllidirlər. Məsələn, sürətli və qeyri-rəsmi danışarkən doğma ingiliscə danışanlar çox vaxt “going to” tələffüzünü “gonna” kimi tələffüz edirlər. Yuxarıda göstərilənlərin hamısı dəf etməyə çalışdıqları maşınlar üçün maneələrə səbəb olur, lakin onların qarşısında hələ uzun bir yol var. Bu xüsusi alqoritmlərə getdikcə daha çox məlumat verildiyini vurğulamaq vacibdir; çətinliklər azalır. Avtomatlaşdırılmış nitqin tanınmasının gələcəyi parlaq görünür.
Səslə işləyən istifadəçi interfeysləri ev təsərrüfatlarında getdikcə daha çox əlçatan olur və populyarlaşır. Hətta texnologiyada növbəti platforma ola bilər.
Gglot avtomatlaşdırılmış transkripsiya xidmətləri şəklində avtomatlaşdırılmış nitqin tanınmasını təklif edir – biz çıxışları mətnə çeviririk. Xidmətimizdən istifadə etmək asandır, sizə çox xərc çəkməyəcək və tez bir zamanda həyata keçiriləcək!