Сөйлеуді танудағы жасанды интеллект пен машиналық оқытудың рөлі
Сөйлеуді танудағы жасанды интеллект пен машиналық оқытудың рөлі
Ұзақ уақыт бойы адамдар машиналармен сөйлесу мүмкіндігін алғысы келді. Ғалымдар мен инженерлер компьютерлерді құрастыра бастағаннан бері сөйлеуді тануды процеске енгізуге тырысты. 1962 жылы IBM компаниясы қарапайым математикалық есептеулерді жасай алатын сөзді тану құрылғысы Shoebox-ты ұсынды. Бұл инновациялық құрылғы 16 ауызша сөзді, оның ішінде «0» мен «9» арасындағы он цифрды танып, жауап берді. «Плюс», «минус» және «жалпы» сияқты сан және команда сөздері айтылғанда, Shoebox қарапайым арифметикалық есептерге жауаптарды есептеу және басып шығару үшін қосу машинасына нұсқау берді. Shoebox дауыстық дыбыстарды электрлік импульстарға түрлендіретін микрофонмен сөйлесу арқылы жұмыс істеді. Өлшеу тізбегі бұл импульстарды дыбыстардың әртүрлі түрлеріне қарай жіктеп, релелік жүйе арқылы қосылған қосу машинасын іске қосты.
Уақыт өте келе бұл технология дамыды және бүгінде көпшілігіміз компьютерлермен үнемі дауыспен әрекеттесеміз. Бүгінгі таңда ең танымал дауыс көмекшілері - Amazon компаниясының Alexa, Apple компаниясының Siri, Google Assistant және Microsoft корпорациясының Cortana. Бұл көмекшілер командалар немесе сұрақтар негізінде жеке тұлға үшін тапсырмаларды немесе қызметтерді орындай алады. Олар адамның сөйлеуін түсіндіре алады және синтезделген дауыстар арқылы жауап бере алады. Пайдаланушылар көмекшілеріне сұрақтар қоя алады, үйдегі автоматтандыру құрылғыларын және медианы ойнатуды дауыс арқылы басқара алады және ауызша пәрмендер арқылы электрондық пошта, істер тізімдері және күнтізбелер сияқты басқа негізгі тапсырмаларды басқара алады. Осы дауыспен басқарылатын құрылғыларды неғұрлым көп пайдалансақ, соғұрлым біз соғұрлым көп боламыз. жасанды интеллектке (AI) және машиналық оқытуға тәуелді.
Жасанды интеллект (AI)
Жасанды интеллект (AI) деп айтқанда, көптеген адамдар AI біздің күнделікті өмірімізге өте енгізілген болса да, сізді ғылыми фантастика туралы айтып отыр деп ойлауы мүмкін. Шындығында, бұл ондаған жылдар бойы болды. Бірақ шындық, 20 - ғасырдың басында халықты жасанды интеллект адам тәрізді роботтармен таныстырған ғылыми фантастика болды. 50-жылдары интеллект туралы түсініктер ғалымдар мен философтардың назарына көбірек түсті. Сол кезде жас британдық математик Алан Тьюринг машиналардың (адамдар сияқты) есептерді шешуге және қолда бар ақпаратқа сүйене отырып шешім қабылдауына ешқандай себеп жоқ деп ұсынды. Бірақ ол кезде компьютерлерде интеллект үшін кілт болып табылатын есте сақтау мүмкіндігі болмады. Олар тек командаларды орындау болды. Дегенмен, жасанды интеллекттің негізгі мақсаты мен пайымдауын құрған Алан Тьюринг болды.
Жасанды интеллект терминін енгізген Джон Маккарти AI әкесі ретінде кеңінен танылды. Ол үшін AI: «интеллектуалды машиналар жасау ғылымы мен техникасы» болды. Бұл анықтама 1956 жылы Дартмут колледжінде өткен конференцияда ұсынылды және ол AI зерттеулерінің басталғанын көрсетті. Содан бері AI дамыды.
Қазіргі әлемде жасанды интеллект барлық жерде бар. Ол деректер көлемін ұлғайту, жетілдірілген алгоритмдер және есептеу қуаты мен сақтауды жақсартудың арқасында танымал болды. Негізінен AI қолданбасы интеллектуалды тапсырмаларға байланысты. Біз AI-ны аударма, нысанды, бет пен сөзді тану, тақырыпты анықтау, медициналық кескінді талдау, табиғи тілді өңдеу, әлеуметтік желіні сүзу, шахмат ойнау және т.б. үшін пайдаланамыз.
Машиналық оқыту
Машиналық оқыту - бұл жасанды интеллект қолданбасы және ол өз тәжірибесінен жақсарту мүмкіндігі бар жүйелерді білдіреді. Мұндағы ең маңыздысы жүйе үлгілерді тануды білуі керек. Мұны істеу үшін жүйені оқыту керек: алгоритм үлкен көлемдегі деректерді береді, сондықтан бір сәтте ол үлгілерді анықтай алады. Мақсат - компьютерлерге адамның араласуынсыз немесе көмегінсіз автоматты түрде үйренуге мүмкіндік беру.
Машиналық оқыту туралы айтқанда, терең білім туралы айту керек. Терең оқытуда қолданылатын негізгі құралдардың бірі жасанды нейрондық желілер екенін айтудан бастайық. Бұлар биологиялық ми сияқты пластикалық және аналогтық емес, статикалық және символдық сипатқа ие болса да, мидың құрылымы мен қызметінен шабыттандырылған алгоритмдер. Сонымен, терең оқыту - бұл жасанды нейрондық желіге негізделген машиналық оқытудың мамандандырылған түрі, оның мақсаты адамның үйрену әдісін қайталау және бұл бағдарламашы машинаны үйрету үшін тым көп үлгілерді табудың тамаша құралы болып табылады. Соңғы екі жылда жүргізушісіз көліктер және олар біздің өмірімізді қалай өзгерте алатыны туралы көп айтылды. Терең оқыту технологиясы мұнда кілт болып табылады, себебі ол көлікке жаяу жүргіншіні өрт гидрантынан ажыратуға немесе қызыл шамды тануға мүмкіндік беру арқылы жазатайым оқиғаларды азайтады. Терең оқыту технологиясы сонымен қатар планшеттер, телефондар, тоңазытқыштар, теледидарлар және т.б. құрылғыларда дауыспен басқаруда басты рөл атқарады. Электрондық коммерция компаниялары қолданушы көргісі келетін элементтерді болжауға және көрсетуге тырысатын сүзу жүйесі ретінде жасанды нейрондық желілерді жиі пайдаланады. сатып алу. Терең оқыту технологиясы медицина саласында да қолданылады. Бұл қатерлі ісік зерттеушілеріне рак клеткаларын автоматты түрде анықтауға көмектеседі және осылайша қатерлі ісік емдеуде үлкен прогресті білдіреді.
Сөйлеуді тану
Сөйлеуді тану технологиясы ауызекі тілдегі сөздер мен сөз тіркестерін анықтауға және оларды машина үшін оқылатын пішімге түрлендіруге қызмет етеді. Кейбір бағдарламалар сөз тіркестерінің шектеулі санын ғана анықтай алса, кейбір күрделі сөйлеуді тану бағдарламалары табиғи сөйлеуді шеше алады.
Еңсеруге болатын кедергілер бар ма?
Ыңғайлы болғанымен, сөйлеуді тану технологиясы әрдайым біркелкі бола бермейді және ол үздіксіз дамып келе жатқандықтан, оны шешуге болатын бірнеше мәселелер бар. Пайда болуы мүмкін мәселелерге мыналар жатады: жазбаның сапасы жеткіліксіз болуы мүмкін, фонда динамикті түсінуді қиындататын шулар болуы мүмкін, сонымен қатар спикердің акценті немесе диалектісі өте күшті болуы мүмкін (сіз бе? Geordie диалектісін естідіңіз бе?), т.б.
Сөйлеуді тану айтарлықтай дамыды, бірақ ол әлі де кемелден алыс. Барлығы тек сөзбен ғана шектелмейді, машина әлі де адамдар жасай алатын көп нәрсені істей алмайды: олар дене тілін оқи алмайды немесе біреудің дауысындағы саркастикалық реңкті тани алмайды. Адамдар көбінесе әр сөзді дұрыс айта бермейді және кейбір сөздерді қысқартуға бейім. Мысалы, жылдам және бейресми сөйлегенде, ағылшын тілінде сөйлейтіндер көбінесе «going to» деп «gonna» сияқты айтады. Жоғарыда айтылғандардың бәрі машиналар үшін олар еңсеруге тырысатын кедергілерді тудырады, бірақ олардың алдында әлі ұзақ жол бар. Бұл нақты алгоритмдерге көбірек деректер беріліп жатқанын атап өту маңызды; қиындықтар азайған сияқты. Автоматтандырылған сөйлеуді танудың болашағы жарқын сияқты.
Дауыспен жұмыс істейтін пайдаланушы интерфейстері үй шаруашылығында барған сайын қолжетімді және танымал бола бастады. Ол тіпті технологиядағы келесі платформаға айналуы мүмкін.
Gglot автоматтандырылған транскрипция қызметтері түрінде автоматтандырылған сөйлеуді тануды ұсынады – біз сөйлеуді мәтінге түрлендіреміз. Біздің қызметімізді пайдалану оңай, ол сізге көп шығынды қажет етпейді және ол тез орындалады!