Ხელოვნური ინტელექტისა და მანქანათმცოდნეობის როლი მეტყველების ამოცნობაში

Ხელოვნური ინტელექტისა და მანქანათმცოდნეობის როლი მეტყველების ამოცნობაში

Დიდი ხნის განმავლობაში ადამიანებს სურდათ მანქანებთან საუბარი. მას შემდეგ, რაც მათ დაიწყეს კომპიუტერების შექმნა, მეცნიერები და ინჟინრები ცდილობდნენ ამ პროცესში მეტყველების ამოცნობა შეეტანათ. 1962 წელს IBM-მა წარმოადგინა Shoebox, მეტყველების ამომცნობი მანქანა, რომელსაც შეეძლო მარტივი მათემატიკური გამოთვლების გაკეთება. ამ ინოვაციურმა მოწყობილობამ ამოიცნო და უპასუხა 16 წარმოთქმულ სიტყვას, მათ შორის ათი ციფრი "0"-დან "9"-მდე. როდესაც ითქვა რიცხვი და ბრძანება სიტყვები, როგორიცაა „პლუს“, „მინუს“ და „სულ“, Shoebox-მა დაავალა დამატების მანქანას გამოეთვალა და დაბეჭდა პასუხები მარტივი არითმეტიკული ამოცანების შესახებ. Shoebox მუშაობდა მიკროფონში საუბრით, რომელიც ხმოვან ხმებს ელექტრო იმპულსებად გარდაქმნიდა. საზომი წრე კლასიფიცირებდა ამ იმპულსებს სხვადასხვა ტიპის ბგერების მიხედვით და ააქტიურებდა მიმაგრებულ დამამატებელ მანქანას სარელეო სისტემის მეშვეობით.

Დროთა განმავლობაში ეს ტექნოლოგია განვითარდა და დღეს ბევრი ჩვენგანი რეგულარულად ურთიერთობს კომპიუტერებთან ხმით. დღეს ყველაზე პოპულარული ხმოვანი ასისტენტებია Alexa by Amazon, Siri by Apple, Google Assistant და Cortana by Microsoft. ამ ასისტენტებს შეუძლიათ შეასრულონ დავალებები ან მომსახურება ინდივიდისთვის ბრძანებების ან კითხვების საფუძველზე. მათ შეუძლიათ ადამიანის მეტყველების ინტერპრეტაცია და რეაგირება სინთეზირებული ხმების საშუალებით. მომხმარებლებს შეუძლიათ თავიანთ ასისტენტებს დაუსვან კითხვები, აკონტროლონ სახლის ავტომატიზაციის მოწყობილობები და მედიის დაკვრა ხმის საშუალებით და მართონ სხვა ძირითადი ამოცანები, როგორიცაა ელფოსტა, სამუშაოების სიები და კალენდრები სიტყვიერი ბრძანებებით. რაც უფრო მეტს ვიყენებთ ამ ხმით მომუშავე მოწყობილობებს, მით უფრო გავხდებით. დამოკიდებულია ხელოვნურ ინტელექტზე (AI) და მანქანათმცოდნეობაზე.

Ხელოვნური ინტელექტი (AI)

1

Როდესაც თქვენ ამბობთ ხელოვნურ ინტელექტს (AI), ბევრმა შეიძლება იფიქროს, რომ თქვენ საუბრობთ სამეცნიერო ფანტასტიკაზე, მიუხედავად იმისა, რომ ხელოვნური ინტელექტი ძალზედ არის ჩართული ჩვენს ყოველდღიურ ცხოვრებაში. სინამდვილეში, ეს იყო ათწლეულების განმავლობაში. მაგრამ სიმართლე ის არის, რომ მართლაც სამეცნიერო ფანტასტიკა იყო, რომელმაც მე -20 საუკუნის დასაწყისში საზოგადოებას გააცნო ხელოვნურად ინტელექტუალური ადამიანის მსგავსი რობოტები. 50-იან წლებში ხელოვნური ინტელექტის ცნებები უფრო და უფრო მოექცა მეცნიერთა და ფილოსოფოსთა ინტერესების ყურადღების ცენტრში. იმ დროს ახალგაზრდა ბრიტანელმა მათემატიკოსმა ალან ტურინგმა თქვა, რომ არ არსებობს მიზეზი, რის გამოც მანქანებს არ შეეძლოთ (ისევე, როგორც ადამიანები) პრობლემების გადაჭრა და გადაწყვეტილებების მიღება არსებული ინფორმაციის საფუძველზე. მაგრამ იმ დროს კომპიუტერებს არ ჰქონდათ დამახსოვრების შესაძლებლობა, რაც დაზვერვის გასაღებია. მხოლოდ მათ გააკეთეს ბრძანებების შესრულება. მაგრამ მაინც, ალან ტურინგმა დაადგინა ხელოვნური ინტელექტის ფუნდამენტური მიზანი და ხედვა.

Საყოველთაოდ აღიარებული ხელოვნური ინტელექტის მამად არის ჯონ მაკკარტი, რომელმაც შექმნა ტერმინი ხელოვნური ინტელექტი . მისთვის AI იყო: „ინტელექტუალური მანქანების შექმნის მეცნიერება და ინჟინერია“. ეს განმარტება წარმოდგენილი იყო 1956 წელს დარტმუთის კოლეჯში გამართულ კონფერენციაზე და მან მიუთითა ხელოვნური ინტელექტის კვლევის დაწყებაზე. მას შემდეგ AI აყვავდა.

Თანამედროვე სამყაროში ხელოვნური ინტელექტი ყველგან არის გავრცელებული. ის უფრო პოპულარული გახდა მონაცემთა გაზრდილი მოცულობის, მოწინავე ალგორითმებისა და გამოთვლითი სიმძლავრისა და შენახვის გაუმჯობესების წყალობით. ძირითადად AI აპლიკაცია დაკავშირებულია ინტელექტუალურ ამოცანებთან. ჩვენ ვიყენებთ ხელოვნურ ინტელექტს თარგმნისთვის, საგნების, სახისა და მეტყველების ამოცნობისთვის, თემის ამოცნობისთვის, სამედიცინო გამოსახულების ანალიზისთვის, ბუნებრივი ენის დამუშავებისთვის, სოციალური ქსელების გაფილტვრისთვის, ჭადრაკის სათამაშოდ და ა.შ.

Მანქანათმცოდნეობა

Მანქანათმცოდნეობა არის ხელოვნური ინტელექტის გამოყენება და ის ეხება სისტემებს, რომლებსაც აქვთ საკუთარი გამოცდილებიდან გაუმჯობესების უნარი. აქ ყველაზე მნიშვნელოვანი ის არის, რომ სისტემამ უნდა იცოდეს როგორ ამოიცნოს შაბლონები. იმისათვის, რომ შეძლოს ამის გაკეთება, სისტემას სჭირდება ტრენინგი: ალგორითმი აწვდის დიდი რაოდენობით მონაცემებს, ასე რომ რაღაც მომენტში მას შეუძლია შაბლონების იდენტიფიცირება. მიზანია კომპიუტერებს საშუალება მისცენ ისწავლონ ავტომატურად ადამიანის ჩარევისა და დახმარების გარეშე.

Როდესაც ვსაუბრობთ მანქანურ სწავლებაზე, მნიშვნელოვანია აღინიშნოს ღრმა სწავლება. დავიწყოთ იმით, რომ ღრმა სწავლაში გამოყენებული ერთ-ერთი მთავარი ინსტრუმენტი ხელოვნური ნერვული ქსელებია. ეს არის ალგორითმები, რომლებიც შთაგონებულია ტვინის სტრუქტურითა და ფუნქციით, მიუხედავად იმისა, რომ ისინი სტატიკური და სიმბოლურია და არა პლასტიკური და ანალოგური, როგორც ბიოლოგიური ტვინი. ასე რომ, ღრმა სწავლება არის მანქანათმცოდნეობის სპეციალიზებული ფორმა, რომელიც დაფუძნებულია ხელოვნურ ნერვულ ქსელზე, რომლის მიზანია გაიმეოროს ადამიანების სწავლა და ეს არის შესანიშნავი ინსტრუმენტი იმ შაბლონების მოსაძებნად, რომლებიც ძალიან მრავალრიცხოვანია პროგრამისტისთვის, რომ ასწავლოს მანქანა. ბოლო ორი წლის განმავლობაში ბევრს ლაპარაკობდნენ უმართავ მანქანებზე და იმაზე, თუ როგორ შეცვლიდნენ მათ ჩვენი ცხოვრება. ღრმა სწავლის ტექნოლოგია აქ მთავარია, რადგან ის ამცირებს ავარიებს, რაც საშუალებას აძლევს მანქანას განასხვავოს ფეხით მოსიარულე სახანძრო ჰიდრანტიდან ან ამოიცნოს წითელი შუქი. ღრმა სწავლის ტექნოლოგია ასევე თამაშობს მთავარ როლს ხმის კონტროლში მოწყობილობებში, როგორიცაა ტაბლეტები, ტელეფონები, მაცივრები, ტელევიზორები და ა.შ. ელექტრონული კომერციის კომპანიები ხშირად იყენებენ ხელოვნურ ნერვულ ქსელებს, როგორც ფილტრაციის სისტემას, რომელიც ცდილობს წინასწარ განსაზღვროს და აჩვენოს ის ელემენტები, რომლებიც მომხმარებელს სურს. ყიდვა. ღრმა სწავლის ტექნოლოგია ასევე გამოიყენება სამედიცინო სფეროში. ის ეხმარება კიბოს მკვლევარებს ავტომატურად აღმოაჩინონ კიბოს უჯრედები და ამით წარმოადგენს უზარმაზარ პროგრესს კიბოს მკურნალობაში.

Სიტყვის აღიარება

Მეტყველების ამოცნობის ტექნოლოგია ემსახურება სალაპარაკო ენის სიტყვებისა და ფრაზების იდენტიფიცირებას და მათი გადაქცევას აპარატისთვის წასაკითხ ფორმატში. მიუხედავად იმისა, რომ ზოგიერთ პროგრამას შეუძლია მხოლოდ ფრაზების შეზღუდული რაოდენობის იდენტიფიცირება, მეტყველების ამოცნობის უფრო დახვეწილ პროგრამას შეუძლია ბუნებრივი მეტყველების გაშიფვრა.

Არის თუ არა დაბრკოლებები დასაძლევი?

Მიუხედავად იმისა, რომ მოსახერხებელია, მეტყველების ამოცნობის ტექნოლოგია ყოველთვის არ მიდის შეუფერხებლად და მას ჯერ კიდევ აქვს რამდენიმე პრობლემა, რადგან ის მუდმივად ვითარდება. პრობლემები, რომლებიც შეიძლება წარმოიშვას, შეიძლება მოიცავდეს შემდეგს: ჩანაწერის ხარისხი შეიძლება იყოს არაადეკვატური, შეიძლება იყოს ხმები ფონზე, რაც ართულებს მოსაუბრეს გაგებას, ასევე მოსაუბრეს შეიძლება ჰქონდეს მართლაც ძლიერი აქცენტი ან დიალექტი (ხომ არ გსმენიათ ოდესმე გეორდის დიალექტი?) და ა.შ.

Მეტყველების ამოცნობა საკმაოდ განვითარდა, მაგრამ ის ჯერ კიდევ შორს არის სრულყოფილისგან. ყველაფერი მხოლოდ სიტყვებს არ ეხება, მანქანას ჯერ კიდევ არ შეუძლია ბევრი რამის გაკეთება, რაც ადამიანებს შეუძლიათ: მათ არ შეუძლიათ სხეულის ენის წაკითხვა ან სხვისი ხმის სარკასტული ტონის ამოცნობა. ადამიანები ხშირად არ წარმოთქვამენ ყველა სიტყვას სწორად და ისინი ამცირებენ ზოგიერთ სიტყვას. მაგალითად, სწრაფად და არაფორმალურად საუბრისას, მშობლიური ინგლისურენოვანი ხშირად წარმოთქვამენ "going to"-ს, როგორც "gonna". ყოველივე ზემოთქმული, მანქანებს უქმნის დაბრკოლებებს, რომელთა გადალახვასაც ისინი ცდილობენ, მაგრამ მათ წინ ჯერ კიდევ დიდი გზაა. მნიშვნელოვანია ხაზგასმით აღვნიშნოთ, რომ რაც უფრო მეტი მონაცემი მიეწოდება კონკრეტულ ალგორითმებს; როგორც ჩანს, გამოწვევები მცირდება. მეტყველების ავტომატური ამოცნობის მომავალი ნათელია.

Ხმოვანი მომხმარებლის ინტერფეისები სულ უფრო ხელმისაწვდომი და პოპულარული ხდება ოჯახებში. ის შეიძლება გახდეს შემდეგი პლატფორმა ტექნოლოგიაში.

Gglot გთავაზობთ მეტყველების ავტომატიზირებულ ამოცნობას ავტომატური ტრანსკრიფციის სერვისების სახით - ჩვენ ვცვლით გამოსვლებს ტექსტად. ჩვენი სერვისი მარტივი გამოსაყენებელია, ძვირი არ დაგიჯდებათ და სწრაფად გაკეთდება!