តួនាទីនៃភាពវៃឆ្លាតសិប្បនិម្មិត និងការរៀនម៉ាស៊ីននៅក្នុងការទទួលស្គាល់ការនិយាយ

តាំងពីយូរយារណាស់មកហើយ មនុស្សចង់និយាយជាមួយម៉ាស៊ីន។ ចាប់តាំងពីពួកគេចាប់ផ្តើមបង្កើតកុំព្យូទ័រមក អ្នកវិទ្យាសាស្ត្រ និងវិស្វករបានព្យាយាមបញ្ចូលការទទួលស្គាល់ការនិយាយទៅក្នុងដំណើរការ។ នៅឆ្នាំ 1962 ក្រុមហ៊ុន IBM បានណែនាំ Shoebox ដែលជាម៉ាស៊ីនសម្គាល់ការនិយាយដែលអាចធ្វើការគណនាគណិតវិទ្យាសាមញ្ញ។ ឧបករណ៍ច្នៃប្រឌិតថ្មីនេះបានទទួលស្គាល់ និងឆ្លើយតបទៅនឹងពាក្យនិយាយចំនួន 16 រួមទាំងលេខដប់ខ្ទង់ចាប់ពី "0" ដល់ "9"។ នៅពេលដែលលេខ និងពាក្យបញ្ជាដូចជា "បូក" "ដក" និង "សរុប" ត្រូវបាននិយាយ Shoebox បានណែនាំម៉ាស៊ីនបន្ថែមដើម្បីគណនា និងបោះពុម្ពចម្លើយចំពោះបញ្ហានព្វន្ធសាមញ្ញ។ ប្រអប់ស្បែកជើងត្រូវបានដំណើរការដោយការនិយាយចូលទៅក្នុងមីក្រូហ្វូន ដែលបំប្លែងសំឡេងទៅជាសំឡេងអគ្គិសនី។ សៀគ្វីវាស់បានចាត់ថ្នាក់កម្លាំងរុញច្រានទាំងនេះតាមប្រភេទផ្សេងៗនៃសំឡេង និងបានធ្វើឱ្យម៉ាស៊ីនបន្ថែមដែលភ្ជាប់មកជាមួយតាមរយៈប្រព័ន្ធបញ្ជូនត។

ជាមួយនឹងពេលវេលា បច្ចេកវិទ្យានេះបានអភិវឌ្ឍ ហើយសព្វថ្ងៃនេះ យើងជាច្រើននាក់តែងតែធ្វើអន្តរកម្មជាមួយកុំព្យូទ័រដោយសំឡេង។ ជំនួយការសំឡេងដែលពេញនិយមបំផុតនាពេលបច្ចុប្បន្ននេះគឺ Alexa ដោយ Amazon, Siri ដោយ Apple, Google Assistant និង Cortana ដោយ Microsoft ។ ជំនួយការទាំងនេះអាចបំពេញភារកិច្ច ឬសេវាកម្មសម្រាប់បុគ្គលដោយផ្អែកលើពាក្យបញ្ជា ឬសំណួរ។ ពួកគេអាចបកស្រាយការនិយាយរបស់មនុស្ស និងឆ្លើយតបតាមរយៈសម្លេងសំយោគ។ អ្នកប្រើប្រាស់អាចសួរសំណួរជំនួយការរបស់ពួកគេ គ្រប់គ្រងឧបករណ៍ស្វ័យប្រវត្តិនៅផ្ទះ និងការចាក់សារថ្មីតាមរយៈសំឡេង និងគ្រប់គ្រងកិច្ចការមូលដ្ឋានផ្សេងទៀតដូចជា អ៊ីមែល បញ្ជីការងារត្រូវធ្វើ និងប្រតិទិនដោយប្រើពាក្យបញ្ជាពាក្យសំដី។ កាលណាយើងប្រើឧបករណ៍ដែលជំរុញដោយសំឡេងទាំងនេះកាន់តែច្រើន ពឹងផ្អែកលើបញ្ញាសិប្បនិម្មិត (AI) និងការរៀនម៉ាស៊ីន។

បញ្ញាសិប្បនិម្មិត (AI)

នៅពេលអ្នកនិយាយថា បញ្ញាសិប្បនិមិត្ត (AI) មនុស្សជាច្រើនប្រហែលជាគិតថាអ្នកកំពុងនិយាយអំពីរឿងប្រឌិតបែបវិទ្យាសាស្ត្រ ទោះបីជា AI បង្កប់នៅក្នុងជីវិតប្រចាំថ្ងៃរបស់យើងក៏ដោយ។ តាមពិតវាមានរាប់ទសវត្សរ៍មកហើយ។ ប៉ុន្តែការពិតគឺពិតជារឿងប្រឌិតបែបវិទ្យាសាស្ត្រដែលនៅដើមសតវត្ស ^ទី 20 បានស្គាល់សាធារណជនជាមួយនឹងមនុស្សយន្តដែលមានភាពវៃឆ្លាតសិប្បនិម្មិត។ នៅក្នុងទសវត្សរ៍ទី 50 គំនិតនៃ AI បានកើតឡើងកាន់តែច្រើនឡើងនៅក្នុងការផ្តោតអារម្មណ៍របស់អ្នកវិទ្យាសាស្ត្រ និងទស្សនវិទូ។ នៅពេលនោះ គណិតវិទូជនជាតិអង់គ្លេសវ័យក្មេង Alan Turing បានផ្តល់យោបល់ថា គ្មានហេតុផលដែលម៉ាស៊ីនមិនអាច (ដូចមនុស្សទេ) ដោះស្រាយបញ្ហា និងធ្វើការសម្រេចចិត្តដោយផ្អែកលើព័ត៌មានដែលមាន។ ប៉ុន្តែនៅពេលនោះ កុំព្យូទ័រមិនមានលទ្ធភាពនៃការទន្ទេញ ដែលជាគន្លឹះសម្រាប់ភាពវៃឆ្លាតនោះទេ។ អ្វីដែលពួកគេបានធ្វើគឺប្រតិបត្តិពាក្យបញ្ជា។ ប៉ុន្តែនៅតែ Alan Turing ដែលបានបង្កើតគោលដៅ និងចក្ខុវិស័យជាមូលដ្ឋាននៃបញ្ញាសិប្បនិម្មិត។

ត្រូវបានទទួលស្គាល់យ៉ាងទូលំទូលាយថាជាបិតារបស់ AI គឺលោក John McCarthy ដែលបានបង្កើតពាក្យថា បញ្ញាសិប្បនិម្មិត ។ សម្រាប់គាត់ AI គឺ "វិទ្យាសាស្ត្រ និងវិស្វកម្មនៃការបង្កើតម៉ាស៊ីនឆ្លាតវៃ"។ និយមន័យនេះត្រូវបានបង្ហាញនៅក្នុងសន្និសីទនៅមហាវិទ្យាល័យ Dartmouth ក្នុងឆ្នាំ 1956 ហើយវាបង្ហាញពីការចាប់ផ្តើមនៃការស្រាវជ្រាវ AI ។ ចាប់ពីពេលនោះមក AI រីកចម្រើន។

នៅក្នុងពិភពសម័យទំនើប បញ្ញាសិប្បនិម្មិតមានគ្រប់ទីកន្លែង។ វាកាន់តែមានប្រជាប្រិយភាព ដោយសារការកើនឡើងនៃបរិមាណទិន្នន័យ ក្បួនដោះស្រាយកម្រិតខ្ពស់ និងការកែលម្អថាមពលកុំព្យូទ័រ និងការផ្ទុក។ ភាគច្រើនកម្មវិធី AI ត្រូវបានភ្ជាប់ទៅនឹងកិច្ចការបញ្ញា។ យើងប្រើ AI សម្រាប់ការបកប្រែ វត្ថុ ការសម្គាល់មុខ និងការនិយាយ ការរកឃើញប្រធានបទ ការវិភាគរូបភាពវេជ្ជសាស្ត្រ ដំណើរការភាសាធម្មជាតិ ការត្រងបណ្តាញសង្គម ការលេងអុកជាដើម។

ការរៀនម៉ាស៊ីន

ការរៀនម៉ាស៊ីនគឺជាកម្មវិធីនៃបញ្ញាសិប្បនិមិត្ត ហើយវាសំដៅទៅលើប្រព័ន្ធដែលមានសមត្ថភាពកែលម្អពីបទពិសោធន៍ផ្ទាល់ខ្លួនរបស់ពួកគេ។ អ្វីដែលសំខាន់បំផុតនៅទីនេះគឺថាប្រព័ន្ធត្រូវដឹងពីរបៀបដើម្បីស្គាល់គំរូ។ ដើម្បីអាចធ្វើបានប្រព័ន្ធត្រូវតែទទួលបានការបណ្តុះបណ្តាល៖ ក្បួនដោះស្រាយត្រូវបានផ្តល់ទិន្នន័យដ៏ច្រើន ដូច្នេះនៅពេលខ្លះវាអាចកំណត់អត្តសញ្ញាណគំរូ។ គោលដៅគឺដើម្បីអនុញ្ញាតឱ្យកុំព្យូទ័ររៀនដោយស្វ័យប្រវត្តិដោយគ្មានអន្តរាគមន៍ ឬជំនួយពីមនុស្ស។

នៅពេលនិយាយអំពីការរៀនម៉ាស៊ីន វាមានសារៈសំខាន់ណាស់ក្នុងការនិយាយអំពីការរៀនស៊ីជម្រៅ។ ចូរចាប់ផ្តើមដោយនិយាយថាឧបករណ៍សំខាន់មួយដែលត្រូវបានប្រើប្រាស់នៅក្នុងការរៀនសូត្រជ្រៅគឺបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត។ ទាំងនេះគឺជាក្បួនដោះស្រាយដែលត្រូវបានបំផុសគំនិតដោយរចនាសម្ព័ន្ធ និងមុខងារនៃខួរក្បាល ទោះបីជាពួកគេមានទំនោរទៅជាឋិតិវន្ត និងជានិមិត្តសញ្ញា ហើយមិនមែនប្លាស្ទិក និងអាណាឡូកដូចខួរក្បាលជីវសាស្ត្រក៏ដោយ។ ដូច្នេះ ការរៀនស៊ីជម្រៅ គឺជាទម្រង់ឯកទេសនៃការរៀនម៉ាស៊ីនដោយផ្អែកលើបណ្តាញសរសៃប្រសាទសិប្បនិម្មិត ដែលគោលដៅគឺដើម្បីចម្លងវិធីដែលមនុស្សរៀន ហើយនេះជាឧបករណ៍ដ៏ល្អមួយដើម្បីស្វែងរកគំរូដែលច្រើនហួសហេតុពេកសម្រាប់អ្នកសរសេរកម្មវិធីដើម្បីបង្រៀនម៉ាស៊ីន។ ក្នុងរយៈពេលប៉ុន្មានឆ្នាំចុងក្រោយនេះ មានការនិយាយច្រើនអំពីរថយន្តគ្មានអ្នកបើកបរ និងរបៀបដែលពួកគេអាចផ្លាស់ប្តូរជីវិតរបស់យើង។ បច្ចេកវិទ្យាសិក្សាជ្រៅជ្រះគឺជាគន្លឹះនៅទីនេះ ព្រោះវាជួយកាត់បន្ថយគ្រោះថ្នាក់ដោយធ្វើឱ្យរថយន្តអាចសម្គាល់អ្នកថ្មើរជើងពីឧបករណ៍ពន្លត់អគ្គីភ័យ ឬសម្គាល់ភ្លើងក្រហម។ បច្ចេកវិទ្យាសិក្សាជ្រៅជ្រះក៏ដើរតួយ៉ាងសំខាន់ក្នុងការគ្រប់គ្រងដោយសំឡេងនៅក្នុងឧបករណ៍ដូចជា ថេប្លេត ទូរសព្ទ ទូរទឹកកក ទូរទស្សន៍ ជាដើម។ ក្រុមហ៊ុន E-commerce តែងតែប្រើបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតជាប្រព័ន្ធត្រងដែលព្យាយាមទស្សន៍ទាយ និងបង្ហាញរបស់ដែលអ្នកប្រើប្រាស់ចង់ធ្វើ។ ទិញ។ បច្ចេកវិទ្យាសិក្សាជ្រៅជ្រះក៏ត្រូវបានប្រើក្នុងវិស័យវេជ្ជសាស្រ្ដ។ វាជួយអ្នកស្រាវជ្រាវជំងឺមហារីកឱ្យរកឃើញកោសិកាមហារីកដោយស្វ័យប្រវត្តិ ហើយដូច្នេះតំណាងឱ្យការរីកចម្រើនយ៉ាងខ្លាំងក្នុងការព្យាបាលជំងឺមហារីក។

ការទទួលស្គាល់ការនិយាយ

បច្ចេកវិទ្យាសម្គាល់ការនិយាយបម្រើដើម្បីកំណត់ពាក្យ និងឃ្លាបង្កើតជាភាសានិយាយ និងបំប្លែងពួកវាទៅជាទម្រង់ដែលអាចអានបានសម្រាប់ម៉ាស៊ីន។ ខណៈពេលដែលកម្មវិធីមួយចំនួនអាចកំណត់អត្តសញ្ញាណបានត្រឹមតែចំនួនឃ្លាមួយចំនួនប៉ុណ្ណោះ កម្មវិធីទទួលស្គាល់ការនិយាយដែលស្មុគ្រស្មាញជាងនេះខ្លះអាចបកស្រាយការនិយាយធម្មជាតិបាន។

តើមានឧបសគ្គដើម្បីជំនះទេ?

ខណៈពេលដែលមានភាពងាយស្រួល បច្ចេកវិទ្យាសម្គាល់ការនិយាយមិនតែងតែដំណើរការរលូននោះទេ ហើយវានៅតែមានបញ្ហាមួយចំនួនដែលត្រូវដោះស្រាយ ដោយសារវាត្រូវបានអភិវឌ្ឍជាបន្តបន្ទាប់។ បញ្ហាដែលអាចកើតឡើងអាចរួមបញ្ចូលក្នុងចំនោមបញ្ហាផ្សេងៗទៀត៖ គុណភាពនៃការថតអាចមិនគ្រប់គ្រាន់ វាអាចមានសំលេងរំខាននៅក្នុងផ្ទៃខាងក្រោយដែលធ្វើឱ្យពិបាកក្នុងការយល់អ្នកនិយាយ ហើយអ្នកនិយាយក៏អាចមានការសង្កត់សំឡេងខ្លាំង ឬគ្រាមភាសាដែរ (តើអ្នក ធ្លាប់ឮគ្រាមភាសា Geordie ទេ?) ។ល។

ការទទួលស្គាល់ការនិយាយមានការអភិវឌ្ឍន៍ច្រើន ប៉ុន្តែវានៅឆ្ងាយពីភាពល្អឥតខ្ចោះនៅឡើយ។ មិនមែនទាំងអស់គ្រាន់តែជាពាក្យប៉ុណ្ណោះទេ ម៉ាស៊ីននៅតែមិនអាចធ្វើរឿងជាច្រើនដែលមនុស្សអាចធ្វើបាន៖ ពួកគេមិនអាចអានភាសាកាយវិការ ឬស្គាល់សម្លេងដ៏ស្រើបស្រាលនៅក្នុងសំឡេងរបស់នរណាម្នាក់។ មនុស្សជារឿយៗមិនបញ្ចេញសំឡេងគ្រប់ពាក្យតាមរបៀបត្រឹមត្រូវទេ ហើយពួកគេមានទំនោរកាត់ពាក្យខ្លះឱ្យខ្លី។ ជាឧទាហរណ៍ នៅពេលនិយាយលឿន និងក្រៅផ្លូវការ អ្នកនិយាយភាសាអង់គ្លេសដើមកំណើតជាញឹកញាប់បញ្ចេញសំឡេង "ទៅ" ដូចជា "gonna" ។ ទាំងអស់ខាងលើនេះបង្កជាឧបសគ្គដល់ម៉ាស៊ីនដែលពួកគេព្យាយាមជម្នះ ប៉ុន្តែនៅមានផ្លូវវែងឆ្ងាយនៅពីមុខពួកគេ។ វាជាការសំខាន់ក្នុងការគូសបញ្ជាក់ថា នៅពេលដែលទិន្នន័យកាន់តែច្រើនត្រូវបានផ្តល់ចំណីដល់ក្បួនដោះស្រាយជាក់លាក់ទាំងនោះ។ បញ្ហាប្រឈមហាក់ដូចជាថយចុះ។ អនាគតនៃការទទួលស្គាល់ការនិយាយដោយស្វ័យប្រវត្តិហាក់ដូចជាភ្លឺស្វាង។

ចំណុចប្រទាក់អ្នកប្រើដែលដំណើរការដោយសំឡេងកំពុងមានកាន់តែច្រើនឡើង និងពេញនិយមនៅក្នុងគ្រួសារ។ វាថែមទាំងអាចក្លាយជាវេទិកាបន្ទាប់នៅក្នុងបច្ចេកវិទ្យា។

Gglot ផ្តល់នូវការទទួលស្គាល់ការនិយាយដោយស្វ័យប្រវត្តិក្នុងទម្រង់នៃសេវាកម្មចម្លងដោយស្វ័យប្រវត្តិ - យើងបំប្លែងសុន្ទរកថាទៅជាអត្ថបទ។ សេវាកម្មរបស់យើងគឺសាមញ្ញក្នុងការប្រើប្រាស់ វានឹងមិនចំណាយប្រាក់ច្រើនទេ ហើយវានឹងរួចរាល់យ៉ាងឆាប់រហ័ស!

តួនាទីនៃភាពវៃឆ្លាតសិប្បនិម្មិត និងការរៀនម៉ាស៊ីននៅក្នុងការទទួលស្គាល់ការនិយាយ

បង្កើត

ប្រៀបធៀប

ផ្លូវច្បាប់

ប្រកាសដែលពាក់ព័ន្ធ

បង្កើត

ប្រៀបធៀប

ផ្លូវច្បាប់