ບົດບາດຂອງປັນຍາປະດິດ ແລະການຮຽນຮູ້ເຄື່ອງຈັກໃນການຮັບຮູ້ສຽງເວົ້າ

ບົດບາດຂອງປັນຍາປະດິດ ແລະການຮຽນຮູ້ເຄື່ອງຈັກໃນການຮັບຮູ້ສຽງເວົ້າ

ສໍາລັບເວລາດົນນານ, ປະຊາຊົນຕ້ອງການທີ່ຈະສາມາດສົນທະນາກັບເຄື່ອງຈັກ. ນັບຕັ້ງແຕ່ພວກເຂົາເລີ່ມຕົ້ນກໍ່ສ້າງຄອມພິວເຕີ, ນັກວິທະຍາສາດແລະວິສະວະກອນໄດ້ພະຍາຍາມລວມເອົາການຮັບຮູ້ສຽງເວົ້າເຂົ້າໃນຂະບວນການ. ໃນ​ປີ 1962, IBM ໄດ້​ນຳ​ສະ​ເໜີ Shoebox, ເຄື່ອງ​ຈຳ​ນວນ​ສຽງ​ເວົ້າ​ທີ່​ສາ​ມາດ​ຄິດ​ໄລ່​ທາງ​ຄະ​ນິດ​ສາດ​ແບບ​ງ່າຍ​ດາຍ. ອຸປະກອນນະວັດຕະກໍານີ້ຮັບຮູ້ແລະຕອບສະຫນອງຕໍ່ 16 ຄໍາເວົ້າ, ລວມທັງສິບຕົວເລກຈາກ "0" ຫາ "9." ເມື່ອຕົວເລກແລະຄໍາສັ່ງເຊັ່ນ "ບວກ", "ລົບ" ແລະ "ທັງຫມົດ" ຖືກເວົ້າ, Shoebox ໄດ້ແນະນໍາເຄື່ອງເພີ່ມເພື່ອຄິດໄລ່ແລະພິມຄໍາຕອບຕໍ່ບັນຫາເລກຄະນິດສາດທີ່ງ່າຍດາຍ. Shoebox ໄດ້ຖືກດໍາເນີນການໂດຍການເວົ້າເຂົ້າໄປໃນໄມໂຄໂຟນ, ເຊິ່ງປ່ຽນສຽງສຽງເຂົ້າໄປໃນແຮງກະຕຸ້ນໄຟຟ້າ. ວົງຈອນການວັດແທກຈັດປະເພດແຮງກະຕຸ້ນເຫຼົ່ານີ້ຕາມປະເພດຕ່າງໆຂອງສຽງ ແລະເປີດໃຊ້ເຄື່ອງເພີ່ມທີ່ຕິດຄັດມາຜ່ານລະບົບຣີເລ.

ເມື່ອເວລາຜ່ານໄປ, ເທັກໂນໂລຍີນີ້ພັດທະນາຂຶ້ນ ແລະໃນທຸກມື້ນີ້ພວກເຮົາຫຼາຍຄົນຕິດຕໍ່ພົວພັນກັບຄອມພິວເຕີດ້ວຍສຽງ. ຜູ້ຊ່ວຍສຽງທີ່ນິຍົມຫຼາຍທີ່ສຸດໃນມື້ນີ້ແມ່ນ Alexa ໂດຍ Amazon, Siri ໂດຍ Apple, Google Assistant ແລະ Cortana ໂດຍ Microsoft. ຜູ້ຊ່ວຍເຫຼົ່ານີ້ສາມາດປະຕິບັດວຽກງານຫຼືການບໍລິການສໍາລັບບຸກຄົນໂດຍອີງໃສ່ຄໍາສັ່ງຫຼືຄໍາຖາມ. ເຂົາເຈົ້າສາມາດຕີຄວາມໝາຍການປາກເວົ້າຂອງມະນຸດ ແລະຕອບສະໜອງຜ່ານສຽງສັງເຄາະ. ຜູ້ໃຊ້ສາມາດຖາມຄໍາຖາມຜູ້ຊ່ວຍຂອງເຂົາເຈົ້າ, ຄວບຄຸມອຸປະກອນອັດຕະໂນມັດໃນເຮືອນແລະການຫຼິ້ນມີເດຍຜ່ານສຽງ, ແລະຈັດການວຽກງານພື້ນຖານອື່ນໆເຊັ່ນ: ອີເມວ, ລາຍການທີ່ຕ້ອງເຮັດ, ແລະປະຕິທິນດ້ວຍຄໍາສັ່ງດ້ວຍຄໍາເວົ້າ. ຍິ່ງພວກເຮົາໃຊ້ອຸປະກອນທີ່ຂັບເຄື່ອນດ້ວຍສຽງເຫຼົ່ານີ້ພວກເຮົາກາຍເປັນຫຼາຍ ຂຶ້ນກັບປັນຍາປະດິດ (AI) ແລະການຮຽນຮູ້ເຄື່ອງຈັກ.

ປັນຍາປະດິດ (AI)

1

ໃນເວລາທີ່ທ່ານເວົ້າວ່າປັນຍາປະດິດ (AI), ຫຼາຍຄົນອາດຈະຄິດວ່າທ່ານກໍາລັງເວົ້າກ່ຽວກັບ fiction ວິທະຍາສາດ, ເຖິງແມ່ນວ່າ AI ຈະຝັງຢູ່ໃນຊີວິດປະຈໍາວັນຂອງພວກເຮົາຫຼາຍ. ໃນຄວາມເປັນຈິງ, ມັນເປັນເວລາຫຼາຍສິບປີແລ້ວ. ແຕ່ຄວາມຈິງແລ້ວ, ມັນເປັນເລື່ອງນິຍາຍວິທະຍາສາດແທ້ໆທີ່ໃນຕອນຕົ້ນຂອງສະຕະວັດ ທີ 20 ໄດ້ຮູ້ຈັກກັບສາທາລະນະຊົນກັບຫຸ່ນຍົນອັດສະລິຍະທີ່ຄ້າຍຄືມະນຸດ. ໃນຊຸມປີ 50, ແນວຄວາມຄິດຂອງ AI ໄດ້ເຂົ້າມາໃນຄວາມສົນໃຈຂອງນັກວິທະຍາສາດແລະນັກປັດຊະຍາຫຼາຍຂຶ້ນ. ໃນເວລານັ້ນນັກຄະນິດສາດຊາວອັງກິດ Alan Turing ແນະນໍາວ່າບໍ່ມີເຫດຜົນທີ່ເຄື່ອງຈັກບໍ່ສາມາດ (ຄືກັນກັບມະນຸດ) ແກ້ໄຂບັນຫາແລະການຕັດສິນໃຈໂດຍອີງໃສ່ຂໍ້ມູນທີ່ມີຢູ່. ແຕ່ໃນເວລານັ້ນ, ຄອມພິວເຕີບໍ່ມີຄວາມເປັນໄປໄດ້ຂອງການຈື່ຈໍາຊຶ່ງເປັນກຸນແຈສໍາລັບປັນຍາ. ທັງຫມົດທີ່ເຂົາເຈົ້າເຮັດແມ່ນຄໍາສັ່ງປະຕິບັດ. ຢ່າງໃດກໍຕາມ, ມັນແມ່ນ Alan Turing ຜູ້ທີ່ສ້າງເປົ້າຫມາຍພື້ນຖານແລະວິໄສທັດຂອງປັນຍາປະດິດ.

ຖືກຮັບຮູ້ຢ່າງກວ້າງຂວາງວ່າເປັນພໍ່ຂອງ AI ແມ່ນ John McCarthy ຜູ້ທີ່ສ້າງຄໍາວ່າ ປັນຍາປະດິດ . ສໍາລັບລາວ AI ແມ່ນ: "ວິທະຍາສາດແລະວິສະວະກໍາຂອງການສ້າງເຄື່ອງຈັກອັດສະລິຍະ". ຄໍານິຍາມນີ້ໄດ້ຖືກນໍາສະເຫນີຢູ່ໃນກອງປະຊຸມທີ່ວິທະຍາໄລ Dartmouth ໃນປີ 1956 ແລະມັນໄດ້ຊີ້ໃຫ້ເຫັນເຖິງການເລີ່ມຕົ້ນຂອງການຄົ້ນຄວ້າ AI. ຈາກ​ນັ້ນ​ມາ AI ຈະເລີນ​ຮຸ່ງ​ເຮືອງ.

ໃນໂລກທີ່ທັນສະໄຫມປັນຍາປະດິດແມ່ນຢູ່ທົ່ວທຸກແຫ່ງ. ມັນໄດ້ກາຍເປັນທີ່ນິຍົມຫລາຍຂຶ້ນຍ້ອນປະລິມານຂໍ້ມູນເພີ່ມຂຶ້ນ, ສູດການຄິດໄລ່ຂັ້ນສູງ, ແລະການປັບປຸງພະລັງງານຄອມພິວເຕີ້ແລະການເກັບຮັກສາ. ສ່ວນຫຼາຍແມ່ນຄໍາຮ້ອງສະຫມັກ AI ແມ່ນເຊື່ອມຕໍ່ກັບວຽກງານທາງປັນຍາ. ພວກເຮົາໃຊ້ AI ສໍາລັບການແປພາສາ, ວັດຖຸ, ການຮັບຮູ້ໃບຫນ້າແລະການປາກເວົ້າ, ການກວດຫາຫົວຂໍ້, ການວິເຄາະຮູບພາບທາງການແພດ, ການປຸງແຕ່ງພາສາທໍາມະຊາດ, ການກັ່ນຕອງເຄືອຂ່າຍສັງຄົມ, ການຫຼີ້ນຫມາກຮຸກແລະອື່ນໆ.

ການຮຽນຮູ້ເຄື່ອງຈັກ

ການຮຽນຮູ້ເຄື່ອງຈັກແມ່ນຄໍາຮ້ອງສະຫມັກຂອງປັນຍາປະດິດແລະມັນຫມາຍເຖິງລະບົບທີ່ມີຄວາມສາມາດໃນການປັບປຸງຈາກປະສົບການຂອງຕົນເອງ. ສິ່ງທີ່ສໍາຄັນທີ່ສຸດຢູ່ທີ່ນີ້ແມ່ນວ່າລະບົບຈໍາເປັນຕ້ອງຮູ້ວິທີການຮັບຮູ້ຮູບແບບຕ່າງໆ. ເພື່ອໃຫ້ສາມາດເຮັດໄດ້, ລະບົບຕ້ອງໄດ້ຮັບການຝຶກອົບຮົມ: ສູດການຄິດໄລ່ແມ່ນໃຫ້ຂໍ້ມູນຈໍານວນຫຼວງຫຼາຍ, ດັ່ງນັ້ນໃນບາງຈຸດມັນກໍ່ສາມາດກໍານົດຮູບແບບຕ່າງໆ. ເປົ້າ​ຫມາຍ​ແມ່ນ​ເພື່ອ​ໃຫ້​ຄອມ​ພິວ​ເຕີ​ໃນ​ການ​ຮຽນ​ຮູ້​ອັດ​ຕະ​ໂນ​ມັດ​ໂດຍ​ບໍ່​ມີ​ການ​ແຊກ​ແຊງ​ຫຼື​ການ​ຊ່ວຍ​ເຫຼືອ​ຈາກ​ມະ​ນຸດ​.

ໃນເວລາທີ່ເວົ້າກ່ຽວກັບການຮຽນຮູ້ເຄື່ອງຈັກ, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະກ່າວເຖິງການຮຽນຮູ້ເລິກ. ໃຫ້ເລີ່ມຕົ້ນໂດຍການເວົ້າວ່າຫນຶ່ງໃນເຄື່ອງມືຕົ້ນຕໍທີ່ໃຊ້ໃນການຮຽນຮູ້ເລິກແມ່ນເຄືອຂ່າຍ neural ທຽມ. ເຫຼົ່ານີ້ແມ່ນ algorithms ທີ່ໄດ້ຮັບການດົນໃຈໂດຍໂຄງສ້າງແລະຫນ້າທີ່ຂອງສະຫມອງ, ເຖິງແມ່ນວ່າພວກເຂົາມີແນວໂນ້ມທີ່ຈະຄົງທີ່ແລະສັນຍາລັກ, ແລະບໍ່ແມ່ນພາດສະຕິກແລະການປຽບທຽບເຊັ່ນ: ສະຫມອງຊີວະພາບ. ດັ່ງນັ້ນ, ການຮຽນຮູ້ເລິກແມ່ນຮູບແບບສະເພາະຂອງການຮຽນຮູ້ເຄື່ອງຈັກໂດຍອີງໃສ່ເຄືອຂ່າຍ neural ທຽມ, ເປົ້າຫມາຍຂອງມັນແມ່ນເພື່ອເຮັດເລື້ມຄືນວິທີການຮຽນຮູ້ຂອງມະນຸດແລະນີ້ເຮັດຫນ້າທີ່ເປັນເຄື່ອງມືທີ່ດີທີ່ຈະຊອກຫາຮູບແບບທີ່ມີຈໍານວນຫລາຍເກີນໄປສໍາລັບນັກຂຽນໂປລແກລມທີ່ຈະສອນເຄື່ອງຈັກ. ໃນສອງສາມປີທີ່ຜ່ານມາມີການສົນທະນາຫຼາຍກ່ຽວກັບລົດທີ່ບໍ່ມີຄົນຂັບແລະວິທີທີ່ພວກເຂົາສາມາດປ່ຽນຊີວິດຂອງພວກເຮົາ. ເຕັກໂນໂລຊີການຮຽນຮູ້ເລິກແມ່ນກຸນແຈຢູ່ທີ່ນີ້, ເນື່ອງຈາກວ່າມັນຊ່ວຍຫຼຸດຜ່ອນອຸປະຕິເຫດໂດຍການເຮັດໃຫ້ລົດສາມາດຈໍາແນກຄົນຍ່າງທາງຈາກ hydrant ໄຟຫຼືຮັບຮູ້ໄຟແດງ. ເທກໂນໂລຍີການຮຽນຮູ້ເລິກຍັງມີບົດບາດຕົ້ນຕໍໃນການຄວບຄຸມສຽງໃນອຸປະກອນເຊັ່ນ: ແທັບເລັດ, ໂທລະສັບ, ຕູ້ເຢັນ, ໂທລະພາບແລະອື່ນໆ. ບໍລິສັດອີຄອມເມີຊມັກຈະໃຊ້ເຄືອຂ່າຍ neural ປອມເປັນລະບົບການກັ່ນຕອງທີ່ພະຍາຍາມຄາດຄະເນແລະສະແດງລາຍການທີ່ຜູ້ໃຊ້ຕ້ອງການ. ຊື້. ເຕັກໂນໂລຍີການຮຽນຮູ້ເລິກຍັງຖືກນໍາໃຊ້ໃນດ້ານການແພດ. ມັນຊ່ວຍໃຫ້ນັກຄົ້ນຄວ້າມະເຮັງສາມາດກວດຫາຈຸລັງມະເຮັງໂດຍອັດຕະໂນມັດ ແລະດັ່ງນັ້ນຈຶ່ງສະແດງເຖິງຄວາມຄືບໜ້າອັນໃຫຍ່ຫຼວງໃນການປິ່ນປົວມະເຮັງ.

ການຮັບຮູ້ສຽງເວົ້າ

ເທັກໂນໂລຍີການຮັບຮູ້ສຽງເວົ້າເຮັດໜ້າທີ່ເພື່ອລະບຸຄຳສັບ ແລະປະໂຫຍກປະກອບເປັນພາສາເວົ້າ ແລະປ່ຽນເປັນຮູບແບບທີ່ສາມາດອ່ານໄດ້ສຳລັບເຄື່ອງ. ໃນຂະນະທີ່ບາງໂຄງການສາມາດລະບຸພຽງແຕ່ຈໍານວນປະໂຫຍກທີ່ຈໍາກັດ, ບາງໂຄງການຮັບຮູ້ຄໍາເວົ້າທີ່ຊັບຊ້ອນສາມາດຖອດລະຫັດຄໍາເວົ້າທໍາມະຊາດ.

ມີ​ອຸ​ປະ​ສັກ​ທີ່​ຈະ​ເອົາ​ຊະ​ນະ​?

ໃນຂະນະທີ່ສະດວກ, ເທັກໂນໂລຍີການຮັບຮູ້ສຽງເວົ້າບໍ່ສະດວກສະເໝີໄປ ແລະມັນຍັງມີບາງບັນຫາທີ່ຕ້ອງແກ້ໄຂ, ຍ້ອນວ່າມັນພັດທະນາຢ່າງຕໍ່ເນື່ອງ. ບັນຫາທີ່ອາດຈະເກີດຂື້ນສາມາດປະກອບມີສິ່ງຕໍ່ໄປນີ້: ຄຸນນະພາບຂອງການບັນທຶກອາດຈະບໍ່ພຽງພໍ, ອາດຈະມີສຽງລົບກວນໃນພື້ນຫລັງທີ່ເຮັດໃຫ້ມັນຍາກທີ່ຈະເຂົ້າໃຈຜູ້ເວົ້າ, ນອກຈາກນັ້ນ, ຜູ້ເວົ້າອາດຈະມີສໍານຽງສຽງຫຼືພາສາທີ່ຫນັກແຫນ້ນ (ທ່ານບໍ? ເຄີຍໄດ້ຍິນພາສາ Geordie ບໍ?), ແລະອື່ນໆ.

ການຮັບຮູ້ສຽງເວົ້າໄດ້ພັດທະນາຫຼາຍສົມຄວນ, ແຕ່ມັນຍັງຢູ່ໄກຈາກຄວາມສົມບູນແບບ. ບໍ່ແມ່ນທັງໝົດພຽງແຕ່ກ່ຽວກັບຄຳສັບເທົ່ານັ້ນ, ເຄື່ອງຈັກຍັງບໍ່ສາມາດເຮັດຫຼາຍຢ່າງທີ່ມະນຸດສາມາດເຮັດໄດ້: ພວກເຂົາບໍ່ສາມາດອ່ານພາສາກາຍ ຫຼື ຮັບຮູ້ສຽງເວົ້າຈາງໆໃນສຽງຂອງຜູ້ອື່ນ. ຄົນເຮົາມັກຈະບໍ່ອອກສຽງທຸກຄຳໃນແບບທີ່ຖືກຕ້ອງ ແລະເຂົາເຈົ້າມັກຫຍໍ້ບາງຄຳ. ຕົວຢ່າງ, ເມື່ອເວົ້າໄວແລະບໍ່ເປັນທາງການ, ຜູ້ເວົ້າພາສາອັງກິດພື້ນເມືອງມັກຈະອອກສຽງວ່າ "ໄປ" ເຊັ່ນ "ໄປ." ທັງຫມົດຂ້າງເທິງ, ເຮັດໃຫ້ເກີດອຸປະສັກສໍາລັບເຄື່ອງຈັກທີ່ເຂົາເຈົ້າພະຍາຍາມເອົາຊະນະ, ແຕ່ຍັງມີທາງຍາວຢູ່ທາງຫນ້າຂອງພວກເຂົາ. ມັນເປັນສິ່ງ ສຳ ຄັນທີ່ຈະຕ້ອງຍົກໃຫ້ເຫັນວ່າຍ້ອນວ່າຂໍ້ມູນຫຼາຍກວ່າແລະຫຼາຍແມ່ນອາຫານໃຫ້ກັບສູດການຄິດໄລ່ສະເພາະເຫຼົ່ານັ້ນ; ສິ່ງທ້າທາຍເບິ່ງຄືວ່າຈະຫຼຸດລົງ. ອະນາຄົດຂອງການຮັບຮູ້ສຽງເວົ້າແບບອັດຕະໂນມັດເບິ່ງຄືວ່າຈະສົດໃສ.

ການໂຕ້ຕອບຜູ້ໃຊ້ທີ່ໃຊ້ດ້ວຍສຽງກຳລັງມີໃຫ້ຫຼາຍຂຶ້ນ ແລະເປັນທີ່ນິຍົມໃນຄົວເຮືອນ. ມັນອາດຈະເປັນເວທີຕໍ່ໄປໃນເຕັກໂນໂລຢີ.

Gglot ສະຫນອງການຮັບຮູ້ສຽງເວົ້າແບບອັດຕະໂນມັດໃນຮູບແບບການບໍລິການຖອດຂໍ້ຄວາມອັດຕະໂນມັດ - ພວກເຮົາປ່ຽນຄໍາເວົ້າເປັນຂໍ້ຄວາມ. ການ​ບໍ​ລິ​ການ​ຂອງ​ພວກ​ເຮົາ​ແມ່ນ​ງ່າຍ​ດາຍ​ທີ່​ຈະ​ນໍາ​ໃຊ້​, ມັນ​ຈະ​ບໍ່​ມີ​ຄ່າ​ໃຊ້​ຈ່າຍ​ຫຼາຍ​ແລະ​ມັນ​ຈະ​ເຮັດ​ໄດ້​ຢ່າງ​ວ່ອງ​ໄວ​!