Naon sabenerna Pangwanoh Biantara?
Pangwanoh ucapan
Naon anu anjeun kedah terang ngeunaan pangakuan ucapan
Lamun urang ngobrol ngeunaan pangakuan ucapan, biasana urang hartosna hiji software nu mibanda kamampuhan pikeun mikawanoh kecap diucapkeun jeung nulis eta dina program jadi dina tungtungna anjeun boga sagalana nu geus diucapkeun dina format tinulis. Éta ogé sering disebut salaku "speech-to-text". Dina awal software nu tadi kamungkinan pohara kawates, ku kituna anjeun bisa ngarobah ngan jumlah kawates frasa. Kalayan waktosna, téknologi tukangeun parangkat lunak pangenal ucapan parantos ngembangkeun pisan sareng ayeuna langkung canggih, ku kituna tiasa ngenal basa anu béda sareng aksen anu béda. Tapi tangtosna, masih aya padamelan anu kedah dilakukeun dina widang ieu.
Éta ogé penting pikeun perhatikeun yén pangakuan ucapan henteu sami sareng pangakuan sora, sanaos kadang-kadang jalma nganggo dua istilah pikeun hal anu sami. Pangenal sora digunakeun pikeun ngaidéntifikasi jalma anu nyarios sareng henteu nyatet naon anu diomongkeun.
Sajarah pondok ngeunaan pangakuan ucapan sareng téknologi anu aya hubunganana
Dina artikel ieu, urang bakal ngajelaskeun sakeudeung sajarah jeung téhnologi balik kebangkitan pangakuan ucapan.
Kantos saprak awal jaman digital, jalma-jalma ngagaduhan dorongan pikeun kumaha waé tiasa komunikasi sareng mesin. Saatos jinis komputer digital munggaran diciptakeun, seueur élmuwan sareng insinyur parantos nyobian sababaraha cara pikeun ngalaksanakeun pangakuan ucapan dina prosés ieu. Sataun krusial dina prosés ieu 1962, nalika IBM ngungkabkeun Shoebox, mesin pangenal ucapan dasar anu tiasa ngalakukeun itungan matematika basajan. Upami pangguna proto-komputer ieu nyarios kana mikropon, mesin ieu tiasa ngenal dugi ka genep kecap kontrol sapertos "tambah" atanapi "minus". Langkungna waktos, téknologi tukangeun ieu dimekarkeun sareng ayeuna mangrupikeun fitur anu umum pisan pikeun berinteraksi sareng komputer ku sora. Aya seueur mesin pangenal ucapan anu kasohor sapertos Siri atanapi Alexa. Penting pikeun dicatet yén alat anu didorong ku sora ieu gumantung kana intelijen buatan (AI) sareng pembelajaran mesin.
Nalika intelijen buatan (AI) disebatkeun, sigana sapertos pilem fiksi ilmiah, tapi kaleresan dina jaman ayeuna AI maénkeun peran anu saé di dunya urang. Nyatana, AI parantos aya dina kahirupan urang sapopoe, sabab seueur program sareng aplikasi anu parantos dianggo. Tapi éta fiksi ilmiah dina awal abad ka-20, nalika istilah éta muncul. Dina ahir 1950 konsép AI janten langkung menonjol sareng janten fokus anu dipikaresep ku seueur ilmuwan sareng filsuf. Dina waktos éta, matematikawan Inggris anu ambisius pisan anu disebut Alan Turing datang sareng dalil yén mesin tiasa ngabéréskeun masalah sareng nyandak kaputusan nyalira, dumasar kana input inpormasi anu sayogi. Masalahna nyaéta komputer henteu acan gaduh kamungkinan ngapalkeun data éta, anu mangrupikeun léngkah anu penting pikeun pamekaran intelijen buatan. Sadaya anu aranjeunna tiasa laksanakeun nyaéta ngalaksanakeun paréntah saderhana.
Ngaran penting séjén dina ngembangkeun AI nyaeta John McCarthy, anu mimiti dikedalkeun pisan istilah "kecerdasan jieunan". McCarthy nyatakeun yén AI nyaéta: "élmu sareng rékayasa nyieun mesin calakan". Definisi ieu diungkabkeun dina konperénsi mani di Dartmouth College di 1956. Ti harita AI mimiti mekar dina laju anu gancang.
Kiwari, intelijen buatan dina sagala rupa bentukna aya di mana waé. Eta geus tumuwuh nepi ka nyoko massal, utamana alatan kanaékan volume sakabéh data nu keur disilihtukeurkeun di sakuliah dunya unggal poé. Hal ieu dipaké dina algoritma canggih, sarta eta nimbulkeun perbaikan dina neundeun jeung kakuatan komputasi. AI dipaké pikeun sababaraha tujuan, contona tarjamahan, transkripsi, ucapan, beungeut jeung pangakuan objék, analisis gambar médis, ngolah basa alam, rupa-rupa saringan jaringan sosial jeung saterusna. Inget yen pertandingan catur antara grandmaster Gari Kasparov jeung Deep Blue catur AI?
Pembelajaran mesin mangrupikeun aplikasi anu penting pisan pikeun intelijen buatan. Pondokna, éta ngarujuk kana sistem naon waé anu gaduh kamampuan pikeun diajar sareng ningkatkeun tina pangkalan data pangalaman sorangan. Ieu jalan ngaliwatan pangakuan pola. Pikeun sistem ngalakukeun éta kedah tiasa dilatih. Algoritma sistem nampi input tina jumlah data anu ageung, sareng dina hiji waktos janten tiasa ngaidentipikasi pola tina data éta. Tujuan ahir tina prosés ieu nyaéta sangkan sistem komputer ieu diajar sacara mandiri, tanpa merlukeun campur atawa bantuan manusa.
Hal séjén anu penting pisan disebatkeun sareng pembelajaran mesin nyaéta diajar jero. Salah sahiji alat anu paling penting dina prosés diajar jero nyaéta anu disebut jaringan saraf jieunan. Éta mangrupikeun algoritma canggih, sami sareng struktur sareng pungsi otak manusa. Nanging, aranjeunna statik sareng simbolis, teu sapertos otak biologis anu plastik sareng langkung dumasar kana analog. Pondokna, diajar jero ieu mangrupikeun cara diajar mesin anu khusus, utamina dumasar kana jaringan saraf jieunan. Tujuan tina deep learning nyaéta pikeun ngayakeun réplikasi prosés diajar manusa. Téknologi pembelajaran jero pisan mangpaat, sareng maénkeun peran penting dina sagala rupa alat anu dikontrol ku sora - tablet, TV, smartphone, kulkas, jsb. yén pamaké bakal meuli di mangsa nu bakal datang. Téknologi pembelajaran jero ogé loba dipaké dina widang médis. Hal ieu kacida penting pikeun peneliti kanker, sabab mantuan pikeun otomatis ngadeteksi sél kanker.
Ayeuna urang balik deui ka pangakuan ucapan. Téknologi ieu, sakumaha anu parantos disebatkeun, tujuanana pikeun ngaidentipikasi rupa-rupa kecap sareng frasa tina basa lisan. Saatos éta, éta ngarobih kana format anu tiasa dibaca ku mesin. Program dasar ngan ukur ngaidentipikasi sajumlah leutik frasa konci, tapi sababaraha parangkat lunak pangenal ucapan anu langkung maju tiasa nga-decipher sagala jinis ucapan alami. Téknologi pangenalan ucapan téh merenah dina kalolobaan kasus, tapi kadang-kadang sapatemon masalah nalika kualitas rekaman teu cukup alus atawa lamun aya noise latar tukang nu nyieun hésé ngarti speaker bener. Éta ogé masih tiasa mendakan sababaraha masalah nalika panyatur gaduh aksen atanapi dialék anu kuat. Pangenalan ucapan terus-terusan ngembang, tapi masih tacan sampurna. Henteu sadayana ngeunaan kecap, mesin masih henteu mampuh seueur hal anu tiasa dilakukeun ku manusa, contona henteu tiasa ngémutan basa awak atanapi nada sora batur. Tapi, sakumaha langkung seueur data anu dideskripsikeun ku algoritma canggih ieu, sababaraha tantangan ieu sigana ngirangan kasusah. Saha anu terang naon anu bakal dibawa ka hareup? Hésé pikeun ngaduga dimana pangakuan ucapan bakal mungkas. Salaku conto, Google parantos suksés pisan dina nerapkeun parangkat lunak pangenal ucapan dina mesin Google Tarjamah, sareng mesinna terus diajar sareng berkembang. Meureun hiji poé maranéhna bakal ngaganti penerjemah manusa sagemblengna. Atawa meureun henteu, kaayaan ucapan sapopoé teuing kompléks pikeun sagala jenis mesin nu teu bisa maca jerona jiwa manusa.
Iraha nganggo pangakuan ucapan?
Ayeuna, ampir sadayana gaduh smartphone atanapi tablet. Pangenal ucapan mangrupikeun fitur umum dina alat-alat éta. Éta téh dipaké pikeun ngarobah ucapan hiji jalma kana aksi. Upami anjeun hoyong nelepon nini anjeun, cekap anjeun paréntah "nelepon Eyang" sareng smartphone anjeun parantos mencét nomerna tanpa anjeun kedah ngetik daptar kontak anjeun. Ieu pangakuan ucapan. conto sejen alus ngeunaan eta, nyaeta Alexa atawa Siri. Éta ogé gaduh fitur ieu hard-kabel dina sistem maranéhanana. Google masihan anjeun ogé pilihan pikeun milarian naon waé ku sora, tanpa ngetik naon waé.
Meureun anjeun ayeuna panasaran ngeunaan kumaha sakabéh ieu jalan. Nya, pikeun jalanna, sénsor sapertos mikropon kedah diwangun kana parangkat lunak supados gelombang sora tina kecap-kecap anu diucapkeun dikenal, dianalisis sareng dirobih kana format digital. Inpormasi digital teras kedah dibandingkeun sareng inpormasi sanés anu disimpen dina sababaraha jinis kecap sareng éksprési gudang. Lamun aya hiji patandingan software bisa mikawanoh paréntah sarta meta sasuai.
Hiji deui hal anu kedah disebatkeun dina waktos ieu nyaéta anu disebut WER (tingkat kasalahan kecap). Ieu mangrupikeun rumus dimana anjeun ngabagi nomer kasalahan sareng jumlah kecap. Janten, dina istilah anu saderhana, éta seueur hubunganana sareng akurasi. Tujuanana tangtu boga WER handap, sabab ieu hartina transkripsi kecap lisan leuwih akurat.
Pangakuan ucapan ayeuna di paménta saloba kantos. Upami anjeun ogé kedah ngarobih kecap anu diucapkeun tina hayu urang nyarios file audio anu dirékam kana téks, anjeun tiasa ngalih ka Gglot. Kami mangrupikeun panyadia jasa transkripsi anu nawiskeun transkripsi akurat pikeun harga anu adil. Janten, ulah ragu pikeun ngahubungi via halaman wéb kami anu ramah-pamaké.