La Rolo de Artefarita Inteligenteco kaj Maŝina Lernado en Parola Rekono

Rolo de Artefarita Inteligenteco kaj Maŝina Lernado en Parola Rekono

Dum longa tempo, homoj volis povi paroli kun maŝinoj. Ekde kiam ili komencis konstrui komputilojn, sciencistoj kaj inĝenieroj provis korpigi parolrekonon en la procezon. En la jaro 1962, IBM enkondukis Shoebox, parolrekonan maŝinon kiu povis fari simplajn matematikajn kalkulojn. Ĉi tiu noviga aparato rekonis kaj respondis al 16 parolitaj vortoj, inkluzive de la dek ciferoj de "0" ĝis "9". Kiam nombro kaj komandvortoj kiel ekzemple "plus", "minus" kaj "totalo" estis parolitaj, Shoebox instrukciis aldonmaŝinon kalkuli kaj presi respondojn al simplaj aritmetikaj problemoj. Ŝuujo estis funkciigita per parolado en mikrofonon, kiu konvertis voĉsonojn en elektrajn impulsojn. Mezurcirkvito klasifikis tiujn impulsojn laŭ diversaj specoj de sonoj kaj aktivigis la kunan aldonmaŝinon per stafetsistemo.

Kun la tempo, ĉi tiu teknologio disvolviĝis kaj hodiaŭ multaj el ni rutine interagas kun eksterkomputiloj per voĉo. La plej popularaj voĉaj asistantoj hodiaŭ estas Alexa de Amazon, Siri de Apple, Google Assistant kaj Cortana de Microsoft. Ĉi tiuj asistantoj povas plenumi taskojn aŭ servojn por individuo surbaze de komandoj aŭ demandoj. Ili kapablas interpreti homan paroladon kaj respondi per sintezitaj voĉoj. Uzantoj povas demandi al siaj asistantoj, kontroli hejmajn aŭtomatigajn aparatojn kaj amaskomunikilajn reproduktojn per voĉo, kaj administri aliajn bazajn taskojn kiel retpoŝton, farolistojn kaj kalendarojn per vortaj komandoj. Ju pli ni uzas ĉi tiujn voĉajn aparatojn des pli ni fariĝas. dependa de artefarita inteligenteco (AI) kaj maŝinlernado.

Artefarita inteligenteco (AI)

1

Kiam vi diras artefarita inteligenteco (AI), multaj homoj povus pensi, ke vi parolas pri sciencfikcio, kvankam AI estas tre enigita en nia ĉiutaga vivo. Fakte, ĝi estis dum jardekoj. Sed la vero estas, ke ja estis sciencfikcio, kiu komence de la 20 -a jarcento familiarigis la publikon kun artefarite inteligentaj homsimilaj robotoj. En la 50-aj jaroj la konceptoj de AI venis pli kaj pli en la fokuso de intereso de sciencistoj kaj filozofoj. En tiu tempo juna brita matematikisto Alan Turing sugestis, ke ne ekzistas kialo kial maŝinoj ne povus (same kiel homoj) solvi problemojn kaj fari decidojn surbaze de disponeblaj informoj. Sed en tiu tempo, komputiloj ne havis la eblecon enmemorigi kio estas ŝlosilo por inteligenteco. Ili nur faris ordonojn. Sed tamen, estis Alan Turing kiu establis la fundamentan celon kaj vizion de artefarita inteligenteco.

Vaste rekonita kiel la patro de AI estas John McCarthy kiu elpensis la terminon artefarita inteligenteco . Por li AI estis: "la scienco kaj inĝenierado de farado de inteligentaj maŝinoj". Ĉi tiu difino estis prezentita ĉe konferenco en Dartmouth College en 1956 kaj ĝi indikis la komencon de AI-esplorado. De tiam AI floris.

En la moderna mondo artefarita inteligenteco estas ĉiea. Ĝi fariĝis pli populara danke al pliigitaj datumvolumoj, altnivelaj algoritmoj kaj plibonigoj en komputika potenco kaj stokado. Plejparte AI-apliko estas konektita al intelektaj taskoj. Ni uzas AI por tradukado, objekto, vizaĝo kaj parolrekono, temo-detekto, medicina bildanalizo, naturlingva prilaborado, socia reto-filtrado, ŝakludo ktp.

Maŝina lernado

Maŝina lernado estas aplikaĵo de artefarita inteligenteco kaj ĝi rilatas al sistemoj, kiuj havas la kapablon plibonigi de sia propra sperto. La plej grava afero ĉi tie estas, ke la sistemo devas scii kiel rekoni ŝablonojn. Por povi fari tion, la sistemo devas esti trejnita: la algoritmo nutras grandajn kvantojn da datenoj do iam ĝi povas identigi ŝablonojn. La celo estas permesi al la komputiloj lerni aŭtomate sen homa interveno aŭ helpo.

Kiam oni parolas pri maŝinlernado, estas grave mencii profundan lernadon. Ni komencu dirante, ke unu el la ĉefaj iloj uzataj en profunda lernado estas artefaritaj neŭralaj retoj. Tiuj estas algoritmoj kiuj estas inspiritaj de la strukturo kaj funkcio de la cerbo, kvankam ili tendencas esti senmovaj kaj simbolaj, kaj ne plastaj kaj analogaj kiel la biologia cerbo. Do, profunda lernado estas speciala formo de maŝinlernado bazita sur artefarita neŭrala reto, kies celo estas reprodukti la manieron kiel homoj lernas kaj tio servas kiel bonega ilo por trovi ŝablonojn kiuj estas multe tro multaj por programisto por instrui la maŝinon. En la pasintaj du jaroj oni multe parolis pri senŝoforaj aŭtoj kaj kiel ili povus ŝanĝi niajn vivojn. Profunda lernado-teknologio estas la ŝlosilo ĉi tie, ĉar ĝi reduktas akcidentojn ebligante la aŭton distingi piediranton de fajrohidranto aŭ rekoni ruĝan lumon. Profunda lernado-teknologio ankaŭ ludas la ĉefan rolon en voĉa kontrolo en aparatoj kiel tabeloj, telefonoj, fridujoj, televidiloj ktp. E-komercaj kompanioj ofte uzas artefaritajn neŭralajn retojn kiel filtran sistemon, kiu provas antaŭdiri kaj montri la erojn, kiujn uzanto ŝatus. Aĉeti. Profunda lerna teknologio ankaŭ estas uzata en medicina kampo. Ĝi helpas al kanceresploristoj aŭtomate detekti kancerajn ĉelojn kaj tiel reprezentas grandegan progreson en kancero-traktado.

Parola rekono

La teknologio de parolrekono utilas por identigi vortojn kaj frazojn el la parola lingvo kaj konverti ilin en legeblan formaton por la maŝino. Dum kelkaj programoj povas nur identigi limigitan nombron da frazoj, kelkaj pli sofistikaj parolrekonaj programoj povas deĉifri naturan paroladon.

Ĉu estas obstakloj por venki?

Kvankam oportuna, parolrekono teknologio ne ĉiam iras glate kaj ĝi ankoraŭ havas kelkajn problemojn por trakti, ĉar ĝi estas kontinue evoluinta. Problemoj kiuj povas ekesti povas inkluzivi interalie jenajn: la kvalito de la registrado eble estas neadekvata, povus esti bruoj en la fono, kiuj malfaciligas kompreni la parolanton, ankaŭ la parolanto povus havi vere fortan akĉenton aŭ dialekton (ĉu vi iam aŭdis la Geordie-dialekton?), ktp.

Parolrekono disvolviĝis sufiĉe multe, sed ĝi ankoraŭ estas malproksima de esti perfekta. Ne ĉio temas nur pri vortoj, maŝino ankoraŭ ne povas fari multajn aferojn, kiujn homoj povas: ili ne povas legi korpan lingvon aŭ rekoni la sarkasman tonon en ies voĉo. Homoj ofte ne prononcas ĉiun vorton ĝuste kaj ili emas mallongigi kelkajn vortojn. Ekzemple, parolante rapide kaj neformale, denaskaj anglalingvanoj ofte prononcas "going to" kiel "gonna". Ĉio ĉi-supra, kaŭzas obstaklojn por maŝinoj, kiujn ili provas venki, sed ankoraŭ estas longa vojo antaŭ ili. Gravas reliefigi, ke ĉar pli kaj pli da datumoj estas nutrataj al tiuj specifaj algoritmoj; la defioj ŝajnas malpliiĝi. La estonteco de aŭtomatigita parolrekono ŝajnas esti brila.

Voĉ-elektraj uzantinterfacoj iĝas ĉiam pli haveblaj kaj popularaj en domanaroj. Ĝi eĉ povus iĝi LA sekva platformo en teknologio.

Gglot ofertas aŭtomatigitan parolrekonon en formo de aŭtomatigitaj transskribaj servoj - ni konvertas paroladojn al teksto. Nia servo estas simpla uzebla, ĝi ne multe kostos al vi kaj ĝi estos farita rapide!