D'Roll vun der kënschtlecher Intelligenz a Maschinnléieren an der Riederkennung
D'Roll vun der kënschtlecher Intelligenz a Maschinnléieren an der Riederkennung
Laang wollten d'Leit mat Maschinnen schwätzen. Zënter datt se ugefaang hunn Computeren ze bauen, hunn d'Wëssenschaftler an d'Ingenieuren probéiert Riederkennung an de Prozess ze integréieren. Am Joer 1962 huet IBM Shoebox agefouert, eng Riederkennungsmaschinn déi einfach mathematesch Berechnunge maache konnt. Dësen innovativen Apparat erkannt a reagéiert op 16 geschwat Wierder, dorënner déi zéng Ziffere vun "0" bis "9." Wann eng Zuel a Kommando Wierder wéi "Plus", "Minus" an "Total" geschwat goufen, Shoebox instruéiert eng Zousatzmaschinn fir Äntwerten op einfach arithmetesch Problemer ze berechnen an ze drécken. Shoebox gouf bedriwwe andeems se an e Mikrofon geschwat hunn, dee Stëmmkläng an elektresch Impulser ëmgewandelt huet. E Moosskrees klasséiert dës Impulser no verschiddenen Typen vu Kläng an huet déi befestegt Zousatzmaschinn duerch e Relaissystem aktivéiert.
Mat der Zäit huet dës Technologie entwéckelt an haut interagéiere vill vun eis routinéiert mat Computeren duerch Stëmm. Déi populärste Stëmmassistenten haut sinn Alexa vun Amazon, Siri vun Apple, Google Assistant a Cortana vu Microsoft. Dës Assistenten kënnen Aufgaben oder Servicer fir en Individuum ausféieren op Basis vu Kommandoen oder Froen. Si kënne mënschlech Ried interpretéieren an iwwer synthetiséiert Stëmmen reagéieren. D'Benotzer kënnen hir Assistenten Froen stellen, Hausautomatiséierungsgeräter a Medienplayback iwwer Stëmm kontrolléieren, an aner Basisaufgaben wéi E-Mail, To-Do Lëschten a Kalennere mat verbale Kommandoen verwalten. ofhängeg vu kënschtlecher Intelligenz (AI) a Maschinnléieren.
Kënschtlech Intelligenz (AI)
Wann Dir kënschtlech Intelligenz (AI) seet, kënne vill Leit mengen datt Dir iwwer Science Fiction schwätzt, och wann AI ganz an eisem Alldag agebonnen ass. Tatsächlech ass et schonn zënter Joerzéngten. Awer d'Wourecht ass, et war wierklech Science Fiction, déi am Ufank vum 20. Joerhonnert de Public mat kënschtlech intelligenten Mënsch-ähnlechen Roboteren vertraut huet. An de 50er Jore koumen d'Konzepter vun der AI ëmmer méi am Fokus vun Interesse vu Wëssenschaftler a Philosophen. An där Zäit huet de jonke britesche Mathematiker Alan Turing virgeschloen datt et kee Grond gëtt firwat Maschinnen net (just wéi Mënschen) Probleemer léisen an Entscheedungen huelen op Basis vun verfügbaren Informatioun. Awer an där Zäit haten Computeren net d'Méiglechkeet ze memoriséieren, wat de Schlëssel fir Intelligenz ass. Alles wat se gemaach hunn war Kommandoen auszeféieren. Awer trotzdem war et den Alan Turing deen d'fundamental Zil a Visioun vun der kënschtlecher Intelligenz etabléiert huet.
Breet unerkannt als de Papp vun der AI ass den John McCarthy deen de Begrëff kënschtlech Intelligenz entwéckelt huet. Fir hien war AI: "d'Wëssenschaft an d'Ingenieur fir intelligent Maschinnen ze maachen". Dës Definitioun gouf op enger Konferenz am Dartmouth College am Joer 1956 presentéiert an et huet den Ufank vun der AI Fuerschung uginn. Vun do un huet d'AI bléie gelooss.
An der moderner Welt ass kënschtlech Intelligenz ubiquitär. Et ass méi populär ginn duerch erhéicht Datevolumen, fortgeschratt Algorithmen, a Verbesserungen an der Rechenkraaft a Lagerung. Meeschtens AI Applikatioun ass verbonne mat intellektuell Aufgaben. Mir benotzen AI fir Iwwersetzung, Objekt-, Gesiichts- a Riederkennung, Themenerkennung, medizinesch Bildanalyse, natierlech Sproochveraarbechtung, sozial Netzwierkfilter, Schachspillen etc.
Maschinn Léieren
Maschinnléieren ass eng Applikatioun vu kënschtlecher Intelligenz an et bezitt sech op Systemer déi d'Fäegkeet hunn aus hirer eegener Erfahrung ze verbesseren. Déi wichtegst Saach hei ass datt de System muss wëssen wéi Mustere erkennen. Fir dat ze maachen muss de System trainéiert ginn: den Algorithmus fiddert grouss Quantitéiten un Daten sou datt et iergendwann fäeg ass Mustere z'identifizéieren. D'Zil ass et de Computer z'erméiglechen automatesch ze léieren ouni mënschlech Interventioun oder Hëllef.
Wann Dir iwwer Maschinnléiere schwätzt, ass et wichteg déif Léieren ze ernimmen. Loosst eis ufänken ze soen datt ee vun den Haaptinstrumenter, déi am Deep Learning benotzt ginn, kënschtlech neural Netzwierker sinn. Dat sinn Algorithmen déi vun der Struktur a Funktioun vum Gehir inspiréiert sinn, och wa se éischter statesch a symbolesch sinn, an net plastesch an analog wéi dat biologescht Gehir. Also, Deep Learning ass eng spezialiséiert Form vu Maschinnléieren baséiert op kënschtlechen neuralen Netzwierk, d'Zil vun deem ass d'Art a Weis wéi d'Mënsche léieren ze replizéieren an dëst déngt als e super Tool fir Mustere ze fannen déi vill ze vill sinn fir e Programméierer d'Maschinn ze léieren. An de leschte Joren ass vill iwwer Chaufferlos Autoen geschwat ginn a wéi se eist Liewen änneren. Deep Learning-Technologie ass hei de Schlëssel, well se reduzéiert Accidenter andeems en den Auto erlaabt e Foussgänger vun engem Brandhydrant z'ënnerscheeden oder eng rout Luucht ze erkennen. Deep Learning Technologie spillt och d'Haaptroll an der Stëmmkontroll an Apparater wéi Pëllen, Telefonen, Frigoen, Fernseher etc. E-Commerce Firmen benotzen dacks kënschtlech neural Netzwierker als Filtersystem, dee probéiert d'Elementer virauszesoen an ze weisen, déi e Benotzer gär hätt. kafen. Deep Learning Technologie gëtt och am medizinesche Beräich benotzt. Et hëlleft Kriibsfuerscher automatesch Kriibszellen z'entdecken a stellt also en enorme Fortschrëtt bei der Kriibsbehandlung duer.
Ried Unerkennung
Speech Unerkennung Technologie déngt Wierder an Ausdréck aus der geschwat Sprooch ze identifizéieren an hinnen an engem liesbar Format fir d'Maschinn ze konvertéieren. Wärend e puer Programmer nëmmen eng limitéiert Zuel vu Sätze identifizéieren, kënnen e puer méi sophistikéiert Riederkennungsprogrammer natierlech Ried entschlësselen.
Ginn et Hindernisser ze iwwerwannen?
Och wann et bequem ass, geet d'Sproocherkennungstechnologie net ëmmer glat an et huet nach ëmmer e puer Probleemer ze schaffen, well se kontinuéierlech entwéckelt gëtt. Probleemer déi optrieden kënnen ënner anerem déi folgend enthalen: d'Qualitéit vun der Opnam kéint net genuch sinn, et kéinte Geräischer am Hannergrond ginn, déi et schwéier maachen de Spriecher ze verstoen, och de Spriecher kéint e wierklech staarken Akzent oder Dialekt hunn (hues du jeemools de Geordie Dialekt héieren?), etc.
Speech Unerkennung huet zimmlech vill entwéckelt, awer et ass nach wäit vun perfekt ze sinn. Net alles geet nëmmen ëm Wierder, Maschinn kann nach net vill Saache maachen, déi d'Mënsche kënnen: Si kënnen net Kierpersprooch liesen oder de sarkasteschen Toun an enger Stëmm erkennen. D'Leit schwätzen dacks net all Wuert op de richtege Wee aus a si tendéieren e puer Wierder ze verkierzen. Zum Beispill, wann se séier an informell schwätzt, schwätze Mammesproochler dacks "goen op" wéi "gonna." All vun der uewen, bewierkt Hindernisser fir Maschinnen déi si probéieren ze iwwerwanne, mä et nach e laange Wee virun hinnen. Et ass wichteg ze ënnersträichen, datt wéi méi a méi Daten op déi spezifesch algorithms fidderen ginn; d'Erausfuerderunge schéngen ze reduzéieren. D'Zukunft vun der automatiséierter Riederkennung schéngt hell ze sinn.
Voice-powered User Interfaces ginn ëmmer méi verfügbar a populär an de Stéit. Et kéint souguer DÉI nächst Plattform an der Technologie ginn.
Gglot bitt automatiséiert Riederkennung a Form vun automatiséierten Transkriptiounsservicer - mir konvertéieren Rieden an Text. Eise Service ass einfach ze benotzen, et kascht Iech net vill an et gëtt séier gemaach!