De rol van kunstmatige intelligentie en machinaal leren bij spraakherkenning
De rol van kunstmatige intelligentie en machinaal leren bij spraakherkenning
Mensen wilden lange tijd met machines kunnen praten. Sinds ze begonnen met het bouwen van computers, hebben wetenschappers en ingenieurs geprobeerd spraakherkenning in het proces te integreren. In 1962 introduceerde IBM Shoebox, een spraakherkenningsmachine die eenvoudige wiskundige berekeningen kon uitvoeren. Dit innovatieve apparaat herkende en reageerde op 16 gesproken woorden, inclusief de tien cijfers van "0" tot en met "9". Toen een aantal en commandowoorden zoals "plus", "min" en "totaal" werden uitgesproken, gaf Shoebox een rekenmachine de opdracht om antwoorden op eenvoudige rekenkundige problemen te berekenen en af te drukken. Shoebox werd bediend door in een microfoon te spreken, die stemgeluiden omzet in elektrische impulsen. Een meetcircuit classificeerde deze impulsen volgens verschillende soorten geluiden en activeerde de aangesloten rekenmachine via een relaissysteem.
Na verloop van tijd ontwikkelde deze technologie zich en tegenwoordig communiceren velen van ons routinematig met onze computers via spraak. De meest populaire spraakassistenten van tegenwoordig zijn Alexa van Amazon, Siri van Apple, Google Assistant en Cortana van Microsoft. Deze assistenten kunnen taken of diensten voor een individu uitvoeren op basis van opdrachten of vragen. Ze kunnen menselijke spraak interpreteren en reageren via gesynthetiseerde stemmen. Gebruikers kunnen hun assistenten vragen stellen, domotica-apparaten en media afspelen via spraakbediening en andere basistaken beheren, zoals e-mail, takenlijsten en agenda's met mondelinge opdrachten. Hoe meer we deze spraakgestuurde apparaten gebruiken, hoe meer we worden afhankelijk van kunstmatige intelligentie (AI) en machine learning.
Kunstmatige intelligentie (AI)
Als je kunstmatige intelligentie (AI) zegt, denken veel mensen misschien dat je het over sciencefiction hebt, ook al is AI erg ingebed in ons dagelijks leven. In feite is het al tientallen jaren. Maar de waarheid is dat het inderdaad sciencefiction was die aan het begin van de twintigste eeuw het publiek vertrouwd maakte met kunstmatig intelligente mensachtige robots. In de jaren 50 kwamen de concepten van AI steeds meer in de belangstelling van wetenschappers en filosofen. In die tijd suggereerde de jonge Britse wiskundige Alan Turing dat er geen reden is waarom machines (net als mensen) problemen niet konden oplossen en beslissingen konden nemen op basis van beschikbare informatie. Maar in die tijd hadden computers niet de mogelijkheid om te onthouden, wat de sleutel is voor intelligentie. Het enige wat ze deden was commando's uitvoeren. Maar toch was het Alan Turing die het fundamentele doel en de visie van kunstmatige intelligentie heeft vastgesteld.
Algemeen erkend als de vader van AI is John McCarthy die de term kunstmatige intelligentie bedacht. Voor hem was AI: “de wetenschap en techniek van het maken van intelligente machines”. Deze definitie werd gepresenteerd op een conferentie op Dartmouth College in 1956 en gaf het begin aan van AI-onderzoek. Vanaf dat moment bloeide AI.
In de moderne wereld is kunstmatige intelligentie alomtegenwoordig. Het is populairder geworden dankzij grotere datavolumes, geavanceerde algoritmen en verbeteringen in rekenkracht en opslag. Meestal is AI-toepassing verbonden met intellectuele taken. We gebruiken AI voor vertaling, object-, gezichts- en spraakherkenning, onderwerpdetectie, medische beeldanalyse, natuurlijke taalverwerking, filtering van sociale netwerken, schaken enz.
Machine leren
Machine learning is een toepassing van kunstmatige intelligentie en verwijst naar systemen die kunnen verbeteren vanuit hun eigen ervaring. Het belangrijkste hierbij is dat het systeem patronen moet kunnen herkennen. Om dat te kunnen doen, moet het systeem worden getraind: het algoritme voedt grote hoeveelheden gegevens, zodat het op een gegeven moment patronen kan identificeren. Het doel is om de computers automatisch te laten leren zonder menselijke tussenkomst of hulp.
Als we het hebben over machine learning, is het belangrijk om deep learning te noemen. Laten we beginnen met te zeggen dat een van de belangrijkste tools die bij deep learning worden gebruikt, kunstmatige neurale netwerken zijn. Dat zijn algoritmen die zijn geïnspireerd door de structuur en functie van de hersenen, ook al zijn ze meestal statisch en symbolisch, en niet plastisch en analoog zoals de biologische hersenen. Deep learning is dus een gespecialiseerde vorm van machine learning op basis van een kunstmatig neuraal netwerk, met als doel de manier waarop mensen leren te repliceren en dit dient als een geweldig hulpmiddel om patronen te vinden die veel te talrijk zijn voor een programmeur om de machine te leren. In de afgelopen jaren is er veel gesproken over zelfrijdende auto's en hoe deze ons leven zouden kunnen veranderen. Deep learning-technologie is hier de sleutel, omdat het ongevallen vermindert doordat de auto een voetganger kan onderscheiden van een brandkraan of een rood licht kan herkennen. Deep learning-technologie speelt ook de hoofdrol bij spraakbesturing op apparaten zoals tablets, telefoons, koelkasten, tv's enz. E-commercebedrijven gebruiken vaak kunstmatige neurale netwerken als een filtersysteem dat probeert te voorspellen en de items die een gebruiker zou willen laten zien. kopen. Deep learning-technologie wordt ook op medisch gebied gebruikt. Het helpt kankeronderzoekers om kankercellen automatisch te detecteren en vertegenwoordigt daarmee een enorme vooruitgang in de behandeling van kanker.
Spraakherkenning
Spraakherkenningstechnologie dient om woorden en zinnen uit de gesproken taal te identificeren en om te zetten in een leesbaar formaat voor de machine. Hoewel sommige programma's slechts een beperkt aantal zinnen kunnen identificeren, kunnen sommige meer geavanceerde spraakherkenningsprogramma's natuurlijke spraak ontcijferen.
Zijn er obstakels die moeten worden overwonnen?
Hoewel handig, verloopt spraakherkenningstechnologie niet altijd soepel en heeft het nog steeds een aantal problemen, omdat het voortdurend wordt ontwikkeld. Mogelijke problemen kunnen onder meer de volgende zijn: de kwaliteit van de opname kan onvoldoende zijn, er kunnen achtergrondgeluiden zijn die het moeilijk maken om de spreker te verstaan, ook kan de spreker een heel sterk accent of dialect hebben (had u ooit het Geordie-dialect gehoord?), enz.
De spraakherkenning heeft zich behoorlijk ontwikkeld, maar is nog lang niet perfect. Niet alles draait alleen om woorden, de machine kan nog steeds niet veel dingen doen die mensen kunnen: ze kunnen geen lichaamstaal lezen of de sarcastische toon in iemands stem herkennen. Mensen spreken vaak niet elk woord op de juiste manier uit en ze hebben de neiging om sommige woorden in te korten. Als ze bijvoorbeeld snel en informeel spreken, spreken Engelse moedertaalsprekers vaak 'gaan naar' uit als 'gaan'. Al het bovenstaande veroorzaakt obstakels voor machines die ze proberen te overwinnen, maar er is nog een lange weg voor hen. Het is belangrijk om te benadrukken dat naarmate er meer en meer gegevens naar die specifieke algoritmen gaan; de uitdagingen lijken af te nemen. De toekomst van geautomatiseerde spraakherkenning ziet er rooskleurig uit.
Spraakgestuurde gebruikersinterfaces worden steeds meer beschikbaar en populair in huishoudens. Het zou zelfs wel eens HET volgende platform in technologie kunnen worden.
Gglot biedt geautomatiseerde spraakherkenning in de vorm van geautomatiseerde transcriptiediensten – wij zetten toespraken om naar tekst. Onze service is eenvoudig in gebruik, het kost u niet veel en het is snel klaar!