El Papel de la Inteligencia Artificial y Aprendizaje automático en el Reconocimiento de Voz

Papel de la Inteligencia Artificial y Aprendizaje automático en el Reconocimiento de Voz

Durante mucho tiempo, la gente quería ser capaz de hablar con las máquinas. Desde que se comenzó la construcción de equipos, científicos e ingenieros han tratado de incorporar el reconocimiento de voz en el proceso. En el año 1962, IBM introdujo la Caja de zapatos, un reconocimiento de voz de la máquina que podía hacer sencillos cálculos matemáticos. Este innovador dispositivo reconocido y respondido a las 16 palabras habladas, incluyendo los diez dígitos del "0" al "9." Cuando un número de comandos y palabras tales como "más", "menos" y "total", se decía, de la Caja de zapatos instruyó una máquina de sumar para calcular e imprimir las respuestas a simples problemas de aritmética. Caja de zapatos fue operado por hablar en un micrófono, lo que convierte la voz los sonidos en impulsos eléctricos. Un circuito de medición se clasifica estas impulsos de acuerdo a los distintos tipos de sonidos y activado el adjunto de la adición de la máquina a través de un sistema de relé.

Con el tiempo, esta tecnología desarrollada y hoy en día muchos de nosotros rutinariamente interactuar con los ordenadores por medio de la voz. El más popular de voz asistentes de hoy son Alexa por Amazon, Siri de Apple, Google y el Asistente Cortana de Microsoft. Estos asistentes pueden realizar tareas o servicios de una persona en función de las órdenes o preguntas. Son capaces de interpretar la voz humana y responder a través de voces sintetizadas. Los usuarios pueden hacer sus preguntas de los asistentes, control de dispositivos de automatización del hogar y la reproducción multimedia a través de voz, y manejar otras tareas básicas, tales como el correo electrónico, listas de tareas, calendarios y con órdenes verbales.El más utilizamos estos de voz dispositivos accionados por el más hemos vuelto dependientes de la inteligencia artificial (AI) y el aprendizaje de máquina.

La inteligencia Artificial (IA)

1

Cuando usted dice que la inteligencia artificial (AI), muchas personas podrían pensar que estamos hablando de ciencia ficción, aunque la IA está muy incrustado en nuestra vida cotidiana. De hecho, ha sido por décadas. Pero la verdad es que, de hecho era de ciencia ficción, que en el comienzo de la 20ª siglo familiarizado al público con artificialmente inteligente humanos como robots. En los años 50 los conceptos de AI vinieron más y más en el foco de interés de los científicos y los filósofos. En ese momento los jóvenes el matemático Británico Alan Turing propuso que no hay una razón por la que las máquinas no podía (al igual que los humanos) resolver problemas y tomar decisiones basadas en la información disponible. Pero en ese momento, los equipos no tienen la posibilidad de memorizar las que es clave para la inteligencia. Todo lo que hice fue ejecutar comandos. Pero aún así, fue Alan Turing, quien estableció el objetivo fundamental y la visión de la inteligencia artificial.

Ampliamente reconocido como el padre de la inteligencia artificial es John McCarthy, quien acuñó el término inteligencia artificial. Para él AI fue: "la ciencia e ingeniería de hacer máquinas inteligentes". Esta definición fue presentado en una conferencia en la Universidad de Dartmouth en 1956 y se indica que el principio de IA investigación. A partir de entonces AI florecido.

En el mundo moderno, la inteligencia artificial es ubicua. Se ha vuelto más popular gracias al aumento de los volúmenes de datos, los algoritmos avanzados y las mejoras en la potencia de cálculo y el almacenamiento. La mayoría de las aplicaciones de IA están conectadas a tareas intelectuales. Usamos IA para traducción, reconocimiento de objetos, rostro y voz, detección de temas, análisis de imágenes médicas, procesamiento del lenguaje natural, filtrado de redes sociales, ajedrez, etc.

La máquina de aprendizaje

El aprendizaje automático es una aplicación de artificial la inteligencia y se refiere a los sistemas que tienen la capacidad de mejorar a partir de la de su propia experiencia. La cosa más importante aquí es que el sistema necesita sabe cómo reconocer patrones. Para ser capaz de hacer que el sistema debe ser entrenamiento: el algoritmo de avance de grandes cantidades de datos, por lo que en algún punto es capaz de identificar patrones. El objetivo es permitir a los equipos para aprender de forma automática, sin intervención humana o de asistencia.

Cuando se habla de aprendizaje de la máquina, es importante mencionar aprendizaje profundo. Vamos a empezar diciendo que una de las principales herramientas que se utilizan en el aprendizaje profundo son las redes neuronales artificiales. Esos son los algoritmos que se inspiran en la estructura y función del cerebro, aunque tienden a ser estáticos y simbólico, y no de plástico y analógicos como los biológicos del cerebro. Así, en lo profundo de aprendizaje es una forma especial de aprendizaje automático basado en red neuronal artificial cuyo objetivo es replicar la forma en que los seres humanos aprenden y esto sirve como una gran herramienta para encontrar patrones que son demasiado numerosos para un programador para enseñar a la máquina. En el último par de años se ha hablado mucho acerca de que los coches sin conductor y de cómo podrían cambiar nuestras vidas. El aprendizaje profundo de la tecnología es la clave aquí, ya que reduce el riesgo de accidentes al permitir que el coche para distinguir a un peatón de un hidrante o reconocer una luz roja. El aprendizaje profundo de la tecnología también juega el papel principal en el control de voz en dispositivos como tabletas, teléfonos, refrigeradores, Televisores, etc. Empresas de comercio electrónico a menudo el uso de redes neuronales artificiales como un sistema de filtrado que intenta predecir y mostrar los elementos que un usuario desea comprar. El aprendizaje profundo de la tecnología también se utiliza en el campo de la medicina. Ayuda a los investigadores del cáncer de detectar automáticamente las células cancerosas y por lo tanto representa un enorme progreso en el tratamiento del cáncer.

Reconocimiento de voz

Tecnología de reconocimiento de voz sirve para identificar las palabras y las frases que forman el lenguaje hablado y convertirlos en un formato legible para la máquina. Mientras que algunos programas sólo pueden identificar un número limitado de frases, algunos de los más sofisticados programas de reconocimiento de habla, se puede descifrar habla natural.

Hay obstáculos que superar?

Mientras conveniente, la tecnología de reconocimiento de voz no siempre van bien y todavía tiene un par de problemas para trabajar a través de, como está en continuo desarrollo. Los problemas que pueden surgir pueden incluir entre otros los siguientes: la calidad de la grabación pueda ser inadecuada, podría haber ruidos en el fondo, que hacen difícil entender el altavoz, también el altavoz podría tener un fuerte acento o dialecto (¿has oído alguna vez la Geordie dialecto?), etc.

El reconocimiento de voz se ha desarrollado mucho, pero está todavía lejos de ser perfecta. No todo es sólo acerca de las palabras, la máquina todavía no se puede hacer muchas cosas que los seres humanos pueden: que no puede leer el lenguaje corporal o reconocer el tono sarcástico en la voz de alguien. La gente a menudo no se pronuncia cada palabra de la manera adecuada y que tienden a acortar algunas palabras. Por ejemplo, cuando habla rápido y de manera informal, los hablantes nativos de inglés a menudo se pronuncia "va "al igual que "va a." Todo lo anterior, las causas de los obstáculos para las máquinas que están tratando de superar, pero hay todavía un largo camino en frente de ellos. Es importante destacar que a medida que más y más datos se alimentan a esas algoritmos; los desafíos parecen disminuir. El futuro de los sistemas automatizados de voz reconocimiento parece ser brillante.

Voz-powered interfaces de usuario son cada vez cada vez más accesibles y populares en los hogares. Incluso podría convertirse en EL próximo la plataforma de la tecnología.

Gglot ofrece reconocimiento de voz automatizado en forma de servicios de transcripción automática: convertimos discursos en texto. ¡Nuestro servicio es fácil de usar, no le costará mucho y se realizará rápidamente!