Bloomberg, miles de empleados de Amazon están escuchando grabaciones de voz de Echo

Amazon tiene miles de empleados que escuchan los clips de audio de Echo como parte de la mejora del aprendizaje automático de Alexa para que el asistente personal pueda responder mejor a los comandos de voz.

Estas personas están escuchando lo que algunos propietarios de Alexa le dicen al asistente, revisando, transcribiendo y anotando grabaciones de audio para ayudar a entrenar el modelo de aprendizaje automático de Alexa..

Bloomberg tiene la historia:

El trabajo es mayormente mundano. Un trabajador en Boston dijo que extraía datos de voz acumulados para expresiones específicas como 'Taylor Swift' y los anotó para indicar que el buscador se refería al artista musical.

Hasta ahora todo bien, pero ...

Ocasionalmente, los oyentes recogen cosas que los propietarios de Echo probablemente preferirían mantener en privado: una mujer cantando mal en la ducha, por ejemplo, o un niño que grita pidiendo ayuda. Los equipos usan salas de chat internas para compartir archivos cuando necesitan ayuda para analizar una palabra confusa o encontrar una grabación divertida.

Comparto la grabación de audio de un cliente con un compañero de trabajo con el fin de hacer el trabajo. Pero compartir un clip de audio con un colega solo porque el usuario podría haber dicho algo gracioso o estúpido se siente totalmente mal y poco profesional para mí..

A veces escuchan grabaciones que les parecen molestas o posiblemente criminales. Dos de los trabajadores dijeron que recogieron lo que creen que fue una agresión sexual. Cuando sucede algo así, pueden compartir la experiencia en la sala de chat interna como una forma de aliviar el estrés..

Si bien Amazon tiene un proceso para que sus trabajadores lo sigan cada vez que escuchan algo angustiante, algunos empleados fueron rechazados en términos claros con la explicación de que no era el trabajo de Amazon interferir.

Para aquellos preocupados por la privacidad, el informe afirma que las personas en este equipo están escuchando solo algunas de las grabaciones de voz que fueron capturadas en las casas y oficinas de los propietarios de Echo..

Un portavoz de Amazon comentó:

Nos tomamos en serio la seguridad y la privacidad de la información personal de nuestros clientes. Solo anotamos una muestra extremadamente pequeña de grabaciones de voz de Alexa para mejorar la experiencia del cliente.

Por ejemplo, esta información nos ayuda a capacitar nuestros sistemas de reconocimiento de voz y comprensión del lenguaje natural, para que Alexa pueda comprender mejor sus solicitudes y garantizar que el servicio funcione bien para todos..

Los archivos de audio no tienen información identificable, como el nombre completo y la dirección de un usuario. Dicho esto, Amazon podría haber sido más transparente con su recopilación de datos:

El proceso de revisión de voz de Alexa, descrito por siete personas que han trabajado en el programa, destaca el papel humano que a menudo se pasa por alto en la capacitación de algoritmos de software. En los materiales de marketing, Amazon dice que Alexa 'vive en la nube y siempre se está volviendo más inteligente'. Pero como muchas herramientas de software creadas para aprender de la experiencia, los humanos están enseñando algo.

Los usuarios pueden ajustar la configuración para evitar que Amazon use sus grabaciones de voz para mejorar Alexa.

El gigante minorista en línea reconoce que las solicitudes de Alexa se están utilizando "para entrenar nuestros sistemas de reconocimiento de voz y comprensión del lenguaje natural", pero esto está oculto en una lista de preguntas frecuentes en su sitio web. No importa cómo lo mire, el reconocimiento de voz contextual es un hueso duro de roer, pero el aprendizaje automático promete ser la solución correcta. El problema es que los modelos de aprendizaje automático deben ser entrenados.

Amazon tiene equipos de personas que etiquetan y categorizan las consultas de voz de Alexa

Por ejemplo, Apple ha entrenado Face ID con más de mil millones de fotografías de rostros de personas. En cuanto al reconocimiento de voz, lograr una alta precisión requiere grandes cantidades de datos etiquetados.

Es por eso que lanzar Siri en un nuevo idioma no es posible sin tener suficientes datos para entrenar a los modelos acústicos, y esos datos deben provenir de personas reales que realizan consultas de voz reales. La única diferencia entre Amazon y Apple es que el primero tiene humanos escuchando algunas de esas grabaciones, mientras que el segundo, presumiblemente, no.

Ahora que sabe que Amazon tiene un equipo global que escucha los clips de audio de Alexa, es más o menos probable que continúe usando los productos Echo?

Háganos saber dejando un comentario a continuación.