líderes en noticias de marketing, publicidad y marcas

Esther Checa Innovation Director en t2ó

Cómo impacta la voz en la productividad de las organizaciones

voz

Entender cómo está evolucionando el uso de la voz en nuestra vida personal y profesional, viene muy marcado por cómo las personas incorporamos la experiencia de voz en nuestro día a día (casa, coche, trabajo, etc), y esta, está directamente relacionada por el conocimiento que se tiene sobre cómo interrogar a los asistentes de voz, y los dispositivos que los incorporan, esto es algo que evoluciona, pero que sigue sin ser masivo. 

Por ejemplo, nuestra experiencia de búsqueda con motores de búsqueda la hemos desarrollado durante más de 20 años, y buscar por voz supone el mismo reto. Buscar usando la voz es orgánico, pero entender cómo debe ser la relación con los asistentes y dispositivos para obtener el mejor resultado, es el reto de aprendizaje. 

La tecnología de consumo tiende a cambiar el comportamiento de las personas, y estas experiencias, luego impulsan su demanda/uso en los entornos empresariales (ej. del uso personal que surgió con Instant Messenger o Skype, pasó a un entorno profesional hasta evolucionar con la aparición de Slack como herramienta de trabajo), y esto es algo que podremos extrapolar con el uso de la voz en las diferentes aplicaciones/dispositivos. Su uso gradual en nuestro día a día personal (ej. a través de dispositivos como Amazon Echo, Apple HomePod o Google Home) tendrá un reflejo en la vida profesional, esto será parte de éxito de la voz en la empresa, de hecho, Gartner predice que para 2023, el 25% de las interacciones de los empleados con las aplicaciones serán a través de la voz

Dicho ésto, el uso de asistentes de voz usados en diferentes dispositivos, se ha incrementado en 5 puntos con respecto al 2019, por lo que su interés por parte de los usuarios sigue creciendo. En España el uso de los asistentes de voz según datos de la IAB (Estudio Mobile & Conectividad Inteligente 2021) está teniendo un consumo principalmente en smartphones (68,1%), altavoces inteligentes (36,3%), tablets (16,8%), TV conectada (16,3%), smartwatches (9,2%) y coche conectado (8,5%), sin embargo, la forma en la que incorporamos estas experiencias en nuestra vida personal, no se encuentran tan generalizadas en nuestra vida profesional. 

Actualmente, los hábitos de consumo que tenemos en términos de productividad se centran principalmente en móvil, con una duración media por persona/mes en 44 minutos vs la tablet que está en 48 minutos, sin embargo, todas las tecnológicas (Microsoft, Alexa, Google) incorporan funcionalidades de productividad vía voz en sus asistentes, esto hace que aspectos como dictar y enviar correos correos, buscar documentos, etc, puedan gestionarse vía voz independientemente del contexto y el dispositivo, esto nos dice que será algo que se incorporará en nuestro día a día profesional a medida que se sepa que existen estas funcionalidades, y que se entienda cómo incorporarlas en la operativa empresarial.

El uso de la voz en entornos laborales 

Amazon ha desarrollado Alexa for Business, éste se ha concebido como un servicio que permite usar Alexa para ser más productivos en tareas como: la reserva/anulación de salas de reuniones, iniciar llamadas en conferencias, realizar avisos de finalización de reuniones, registro automático de las métricas relacionadas con las salas de reuniones, vincular los correos electrónicos y agendas de los empleados con Alexa,  o reprogramar eventos de reuniones de la agenda, entre otros; en el caso de los equipos de IT, éstos pueden crear skills  personalizadas para usar una interfaz de voz en aplicaciones como Salesforce, ServiceNow o cualquier otro servicio, o aplicación personalizado. 

En Microsoft, su foco en la productividad personal utilizando la voz la han llevado con Cortana a Windows 10, ayudando a encontrar la información de forma más rápida, buscar documentos, gestionar el calendario, redactar correos electrónicos, unirse a reuniones online en Microsoft Teams, obtener información personal sobre las personas de la organización, crear y agregar a listas a través de las cuales se pueden gestionar tareas, abrir las aplicaciones que tengas en el ordenador, u obtener información sobre el significado de palabras y/o preguntas concretas (también permite abrir Alexa usando la aplicación Cortana); hace casi dos años también presentaron Play My Emails en Outlook para iOS, que utiliza Cortana (también está para Android), este asistente de productividad personal permite la lectura de los correos electrónicos de la bandeja;  Cortana también es compatible con las cuentas de trabajo (en inglés) en la aplicación móvil de Teams y las pantallas de Microsoft Teams, para ayudar durante las reuniones; y finalmente, Cortana también se incorpora en el Brief email, éste realiza un resumen personalizado y procesable en Outlook con información sobre las próximas reuniones, y las tareas pendientes. 

En cuanto a dispositivos, Microsoft incorpora Cortana en los Surface Headphones a través de los cuales se puede ejecutar acciones de productividad, como enviar correos, crear recordatorios, o unirse a una reunión de Skype o Teams. 

En el caso de Google, a través de Google Assistant (instalado en cualquier Android e iOS) también va a poder gestionar bastantes funcionalidades de productividad, por ejemplo: el asistente puede acceder a las aplicaciones de Workspace (antes G Suite). Estas capacidades las comunicó en su evento Cloud Next’19) permitiendo por ejemplo abrir las aplicaciones y buscar en ellas los documentos;  programar llamadas; generar mensajes de texto; recordatorios de hora y día (recurrentes y aleatorios); crear notas; programar y cancelar de reuniones de Google Calendar (estas funcionalidades son una respuesta a las capacidades desarrolladas por Amazon con Alexa for Business).

El asistente también está integrado con IFTTT para automatizar tareas y agilizar los procesos comerciales, disponible en dispositivos Android, iOS y Google Home. IFTTT También está disponible para Alexa y Sonos (ej. control de apagado de equipos, agregar tareas, agregar contactos, etc); y el asistente también puede conectarse con los dispositivos Google Hangouts Meet creados por Asus (en beta) para agilizar las llamadas telefónicas y las reuniones en salas de conferencias físicas. 

En diciembre de 2020 Google anunció la integración de Zoom en las patalla inteligentes de Google, por lo que Zoom for Home es compatible con dispositivos Google Nest Hub Max, para iniciar una reunión es tan fácil como decir «Ok Google, únete a una reunión» (disponible por el momento en EEUU, Reino Unido, Australia y Canadá en inglés).

Oracle también dispone de su Oracle Digital Assistant Platform, a través de la cual permite la colaboración entre equipos, automatización de tareas manuales o soporte multilingüe. Sin duda alguna, las grandes tecnológicas que están desarrollando su estrategia de voz, cambiarán la industria del desarrollo de software. 

La biometría por voz en el trabajo

Sin embargo, no dejaría de mencionar otro tipo de aplicaciones que hay en el mercado y que se pueden aplicar a los entornos de trabajo para mejorar la productividad de los empleados, son la biometría vocal para realizar tareas como autenticación de identidad, la generación de firmas electrónicas a distancia o la transcripción de voz a texto, estas funcionalidades las ofrece la start up murciana Biometric Vox, la inglesa Voicekey o la multinacional norteamericana Nuance

También el  uso de la inteligencia artificial se está aplicando para analizar la voz humana en los call center, y ayudar a entender la emociones que se experimentan durante la conversación, y por tanto, su satisfacción, esta solución la ofrece la empresa valenciana Analyticalls; trabajar la colaboración con equipos en remoto a través de notas de voz dejadas en documentos (esto matiza mucho el tomo y la forma en la que se realizan las anotaciones/observaciones), lo desarrolla la compañía Walkie; o la aparición de Otter Assistant (Otter.ai), es un asistente para Microsoft Teams, Google Meet y Cisco Webex cuya función es la transcripción de la conversación que se puede generar en una reunión, crear un conjunto de actas, compartirlo con todos asistentes (incluso si el usuario no está presente) o tomar capturas de pantalla e insertarlas como ilustraciones en las notas de la reunión.

La productividad por voz en entornos B2B

Si miramos hacia otros otros sectores B2B, la presencia de tareas rutinarias también buscan respuesta, por ejemplo, dentro del entorno Industrial (minería, energía, campo, aeroespacial o manufactura), también nos podemos encontrar la tecnología de inteligencia artificial Datch Assistant, utilizada para procesos industriales que permiten conectarse e interactuar con los sistemas internos.

Y si nos movemos al sector de la salud, nos encontramos empresas como Suki, donde su solución de voz es utilizada diariamente por los médicos para crear varios cientos de notas cada semana, su software también puede escuchar conversaciones entre médicos y pacientes y crear planes de acción; Saykara (empresa que forma parte de Nuance) es un asistente de inteligencia artificial móvil que automatiza los registros médicos, escucha en tiempo real la conversación entre el paciente y el médico durante una visita. Los algoritmos de aprendizaje automático subyacentes, interpretan y transforman el contenido destacado de la conversación para generar notas, pedidos o referencias; el propio Amazon tiene su servicio (ASR) Amazon Transcribe Medical, donde transcribe de forma precisa terminología médica como nombres de medicamentos, procedimientos e incluso estados médicos y enfermedades. 

Este servicio puede tener casos de uso como como la transcripción de conversaciones entre pacientes y médicos para la documentación clínica, la captura de llamadas telefónicas en farmacovigilancia, o el subtitulado de consultas de telemedicina; y Google y Microsoft/Nuance también están desarrollando herramientas de transcripción de voz similares, que ayudan a mitigar la fatiga de los médicos a la hora de tomar notas y generar informes clínicos de los pacientes (los médicos puede dedicar 6 horas de una jornada laboral de 11 a estas tareas). 

Como vemos, cada vertical tiene sus propias necesidades de productividad, y en todos estos verticales están surgiendo empresas especializadas en inteligencia artificial conversacional para dar respuesta. 

Privacidad y seguridad de la voz en el entorno laboral 

Dentro del entorno laboral, la biometría de voz es una de las propuestas que más se están impulsado para que ésta se convierta en un autentificador e identificador de identidad de una persona de manera digital y remota, evitando introducir passwords de forma manual, y ayudado a eliminar el fraude, por ejemplo, esta tecnología se está incorporando desde diferentes sectores (ej. sector Banca) para sus canales de atención al cliente. Este tipo de soluciones las tenemos en España con empresas como Veridas, y multinacionales como Nuance. 

Pese a estas tecnologías ¿Qué están haciendo las grandes empresas tecnológicas para cambiar la percepción de falta de privacidad y seguridad? La pandemia ha hecho que las grandes tecnológicas hayan centrado sus esfuerzos en dar respuesta a las empresas, uno de estos esfuerzos ha sido las comunicaciones desde la perspectiva de la mensajería, evolucionando posteriormente otro tipo de servicios vía voz, y en este contexto, la privacidad ha sido una prioridad a media que que han surgido noticias sobre el uso indebido de datos de voz confidenciales.

Durante 2019 se reveló la activación de Alexa de forma accidental en la escucha de conversaciones privadas, acusando a Amazon de emplear trabajadores contratados para anotar miles de horas de audio desde dispositivos con tecnología de Alexa; y situación similar se ha vivido con Google Assistant, se acusó a los empleados de la escucha sistemática de los archivos de audio grabados por los altavoces inteligentes de Google Home y la aplicación de Google Assistant para teléfonos inteligentes, algunas de estas conversaciones contenían información confidencial.

Todo ésto ha hecho que en el último año, Google y Amazon hayan ido comunicando cómo se puede gestionar la eliminación del histórico de grabaciones sobre las consultas que se realizan en sus asistentes de voz (ej. ‘Ok Google quiero eliminar mis grabaciones’, nos llevará a la página myactivity.google.com para poder gestionar las preferencias de privacidad). 

A principios de 2021, Google lanzó el ‘privacy-sensitive Guest Mode’, a través de éste, los usuarios de sus altavoces y pantallas inteligentes no tienen que iniciar sesión, ésto hace que no se guarde su actividad, la activación del ‘modo invitado’ llevará asociado que no ofrecerá respuestas personalizadas (ej. entradas del calendario o contactos), ni guardará las interacciones en cualquier cuenta con la que haya iniciado sesión; Google en 2019 presentó TensorFlow Privacy, una biblioteca de código abierto para su marco de aprendizaje automático, está diseñada para facilitar a los desarrolladores el entrenamiento de modelos de IA con sólidas garantías de privacidad. 

Amazon dispone de una página específica donde explica qué ocurre cuando se habla con Alexa, los datos que se envían a la nube, si graba las conversaciones o cómo se pueden borrar las grabaciones de voz, entre otros.  

Microsoft comunicó a principios de año un mayor control por parte de los usuarios sobre sus datos de voz, y cómo podrá mejorar su tecnología de voz sin penalizar la privacidad de los usuarios; desde finales de 2020, dejó de almacenar clips de voz procesados ??por sus tecnologías de reconocimiento de voz. Esto aplica a sus productos ??Microsoft Translator, SwiftKey, Windows, Cortana, HoloLens, Mixed Reality y traducción de voz de Skype. En el caso de Dynamics 365 Customer Voice cumple con la GDPR.

Inevitablemente estas compañías necesitan datos de voz para entender el tono, el género, la intención, estado emocional, el estilo, etc, del hablante, para mejorar sus productos y para entrenar sus modelos de inteligencia artificial, sin datos, la inteligencia artificial de estos productos y experiencia conversacional, difícilmente será eficiente, pero también deberán ser más transparentes sobre cómo recogen los datos, qué uso se les dá o cómo hacer partícipe a los usuarios.  

Estas empresas también deberían ofrecer explicaciones sobre las limitaciones de sus sistemas de inteligencia artificial, y la necesidad que tienen de validaciones con personas para garantizar la calidad de sus productos (de ahí la necesidad de escucha manual de los audios de voz), de lo contrario, será inevitable que siga habiendo desconfianza en el uso de estos dispositivos, nos enfrentamos a una tecnología/dispositivos relativamente nuevos, y es muy necesario establecer bases de confianza.  

Cómo la voz transforma el lugar de trabajo 

La incorporación de la voz en los procesos de productividad puede crear nuevas experiencias, cambiando drásticamente la forma de interactuar que tenemos ahora con dispositivos y herramientas dentro de las empresas (ej. aplicaciones de voz que pueden transcribir reuniones, mientras los trabajadores realizan otro tipo de actividades que requieran mayor concentración o intervención humana; usuarios en sectores industriales/servicios que pueden activar funciones rutinarias mediante la voz, mientras ponen foco en otras actividades, etc), esto obligará a los equipos de IT, RRHH y empleados a entender cómo es la huella digital que tiene la actividad de voz, cómo las aplicaciones de voz conectan con otros sistemas (ej. Bases de datos), como se anonimizan los datos y/o se recopilan, o la relación con el exterior (ej. proveedores), entre otros.  

El éxito de la voz dentro de las organizaciones va a venir marcado por el grado de adopción que quieran hacer los empleados, si los empleados ven y entienden los beneficios de usar la voz, entonces funcionará, de lo contrario, podrá crear ineficiencias. Es recomendable que las empresas implementen funcionalidades de voz de forma escalonada, y evalúen si la inversión de su implementación les lleva a tener resultados valiosos.

Esther Checa, Innovation Director en t2ó

 

2021: el año en el que se ha transformado el consumo de la televisión en EspañaAnteriorSigueinteSoluciones de identidad, datos de retail y digitalización de la publicidad exterior: las tendencias que marcarán el marketing en 2022

Contenido patrocinado