Tecnologia

Como assistentes de voz se tornaram aliados de pessoas com deficiência

Ferramentas como Alexa e Google Assistente ajudam muito, mas precisam evoluir

21 de julho de 2021

Vinícius, meu irmão mais novo de 28 anos, adora assistir filmes na Netflix e no Amazon Prime Video quando está entediado — o que não é muito difícil de acontecer, ainda mais agora que já se passou mais de um ano e continuamos dentro de casa por conta da pandemia da Covid-19. Só agora ele descobriu que pode usar a voz para abrir um programa quase que instantaneamente. De uns tempos para cá, dá para ouvir ele conversando com a Alexa, pedindo que ela inicie uma série ou filme favorito no streaming.

A tecnologia seria ainda mais útil não fosse por um detalhe: a Alexa não consegue reconhecer pausas entre uma palavra e outra nas falas do meu irmão. Vinícius tem síndrome de Down e costuma gaguejar bastante, o que é algo natural da voz dele.

Interfaces como as que encontramos nos assistentes de voz — como Alexa, Google Assistente, Siri, Cortana e Bixby — estão em constante evolução, e nem sempre costumam ser inteligentes, de fato. Contudo, é nítido que quem interage com a tecnologia uma vez, sente que pode ser respondido sempre que surgir uma pergunta. Nesse sentido, idosos, pessoas com deficiência ou que requerem algum tipo de acessibilidade, têm encontrado uma companhia nesses dispositivos controlados por voz, seja para acender as luzes de casa, ligar a TV ou apenas bater um papo.

Cotidiano mais fácil. Ou quase

Embora não tenham sido pensados inicialmente como uma ferramenta de acessibilidade, a verdade é que os assistentes de voz transformaram a forma como pessoas que têm essa característica interagem com novas tecnologias. E isso sem que essa interação pareça forçada ou difícil de aprender, uma vez que utiliza uma das formas mais comuns de comunicação do ser humano: a voz, que é o único meio de contato entre o usuário e a interface.

“Ficou muito mais fácil interagir com o mundo. Antes, eu tinha que chamar alguém para desligar a TV, mudar de canal ou diminuir o volume. Podem parecer coisas bobas, mas os assistentes de voz são uma tecnologia que te dão muita autonomia”, conta a designer Marina Batista, dona do blog Rodando pela Vida, onde compartilha um pouco de sua vida.

Batista é tetraparésica e diagnosticada com atrofia muscular espinhal (AME) tipo 2, uma doença degenerativa neuromuscular caracterizada por degeneração e perda de neurônios motores da medula espinal e do tronco cerebral, resultando em fraqueza muscular progressiva e atrofia. A moça de 36 anos passa boa parte do tempo em uma cadeira de rodas e, por conta da deficiência, segurar um controle remoto pode ser uma tarefa pouco simples e muito cansativa.

Moradora de Campinas e usuária ávida do Twitter, Batista diz que sempre foi muito ligada em tecnologia. Com a voz, ela passou a prestar mais atenção após descobrir um grupo no Facebook voltado para pessoas com AME que faziam uso da Alexa, da Amazon. A princípio, ela diz ter ficado intrigada com o fato de pessoas contarem que usavam a Alexa para abrir/fechar uma porta ou para controlar a iluminação da casa, embora considere a tecnologia algo caro e inacessível para muita gente.

Hoje ela tem um Echo Dot que a auxilia a controlar a televisão e listar itens para comprar no supermercado. Para a designer, o maior ganho no uso dos assistentes está justamente na independência que eles proporcionam a pessoas que dependem de algum tipo de acessibilidade. “A questão toda envolvendo os assistentes de voz não é só na autonomia de decisão, mas a independência que eles te dão. Você faz quando você quer, e não quando alguém terminar uma outra tarefa e vem para te ajudar. Só o fato de ter essa independência dá uma levantada no ego e na autoestima. Você se sente mais ativo e funcional”, diz.

Além de pessoas com deficiência, Batista acredita que interfaces de voz podem servir de utilidade para pessoas inseguras que não estão acostumadas a computadores ou celulares tradicionais. A mãe dela, por exemplo, tem 55 anos e se dá melhor com o Echo Dot do que outros dispositivos. “Acho que a fala, por ser natural do ser humano, deixa a interação mais fluída”, declara.

Esse mesmo cenário pode ser visto na casa da dona Mercedes dos Santos Garcia, de 96 anos, avó da revisora Mariana Garcia Coelho, que por sua vez comprou um Echo Dot para a avó no ano passado. Mariana, que hoje mora em Portugal, diz que adquiriu o produto porque ele poderia ajudar sua família aqui no Brasil em muitas coisas dentro de casa — desde fazer lista de compras até a criar alarmes para lembrar quando sua avó Mercedes, que sofre de surdez, precisa tomar os remédios. “Para os mais velhos é uma tecnologia incrível. No caso da minha avó, não ajuda na praticidade, porque ela já está bem surda. Pelo menos ela fica entretida; até pede para tocar Tony Bennett”, diz Coelho, que ainda brinca com o fato de que sua avó cai na risada quando diz para a Alexa “soltar um pum”.

Ângela Garcia, mãe da Mariana, também destaca a praticidade de usar comandos de voz para controlar as coisas dentro de casa. A professora aposentada de 71 anos adora falar para a Alexa tocar sua playlist no Spotify, sem precisar destacar se é sua lista favorita de músicas, artista ou banda específicas. Ela, que também precisa tomar remédios em dias controlados, tem a ajuda de dois dispositivos Echo em casa que a lembram de quando ingerir a medicação.

O que elas sentem falta em assistentes de voz como a Alexa e o Google Assistente (que é usado no celular de Angela) é um sinal luminoso que poderia ser de utilidade para usuários com surdez parcial ou total. “Talvez um sensor de presença para tornar tudo ainda mais fácil, ou até algo dentro da própria inteligência artificial que reconheça pausas na fala”, afirmam.

Assistentes ou interfaces?

Por terem a fala como principal funcionalidade, muitos dispositivos com assistentes de voz acabam por se moldar de acordo com a forma com que cada usuário interage com tais aparelhos. Ainda assim, os testes atuais no mundo real mostram que os assistentes têm um longo caminho pela frente para tornar a experiência, de fato, mais assistiva.

“Eu consigo treinar um sistema e ele próprio, a partir de um conjunto de dados, extrair algumas regras, perceber algumas recorrências ou encontrar similaridades. O que acontece é que nem sempre isso é previsível”, explica Luiza Santos, doutora em Comunicação e Informação pela Universidade Federal do Rio Grande do Sul (UFRGS) e fundadora do projeto Escola de Comunicação. “Contudo, o próprio sistema encontra em seu banco de dados elementos que permitem que ele aprenda e vá se refinando ao longo do tempo. Inclusive, esse sistema de treinamento com bancos de dados é usado no processamento de linguagem natural, um subcampo na inteligência artificial no qual você pode aplicar técnicas de aprendizado para funcionar nos assistentes de voz”, completa.

Santos também tem pesquisas acadêmicas focadas na comunicação digital, em especial no âmbito da inteligência artificial. Sua tese de doutorado foi sobre as formas de utilização, interação e percepção dos assistentes pessoais digitais no Brasil, incluindo como essas tecnologias foram pensadas do ponto de vista da indústria.

Outra característica investigada pela pesquisadora é que os assistentes sempre vão tentar simular o comportamento humano porque “é na comunicação que os humanos geram o efeito de pensamento”. Para a pesquisadora, isso continuará impactando o campo de inteligência artificial até chegar ao ponto que uma IA poderá sim se passar por um ser humano de verdade.

O que muitas pessoas não estão cientes é que, segundo Santos, antes de serem tecnologias assistivas, dispositivos controlados por voz são interfaces que sempre tentam executar algum comando pré-definido. É a mesma coisa de um comando digitado, mas aqui a diferença é que tudo acontece por meio da voz. E como a voz é um meio mais natural de comunicação, as pessoas aprendem a se comunicar com eles na utilização contínua. Ao mesmo tempo, percebem que não podem falar qualquer coisa porque, caso o contrário, não recebem resposta alguma.

Na opinião da comunicóloga, isso acontece porque as empresas desenvolvem os assistentes de voz para atender a um padrão, e não cada usuário em sua particularidade — como a questão que envolve a acessibilidade, por exemplo. Ela também acredita que, com o passar do tempo, vai acontecendo um aprendizado mútuo entre a máquina/interface e o usuário, mas que, mesmo que o assistente aprenda pouco a pouco como fugir um pouco do padrão, no final das contas as pessoas se limitam a técnicas específicas de como precisam falar.

“O desenho desses dispositivos, na visão das grandes empresas, é que ele não é pensado para pessoas que não estão inseridas no padrão imaginado originalmente. A gente sabe que precisa imaginar uma pessoa do outro lado na criação de qualquer produto, e às vezes a imaginação é limitada. Como consequência, grupos minoritários sofrem de baixa representatividade, pois, por mais que essas tecnologias possam servir para esse público, elas não foram pensadas para esse público.”

A pesquisadora afirma que tem tido um aumento expressivo de investimentos voltados para tecnologias de voz devido a um certo cansaço ou excesso de telas no qual estamos expostos. Ainda mais desde o último ano, quando passamos a ficar mais tempo em casa devido à pandemia do coronavírus.

A designer Marina Batista também acredita que a inteligência artificial precisa evoluir para se adaptar aos diferentes tipos de fala dos usuários. “Minha fala, por exemplo, não é linear pela questão respiratória. Então às vezes a Alexa não reconhece o que estou falando e preciso repetir o comando. É verdade que o uso com ela vai melhorando porque a assistente aprende a forma como a pessoa fala, mas ainda existem pontos que precisam ser otimizados. Quanto mais as coisas forem se naturalizando nos próprios produtos, sem a gente ficar cobrando, melhor vai ser. Não é um efeito manada, mas uma forma para outras pessoas verem que é possível fazer”, completa.

Alexa como serviço

O Google e a Samsung também têm assistentes de voz importantes para pessoas com deficiência. No entanto, convidamos as empresas para comentarem suas iniciativas de inclusão nos assistentes de voz, mas até o fechamento desta reportagem não obtivemos respostas. De qualquer forma, a Alexa, da Amazon, tem se destacado no mercado.

E isso não é em vão, uma vez que a tecnologia se tornou um dos focos de investimento da Amazon. “Como empresa, temos mais ofertas de dispositivos, tanto da própria Amazon, com as linhas Echo e Fire TV, quanto com marcas parceiras compatíveis com Alexa, incluindo TVs, alto-falantes e outros produtos”, destaca Marina Zveibil, gerente de comunicação para dispositivos Amazon e Alexa. A executiva reconhece que a Alexa vai aos poucos aprendendo com o tempo de cada usuário, mas que essa é uma tecnologia que demora para aprender e vai melhorando conforme a pessoa vai testando e insistindo.

Thais Cunha, gerente de marketing da Alexa no Brasil, destaca ainda que os dispositivos estão se adaptando não apenas às particularidades de fala de cada usuário, mas também às deficiências que eles possam ter. Prova disso é a criação do Prêmio Alexa de Acessibilidade, que recompensa desenvolvedores responsáveis por criar recursos com foco em ajudar pessoas com deficiência, usando a tecnologia de voz presente nos dispositivos com Alexa. O concurso é uma iniciativa em parceria com a AACD (Associação de Apoio à Criança com Deficiência), Fundação Dorina Nowill para Cegos e Instituto Jô Clemente (antiga APAE de São Paulo), focado na saúde e inclusão de pessoas com deficiência mental.

“Ações como essa são de extrema relevância para a sociedade, pois reforçam a importância de democratizar o acesso à tecnologia para todas as pessoas, incluindo as que mais têm dificuldade. Acreditamos muito na parceria com a Amazon. Estamos completando 60 anos de atuação na causa da deficiência intelectual no Brasil e nosso propósito sempre foi a inclusão, a acessibilidade e o protagonismo das pessoas com deficiência intelectual. Tecnologias que possam auxiliar nesse processo são essenciais. É importante também apostarmos em meios de disseminar conhecimento para orientar a sociedade sobre como é importante respeitar e valorizar o potencial das pessoas com deficiência”, contam Isa Degaspari, gerente de Desenvolvimento Institucional, e Victor Martinez, supervisor do Serviço de Inclusão Profissional e Longevidade do Instituto Jô Clemente.

Segundo Cunha, trabalhar com essas instituições foi fundamental para que a Amazon conseguisse criar um programa de impacto para o público que depende de alguma acessibilidade. “Entendemos um pouco quais eram as necessidades [desse público] e como a tecnologia por voz poderia ajudar na inserção de pessoas que vivem com tais barreiras”, comenta.

Zveibil afirma que a ideia do concurso partiu das avaliações dos usuários nas páginas dos dispositivos Echo na Amazon e em como, de alguma forma, eles foram capazes de mudar o cotidiano de pessoas idosas e deficientes. Também foi criada uma ação com a ex-ginasta brasileira Laís Souza, que ficou tetraplégica após sofrer um acidente durante um treinamento para os Jogos Olímpicos de Inverno de 2014. Laís é uma das embaixadoras do Prêmio Alexa de Acessibilidade.

Para selecionar os inscritos no prêmio, Zveibil e Cunha dizem que é feita uma curadoria com os desenvolvedores para que os projetos se perpetuem mesmo depois do fechamento do concurso. “Tivemos mais de 400 pessoas inscritas no programa, o que é bastante significativo visto que estamos falando com uma comunidade específica. Muitas delas eram desenvolvedores com deficiências visual e física, e percebemos o quanto a comunidade estava engajada”, contam.

Em fevereiro deste ano, foram anunciados os vencedores da última edição do Prêmio Alexa de Acessibilidade. O primeiro lugar foi para a desenvolvedora Adriana Rita pela skill “Memória Sonora”, um jogo da memória que usa sons no lugar de cartas e tem como objetivo ajudar pessoas com diferentes tipos de desordem das funções cognitivas como demência, doenças degenerativas e deficiências intelectuais. Também pode ser usada por pessoas cegas ou com baixa visão.

O segundo lugar ficou com Marcos Medeiros, engenheiro formado, mestre em sistemas e computação e doutorando em sistemas e computação pela Universidade Federal do Rio Grande do Norte. Ele criou a skill “Onde Guardo Isso?”, que visa auxiliar pessoas com deficiência intelectual, sugerindo locais onde os objetos podem ser guardados e lembrá-los onde estão.

Mesmo não tendo uma deficiência, Medeiros conta que desenvolveu sua skill de última hora, poucas semanas antes do concurso ser encerrado. Segundo o desenvolvedor, existe um desafio em criar uma aplicação para pessoas com acessibilidade porque cada uma apresenta uma característica que requer um comando específico. “Eu levei em consideração o fato de que, para atender a pessoas com deficiência intelectual, os diálogos precisavam ser claros, curtos e com respostas pequenas. Além disso, há algumas dificuldades que os desenvolvedores não conseguem contornar sozinhos por completo e vai depender da evolução da Alexa (e outros assistente de voz) para identificar e entender a voz de pessoas com dificuldade de fala — se falam muito devagar, se gaguejam etc. Por mais que você tente fazer algo para melhorar o entendimento, tem sempre limites da tecnologia usada”, diz.

O engenheiro também afirma que tecnologias de acessibilidade por voz podem auxiliar na inclusão, permitindo a interação de pessoas com e sem deficiência, além de analfabetos. “Elas ajudam na autonomia e autoestima, quem tem dificuldade motora e podem melhorar indiretamente a qualidade de vida de quem não consegue interagir com dispositivos”, completa.

No terceiro lugar do Prêmio Alexa de Acessibilidade está a skill “Localizador de ônibus São Paulo acessível”, criada pelo desenvolvedor de software Felipe Borges. Assim como aconteceu com Medeiros, a Alexa foi o primeiro contato do carioca de 31 anos com assistentes de voz, e que, inicialmente, ele ficou curioso em desenvolver uma skill para dispositivos compatíveis com a tecnologia. A skill visa ajudar pessoas cegas ou com baixa visão a ter informações a respeito da previsão da chegada dos ônibus, a localização e o endereço do ponto, se o ônibus que está chegando é acessível, se o ônibus esperado passa no ponto onde o usuário se encontra e o destino final de cada ônibus.

“A tecnologia está em constante evolução, e acredito que ela está aí para ajudar muitas pessoas na inclusão de absorver qualquer tipo de conteúdo. Já existem influenciadores digitais cegos, que inclusive entrei em contato na época do concurso para conversar sobre a divulgação da skill. A própria Fundação Dorina, que foi um dos jurados do concurso, ensina tecnologia para pessoas cegas”, explica.