Divulgação: Showcase

Redes neurais garantem televisão acessível a todos

Sistemas com capacidade de aprendizado simplificam a implementação de soluções de acessibilidade para pessoas com deficiência visual e auditiva, em qualquer plataforma, afirma Showcase

Divulgação: Showcase

A dificuldade de acompanhar filmes, novelas ou telejornais por conta de uma deficiência visual ou auditiva afeta ao menos 8,5 milhões de cidadãos brasileiros. Esta constatação foi anunciada em junho passado, no Panorama Nacional e Internacional da Produção de Indicadores Sociais do Instituto Brasileiro de Geografia e Estatística (IBGE). O estudo identificou 6,5 milhões de pessoas com deficiência visual severa, dos quais 500 mil são cegos, e pouco mais de dois (2) milhões com deficiência auditiva severa. São cidadãos que dependem de Legendas Descritivas (Closed Caption), da Audiodescrição e da Janela de Libras para compreenderem e desfrutarem integralmente de produções audiovisuais, espetáculos e eventos.

Para garantir o acesso universal a estas ferramentas, órgãos federais como a Ancine (Agência Nacional do Cinema) e o Ministério da Ciência, Tecnologia, Inovações e Comunicações têm publicado normas e leis estabelecendo metas de adoção e de qualidade nas transmissões televisivas, obras cinematográficas e propaganda eleitoral, por exemplo. Já entidades como o Fórum SBTVD (Fórum do Sistema Brasileiro de TV Digital) e a ABNT (Associação Brasileira de Normas Técnicas) trabalham há mais de dez anos nas diretrizes técnicas gerais que afetam a cadeia de serviços, da produção à exibição, impulsionando a criação de soluções revolucionárias para atender diversas condições de percepção e cognição, explica a Showcase em comunicado.

Se no passado o uso das tecnologias para acessibilidade era caro e restrito, hoje temos outro cenário. Graças à digitalização das mídias audiovisuais, agora podemos integrar sistemas de Legendagens, Audiodescrição e Libras, gerados em tempo real, a qualquer plataforma e em qualquer lugar do mundo. Não importa a velocidade, o timbre ou o idioma de quem fala, o espectador terá sempre a transcrição precisa do que está sendo dito e sem atrasos. Da mesma forma, as descrições são incluídas em um canal de áudio especial, acionável a qualquer momento.

No ambiente de televisão, afirma a Showcase, tal nível de eficiência é atingido com o uso de redes neurais capazes de identificar vozes, onomatopeias e outros sons, bem como de aprender novas palavras, alimentando um banco de dados dinâmico. Assim, mesmo quando há um novo participante ou alguém com sotaque diferente dos demais em um programa acontece uma adaptação automática e novos vocabulários são incorporados. Esta capacidade evolutiva independe de intervenção humana e acontece de forma contínua, tirando partido do conceito de Machine Learning.

Cabe ao Implementador de Funções de Dados e Remultiplexação com módulo de Closed Caption Automático embarcar toda esta tecnologia em uma poderosa plataforma de 64 bits com baixíssima latência e altíssimo tempo médio entre falhas (MTBF), apta a realizar a inclusão de dados e a remultiplexação compatíveis com os sistemas de transmissão de TV Digital ISDB-T.

O desenvolvimento destas soluções de acessibilidade requer o estado da arte em tecnologia e o atendimento aos mais altos requisitos de operação, confiabilidade, facilidade de manutenção e conformidade da sinalização de dados de alta performance e missão crítica. Entre os requisitos atendidos estão à conformidade com as normas ABNT; guia Eletrônico de Programação (EPG) em conformidade com a norma ABNT, incluindo os tipos H-EIT, M-EIT e L-EIT e todos descritores obrigatórios e facultativos; legendas ocultas (Closed Caption) em conformidade com a norma ABNT, com transcodificador do padrões CEA-608, CEA-708 e ABNT; Legendas Ocultas (Closed Caption) em conformidade com a norma ABNT, com transcodificador do padrões CEA-608 e CEA-708, entre outros.