DTV PLAY/TV 2.5: Nuances, hibridizações e tendências do Sistema Brasileiro de Televisão Digital – Primeira Parte

SET EXPO 2019 – O OLHAR DOS ESPECIALISTAS

A jornalista, professora e coordenadora do Obted analisa, em duas partes, o momento que atravessa o SBTVD, e como as emissoras brasileiras olham o fenômeno da TV híbrida e o Perfil D do middleware Ginga, que permite maior imersão e interação

por Deisy Fernanda Feitosa

Uma nova geração tecnológica implementada na televisão digital brasileira terrestre, aberta e gratuita, está chegando à casa dos telespectadores. Trata-se de uma TV híbrida, que ora lança mão de características da transmissão terrestre, ora da transmissão por IP (Internet Protocol). Apesar de ganhar novos ares com o nome DTV Play, considerado um novo framework do Sistema Brasileiro de Televisão Digital Terrestre (SBTVD-T), tem como base o middleware brasileiro Ginga. Assim, DTV Play é o nome comercial do novo perfil de receptores Ginga, identificado na Associação Brasileira de Normas Técnicas (ABNT) como Perfil D. Seu principal objetivo é trazer maior integração entre broadcast e broadband, integrando também dispositivos pessoais durante a experiência do usuário. O Perfil D traz uma evolução tanto em relação à linguagem NCL, quanto no que diz respeito à incorporação do HTML 5.
O artigo “Transmissão híbrida na TV aberta brasileira: o DTV Play e as suas potencialidades”, publicado na edição 181 da Revista da SET, descreveu o Perfil D do Ginga, que naquele momento, ele estava em fase de definição de suas normas e de consulta pública na ABNT. Em poucas palavras, o sistema traz uma televisão mais imersiva e interativa em relação às experiências que temos tido até hoje.

Com o sistema de áudio imersivo é possível regular e dar prioridade aos sons presentes em cena como se observa nas fotos acima

Assim como os Estados Unidos e a Europa, que desenvolveram novas versões dos seus padrões (ATSC 3.0 e DVB-T2, consecutivamente), o Fórum Brasileiro de Televisão Digital (Fórum SBTVD) está buscando aprimorar o padrão nacional. Nesta análise exporei as transformações que devem ocorrer na televisão brasileira, efetivamente, a partir de 2020, e descreverei as tendências tecnológicas para o sistema de televisão digital brasileiro. Assim, as discussões e conhecimentos abordados neste texto contemplam temáticas em torno do DTV Play, como propaganda direcionada, 4K, interatividade, sistemas multimídia, áudio imersivo e consumidor/telespectador. E, para conhecermos mais detalhes do processo, entrevistei quatro executivos que estão profundamente submersos nesse cenário de amplo desenvolvimento e definições técnicas, e que fizeram contribuições no SET EXPO 2019: Roberto Franco, diretor de Rede e Assuntos Regulatórios e Institucionais do SBT; Paulo Henrique Castro, diretor de Tecnologia de Transmissão e P&D da Globo; Rafael Diniz, colaborador do laboratório alemão de pesquisa Fraunhofer IIS e doutorando em Informática da Universidade de Brasília (UNB); e Marina Ivanov, doutoranda em Computação da Universidade Federal Fluminense (UFF).

Saltos tecnológicos para o DTV Play:  uma inovação incremental ou radical?

Paulo Henrique Castro, um dos entrevistados, é diretor de Tecnologia de Transmissão e P&D da Globo. Ele já atuou na condição de líder do Módulo Técnico do Fórum SBTVD e já presidiu a Comissão da ABNT, que definiu as normas do sistema brasileiro. Ou seja, não é de hoje que o engenheiro está envolvido com a televisão digital brasileira. Ele participou do grupo de trabalho que fez os testes de comparação dos principais sistemas de televisão digital em 2000 e contribuiu com os testes para a primeira transmissão em HD, realizada na Copa do Mundo, França 1998, ao lado da NHK (TV pública japonesa). Na Globo, lidera projetos nas áreas de Redes do Futuro (inclui, por exemplo, TV 3.0, também chamada Next Gen TV), Pesquisa Exploratória e Prototipação (que trabalha com IA, Block Chain e Internet das Coisas (IoT) e Computação Gráfica e Visual, que cuida Realidade Aumentada e Realidade Virtual. Tudo isso é parte de uma área da tecnologia da Globo chamada MídiaTecLab, um laboratório, ainda em fase de projeção, que envolve pesquisa e desenvolvimento, no qual mídia e tecnologia trabalharão, de forma integrada, a serviço do negócio e dos conteúdos.
Durante o 31º Congresso SET EXPO 2019, Castro participou do painel “TV 2.5: DTVPlay, HDR e Áudio Imersivo”. Em sua palestra fez uma viagem que chamou de “saltos tecnológicos”, oportunidade em que apresentou o contexto histórico relacionado aos receptores de televisão e de telefonia móvel. No caso da televisão, descreveu o percurso que foi feito até se chegar ao conceito que se tem hoje de TV 2.5. Considerando esse raciocínio, explicou que a TV 1.0 foi a primeira geração de TV analógica em preto e branco. Com os aprimoramentos tecnológicos posteriores, contudo, aqueles que desejassem ter acesso a funcionalidades que melhorassem a experiência de se ver TV, como, por exemplo, assistir TV em cores e, depois, com som estéreo, precisariam trocar o aparelho de TV por outro. Tudo isso ocorria de forma retrocompatível, segundo Castro. Quem tinha um aparelho de televisão capaz de receber imagens apenas em preto e branco continuaria a assistir TV sem que a imagem fosse prejudicada. Por isso, o padrão é considerado intermediário. Trazia novas funcionalidades, mas não exigia que o equipamento antigo fosse trocado.
Com a TV Digital – considerada a TV 2.0 – foi diferente, conforme Castro: mudou-se completamente a modulação, o uso do espectro e, com isso, o equipamento analógico deixaria de funcionar se não tivesse a um conversor digital. Assim, fez-se um período de “dupla iluminação”, no qual transmitiam-se as portadoras analógica e digital simultaneamente (simulcast), à medida que as pessoas migravam para o sinal digital com um novo aparelho de televisão ou com a ajuda de um conversor, quando aconteceu o switch-off do sinal analógico.

Visitantes do estande do Fórum SBTVD assistiram a demonstrações interativas de propaganda direcionada, utilizando o Perfil D do middleware Ginga

No cenário atual, foram trazidas algumas funcionalidades do que se espera ser a próxima geração de TV (a chamada TV 3.0) para a TV 2.0. O resultado disso é a TV 2.5, que traz uma evolução do tipo intermediária, como explicou o executivo da Globo: “A TV 2.5 tem mais do que a TV digital quando ela nasceu. Já começa a trazer algumas novas funcionalidades, como integração broadcast e broadband, experiência de áudio imersivo, de High Dynamic Range (HDR) e, até mesmo, uma experiência de 4K, que não necessariamente deve ir pelo ar – mas precisa ter uma integração de maneira que o usuário não perceba a proveniência do conteúdo exibido, de forma que a experiência possa ser contínua e agradável”.
Novidades no país
No caso do Brasil, isso tem a ver com o Perfil D do Ginga, que, como já foi explicado, traz novas inclusões ao Sistema Brasileiro de Televisão Digital, e ganhou o nome de DTV Play. Para isso, a norma ABNT referente à padronização do Ginga foi atualizada, para dar suporte às novas funcionalidades relacionadas a serviços de tecnologia de áudio e vídeo e de propaganda direcionada. Recentemente, houve uma consulta nacional, e a norma atualizada foi aprovada. O próximo passo será a realização de testes dos novos padrões (modificações) dentro do middleware e a fabricação de receptores que terão incorporadas em seu hardware essas novas funcionalidades. Tal como argumentou Castro, o sistema, apesar de trazer significativas inovações, não é considerado disruptivo em relação à versão anterior. Ou seja, a inovação é incremental, e não radical. Somente a TV 3.0 traria esse rompimento total com a TV analógica que conhecemos.
Alguns fabricantes de aparelhos de TV, que se anteciparam à norma, já lançaram alguns modelos com as novas implementações. Então, transmissões e testes já estão sendo realizados. É o caso das TVs da marca TCL. Os novos modelos de equipamentos muito em breve terão essas funcionalidades. “Quando todo o mercado, finalmente, implementar a nova norma de interatividade do Ginga, que é o DTV Play, todas as TVs terão essa funcionalidade”, observou. “É uma questão que depende do plano de negócios de cada fabricante.
Sabemos que tem fabricantes que viram nisso uma oportunidade de ter um diferencial no produto e estão lançando. Não é obrigatório. O que eu faço como radiodifusor? Eu disponibilizo esse conteúdo enriquecido, e quem fizer o produto vai proporcionar uma experiência enriquecida para o seu consumidor”, concluiu o executivo da Globo.
A seguir, veja algumas das funcionalidades do Sistema Brasileiro de Televisão Digital (SBTVD).
Comutação 4K
Uma das funcionalidades do DTV Play é a possibilidade de comutação da recepção do sinal. Nesse caso, o o telespectador tem a possibilidade de assistir, por exemplo, a um noticiário produzido em HD, transmitido pelo ar, e mudar, na hora em que vai começar uma série de TV, para a camada de transporte de internet, de modo que seja possível assistir à série em 4K, caso
o receptor de televisão tenha a tecnologia para tal. O sistema é flexível de tal forma que quem possui uma TV High Definition (HD) que não está conectada pode continuar a assistir à série em HD, pelo ar.
Além disso, a tecnologia garante que a transmissão ocorra de forma estável e explore o melhor dos dois mundos: broadband e broadcast, como destacou Paulo Henrique Castro: “O espectador vai poder receber o melhor que cada sistema de transmissão tiver, mas de uma forma completamente integrada. Será uma experiência muito fluida”. Isso porque, quando se tratar de uma experiência mais personalizada, convém que a recepção seja feita por broadband; já quando o conteúdo atender a experiências e demandas coletivas, a recepção por broadcast será a melhor opção. O diretor de Tecnologia e P&D explicou que quinhentas mil pessoas assistindo a um programa de TV representam uma audiência relativamente baixa se comparada aos números aos quais a TV aberta terrestre está acostumada a atender, quando transmite para dezenas de milhões, e, às vezes, para centenas de milhões de pessoas. Dessa forma, uma partida de final de Copa do Mundo, por exemplo, na qual a seleção brasileira de futebol esteja jogando e cujo conteúdo, naturalmente, atrai o interesse de quase a totalidade dos habitantes do País, é melhor que seja recebida pelo ar. Caso contrário, essas pessoas teriam que lidar com o problema de congestionamento de rede, o que não aconteceria com a rede broadcast, que é “eficiente” e “escalável”.
Já para assistir a um conteúdo personalizado, como uma série de TV, em que o telespectador decide o que deseja ver, o broadband é o tipo de transmissão indicada. “Se isso acontecer de uma forma integrada é o melhor caminho para o consumidor, e é isso que a gente está buscando com as adaptações que fizemos no padrão de TV digital, ao desenvolvermos o DTV Play, que faz uma ponte entre o broadcast e o broadband, para você poder trafegar de um lado para o outro”, concluiu Castro.
Propaganda direcionada

Paulo Henrique Castro afirmou que “a propaganda direcionada navega a favor do radiodifusor, ao trazer novas possibilidades de se fazer negócio”

O serviço de propaganda direcionada (target advertisement, em inglês) do DTV Play permite direcionar o conteúdo de acordo com algum perfil ou característica do receptor. E como isso acontece? O atual modelo de transmissão da TV Digital permite a transmissão de áudio, vídeo e dados. No carrossel, os dados são enviados de forma cíclica, para garantir que uma pessoa que acabou de se conectar à TV receba o conteúdo, já que nunca se sabe a hora em que o usuário vai “chavear” para determinado canal de televisão. Por isso, a emissora precisa enviar de tempos em tempos o conteúdo da aplicação que ela deseja oferecer. Para a definição da propaganda direcionada, usa-se um documento NCL (Nested Context Language)1, umas das linguagens de programação do Ginga, que vai fazer essa sincronização do conteúdo vindo por broadcast com o conteúdo vindo por broadband. E esse documento NCL é entregue no carrossel ciclicamente, para especificar como será feita a sincronização no momento da exibição da propaganda direcionada.
O evento de preparação utilizado para fornecer a propaganda direcionada que entrou como parte do novo padrão para a TV Digital foi uma proposta de pesquisadores advindos de duas universidades: a Universidade Federal Fluminense (UFF) e a Universidade Federal de Juiz de Fora (UFJF), associadas ao Módulo Técnico do Fórum Brasileiro de Televisão Digital. A funcionalidade vai garantir que a exibição do conteúdo broadband esteja sincronizada com o conteúdo broadcast. Marina Ivanov, aluna do doutorado em Computação da UFF, uma das participantes do grupo, explicou em detalhes como se dá o processo de preparação desta transmissão: “Diferentemente do conteúdo transmitido por radiodifusão, no qual temos um canal dedicado para o sinal da TV, na internet, não conseguimos ter um espaço dedicado à transmissão de conteúdos, e isso pode gerar atrasos, congestionamentos, depende de como está a rede. Então, para garantir que o conteúdo comercial personalizado esteja disponível no momento do comercial da TV, criamos um evento de preparação. O conteúdo vindo pela internet é preparado com antecedência para garantir que seja exibido no momento correto, sincronizado com o conteúdo broadcast”, ilustrou.

Marina Ivanov (de casaco marrom) fala a pesquisadores do LabArteMídia (CTR – ECA/USP) sobre evento de preparação da propaganda direcionada

Ainda sobre o modus operandi da propaganda direcionada, a TV estará conectada à internet. Dessa forma, o receptor poderá enviar informações para a emissora, ocorrendo, assim, uma comunicação bilateral. Ou seja, além de a emissora enviar o conteúdo, ela vai poder acompanhar se o usuário assistiu à propaganda enviada ou se “chaveou” para outro canal.
Conforme dito por Paulo Henrique Castro, a Globo ainda não definiu a forma como o modelo de negócios será explorado considerando essa funcionalidade, mas exemplificou o que é possível fazer do ponto de vista da tecnologia. Por meio do conhecimento obtido do telespectador que estará logado, será possível saber, por exemplo, o time de futebol que ele acompanha as notícias na internet. E, por exemplo, no intervalo do jornal, serão oferecidos a estes telespectadores produtos relacionados, como uma camisa do time favorito. E eis o grande desafio: entender as demandas do mercado e saber qual produto oferecer de forma assertiva. “O modelo da massa a gente já está acostumado a usar, ele funciona muito bem e está desenhado. O papel da tecnologia, nesse caso, é ficar a serviço do negócio. O que a gente vai fazer agora é medir o apetite do mercado e qual a demanda que existe para esse tipo de impacto”, ponderou.
Áudio imersivo

Rafael Diniz: “Sistema de áudio imersivo adiciona valor ao oferecer liberdade e flexibilidade”

Um dos temas de destaque do 31º Congresso do SET EXPO 2019 foi o áudio imersivo, que promete ser, a curto prazo, a grande tendência para a experiência de assistir televisão no Brasil. Isso porque o áudio imersivo é uma das inovações trazidas pelo DTV Play. O conceito é fazer com que o som gerado pela experiência audiovisual da televisão possa vir de todos os lados, trazendo a sensação de maior realidade, de imersão na cena.
Nesse ponto, o cientista da Computação Rafael Diniz, colaborador do laboratório alemão de pesquisa Fraunhofer IIS, explicou detalhadamente a tecnologia. O laboratório desenvolveu um codificador de áudio que foi incluído no padrão brasileiro de TV Digital. Neste momento, o laboratório tem dado suporte aos radiodifusores brasileiros para colocar o novo codificador de áudio no ar.
Segundo Diniz, com a tecnologia desenvolvida o áudio da televisão deixa de ser apenas um fluxo intocável, por lançar mão de metadados que permitem interatividade. Além disso, a emissora de televisão poderá definir o nível de interatividade a ser explorado pelo telespectador. Ou seja, o sistema traz mais complexidades, mas adiciona valor, à medida que oferece liberdade/flexibilidade e uma experiência melhorada para quem assiste e para quem produz conteúdo.
O MPEG-H, nomenclatura da última norma MPEG para o áudio, é o codificador que suporta o áudio digital imersivo. O padrão foi lançado em 2015, segundo Diniz, e já existem países que o utilizam regularmente em broadcast, como China (com o DTMB-A – padrão também adotado por Cuba), e Coreia do Sul (que usa o ATSC 3.0). Os Estados Unidos estão migrando para a nova versão do ATSC 3.0, que também vai incluir o áudio imersivo. “Toda a cadeia de produção e transmissão já tem soluções para os softwares tradicionais de autoria de áudio, já tem plugins, suporte completo, inclusive para a cadeia de produção SDI (Serial Digital Interface), que são interfaces de comunicação. E muitas emissoras usam. É possível transmitir esses metadados de interatividade em um dos canais SDI modulado em PCM (Pulse-Code Modulation). Então, existe solução completa”, argumentou Diniz.
O áudio 3D é o que faz com que as pessoas tenham a sensação de fazerem parte da cena, de estarem no ambiente narrado. Rafael Diniz explicou que, para isso, há um mix 7.1.4, em que o valor “4” se refere às caixas no alto que proporcionam a sensação de imersão, porque são dispostas caixas em todos os lados através de um soundbar ou de caixas discretas.
Além do áudio imersivo, disse o cientista, o codificador que permite interatividade e personalização do áudio imersivo. Ele exemplificou que com a tecnologia do áudio imersivo é possível regular e dar prioridade aos sons presentes na cena, como aumentar o volume do narrador, abaixar o volume do som de fundo, pegar um objeto de áudio que poderia ser um narrador ou uma torcida em um jogo de futebol e, até, trocar de narrador. E a emissora tem o controle desses fluxos. “O cliente poderia mexer nesse objeto de áudio no Azimute. Então, imagina que o objeto de áudio está na frente, mas quer colocá-lo mais para a direita, o usuário pode, usando o controle remoto da sua TV: mover esse objeto para a direita e para a esquerda; mudar a elevação desse objeto para cima ou para baixo; e mudar a distância dele, dando a impressão de se estar mais longe ou mais perto. E a emissora é quem escolhe habilitar ou não essas funções para o usuário. Essa é uma vantagem também, porque o usuário não vai poder mexer de forma irrestrita no mix de áudio. Quem produz o áudio define os ranges, a faixa de interatividade que ele terá. Então, a emissora vai permitir que o usuário aumente o ganho do diálogo do comentarista, mas, ao mesmo tempo, pode configurar para que ele não tenha a opção de deixar o comentarista mudo”, esclareceu Diniz.
O cientista da Computação observou que, com o canal de retorno bidirecional, o radiodifusor pode, ainda, criar uma experiência de áudio personalizada para quem está assistindo, inclusive, para pessoas que têm que lidar com barreiras físicas. “Imagina que a emissora sabe que tem um telespectador idoso com problemas de audição. Nesse caso, ele não precisará aumentar o volume do diálogo do comentarista pelo controle remoto, mas isso será permitido via aplicação Ginga no middleware, que vai modificar as propriedades do áudio de acordo com o usuário. A emissora terá a informação de quem está assistindo por várias heurísticas, há várias formas de saber, principalmente através das TVs conectadas”, detalhou.
Para quando?
Como se percebeu, a norma do DTV Play, que é o Perfil D do Ginga, já está publicada, no entanto, a norma do áudio imersivo apesar de pronta, ainda não foi publicada pela ABNT, conforme explicou Rafael Diniz. Mas tudo indica que o será até o fim deste ano. Então, alguns novos equipamentos de televisão já têm o hardware para decodificar, mas ainda não estão habilitados. Espera-se que, até o início de 2020, quase todos os novos receptores de TV suportem esses codificadores. O doutorando, entretanto, lembrou que se trata de uma evolução retrocompatível: “Quem tem um aparelho de TV velho vai continuar ouvindo áudio estéreo, áudio AAC (codificador)2 do MPEG 4 normal, porque é mandatório para as emissoras manterem o áudio AAC. A emissora, de forma voluntária, vai colocar o sinal de áudio MPEG-H em paralelo ao AAC. Já os aparelhos de TV que suportam o codificador novo, vão reproduzir áudio imersivo. É uma evolução que não vai trazer prejuízo para quem tem uma TV antiga, mas quem tiver uma TV nova vai sentir uma grande diferença”, elucidou.

Modelo de Uso
Para Paulo Henrique Castro, o sistema de áudio imersivo acompanha as tendências que levam os dispositivos audiovisuais a ficarem cada vez mais sofisticados, como os aparelhos de TV que ganham mais pixels, mais brilho, tornam-se maiores. Para ele, o áudio tem uma importância ímpar na geração de estímulos cerebrais e, consequentemente, no enriquecimento da experiência de se ver TV, por isso tem muito a ser explorado em suas potencialidades. “Se só assiste a uma imagem, o espectador tem uma emoção. Se assiste a uma imagem com áudio, a emoção é outra. A gente, às vezes, até acha mais bonito, fica mais emocionado, mais tocado”, completou.
Perguntado sobre como a Globo pretende trabalhar o áudio imersivo, o engenheiro disse que ainda é um caminho a ser descoberto, embora seja possível utilizá-lo em eventos (shows, carnaval, Rock In Rio) e em séries premium oferecidas à assinantes do Globo Play, plataforma de streaming da emissora. Ele ressaltou que está chegando ao mercado o soundbar, uma solução que não necessita de tantos fios e caixas espalhadas pela casa, e que permite, através de técnicas de ajuste de fase do áudio, disparar o som em diferentes pontos do ambiente. “Dentro das funcionalidades do áudio espacial, nesse padrão, já vem uma série de ajustes que o usuário pode fazer, uma série de interações: pode querer adicionar elementos ou retirar elementos, colocar audiodescrição em outra posição, para não te confundir, pode colocar o áudio no canal de trás, para que tenha uma voz atrás de você descrevendo uma ação que acontece em sua frente. São conceitos que a tecnologia permite. Agora como que o artístico vai explorar para conseguir a melhor solução e como o usuário vai usar, eu acho que é só com experimentação”, observou.
Castro analisou, ainda, que produzir conteúdo com foco em áudio imersivo pode ser uma estratégia assertiva para impulsionar esse mercado. “À medida que se tem conteúdo e a experiência é diferenciada, achamos que isso vai criar um drive para que se tenha mais escala, para que esses equipamentos mais sofisticados fiquem mais baratos, mais acessíveis, e daqui a pouco estejam em todas as residências”, explicou.

Continuará na próxima edição

Deisy Fernanda Feitosa, é jornalista, professora do curso de Audiovisual do Centro Universitário Senac Santo Amaro, coordenadora do Observatório Brasileiro de Televisão Digital e Convergência Tecnológica – CTR/ECA/USP e pós-doutoranda do Programa de Pós-Graduação Humanidades, Direitos e Outras Legitimidades – Núcleo Diversitas (FFLCH-USP).
Contato: [email protected]