Call for Papers – SET International Journal of Broadcast Engineering (SET IJBE) – 2a. Edição

Moderador: João Vandoros, Consultor

Joao Vandoros, formado em Engenharia Elétrica pela Universidade Presbiteriana Mackenzie e Especialista em Telecomunicações pela Universidade de Campinas, atua no mercado de distribuição e contribuição de vídeo desde 2000, onde iniciou a carreira no Laboratório de TV Digital do Mackenzie. tendo trabalhado nas  empresas TVA e Band entre 2006 e 2013. Desde 2013 como consultor, atuou em diversos projetos, com destaque aos realizados na GfK, Eurovision e Mackenzie - onde atualmente coopera na avaliação da camada física para a TV 3.0 através da RNP.

Um Maior Escopo de Uso de CMAF para Entrega de Vídeo

O surgimento do formato de arquivo CMAF transformou a entrega de vídeo OTT com sua arquitetura versátil baseada no padrão ISO BMFF, superando os formatos concorrentes em interoperabilidade. Inicialmente, o CMAF era utilizado para o empacotamento B2C (para usuários finais e reprodutores). No entanto, com o surgimento do protocolo de ingestão de mídia ao vivo, ele está prestes a dominar o escopo da entrega de vídeo B2B. Esse protocolo permite a troca contínua de vídeo entre várias entidades de processamento de vídeo (codificadores, empacotadores, CDN, serviços em nuvem) por meio de dados sincronizados e fragmentos de metadados do fluxo original. A tecnologia ganha interesse imenso por oferecer uma alternativa moderna ao tradicional formato TS para a entrega na primeira milha. O artigo aborda as principais características, benefícios e arquitetura de implementação do protocolo.

Palestrante: Robin Hérin, Diretor de Padronização na Ateme

Robin Hérin é Diretor de no CTO Office da Ateme, onde ele ajuda a equipe de Pesquisa & Inovação a desenvolver tecnologias futuras para processamento e entrega de vídeo, além de liderar projetos de parceria e estandardização. Agora, em seu nono ano na Ateme e em sua carreira, Robin já trabalhou tanto na América do Sul quanto na América do Norte como Arquiteto de Soluções antes de se mudar para NY e concentrar-se na expansão da presença da Ateme no Nordeste, incluindo os primeiros POCs e implementações da Ateme em ATSC 1.0 quanto e 3.0. Robin possui mestrado em engenharia mecânica pela Université de Technologie de Compiègne (França).

Uma Visão Geral das Tecnologias de Áudio, Recursos de Imersão e Personalização previstos para a TV3.0

Em 2021, o Fórum SBTVD concluiu a fase 2 do projeto TV3.0, composta por uma série de testes das tecnologias propostas para essa próxima geração do sistema de TVD no Brasil. Os testes foram conduzidos por grupos de pesquisa de universidades brasileiras. Especificamente referente à camada de codificação de áudio do sistema, realizamos na Universidade de São Paulo 13 grupos de testes, conforme previsto em um Chamamento público, e pudemos avaliar as capacidades e versatilidade das tecnologias em fornecer uma série de novos recursos para a próxima geração de áudio no sistema de transmissão digital. Este artigo resume os principais resultados desta fase de testes e avaliação, e apresenta uma visão geral dos novos recursos estimulantes que produtores de conteúdo e público teriam disponíveis para criar e consumir serviços imersivos e personalizados em casa.

Palestrante: Regis Rossi A. Faria, Escola de Artes, Ciências e Humanidades - Universidade de São Paulo

Regis Rossi Alves Faria é professor na Escola de Artes, Ciências e Humanidades e na Escola de Comunicações e Artes da Universidade de São Paulo. Ele trabalha na interdisciplinaridade entre as artes e as ciências, nas áreas de engenharia de áudio, computação sonora e musical, abordando questões relacionadas à criação e recepção de som usando recursos tecnológicos, e desenvolvendo sistemas para som e música. Ele coordena o Laboratório de Tecnologia de Áudio e Música na USP (LATM-EACH/USP), é pesquisador no LabArteMídia (ECA/USP) e no Centro de Pesquisa Sonológica (ECA/USP). Ele é membro do Comitê de Estudo de Codificação de Áudio, Imagem, Multimídia e Hypermedia da ABNT e é um especialista em áudio representando a Associação Brasileira de Normas Técnicas na ISO-MPEG.

Uma Visão Geral das Tecnologias de Áudio, Recursos de Imersão e Personalização previstos para a TV3.0

Co- palestrante: Almir Almas, Professor da Escola de Comunicações e Artes - Universidade de São Paulo

Professor associado do Departamento de Cinema, Rádio e Televisão e Pesquisador do Programa de Pós-Graduação em Mídia e Processos Audiovisuais; Coordenador Geral do Grupo de Pesquisa LabArteMídia e do Observatório Obted da ECA/Universidade de São Paulo. Doutor em Comunicação e Semiótica. Cineasta/Videoartista/VJ; Artista do Coletivo de Arte Cobaia. Membro da Diretoria da Sociedade Brasileira de Engenharia de Televisão (SET). Membro do Fórum Brasileiro do Sistema Brasileiro de Televisão Digital Terrestre (FORUM SBTVD). Autor do livro "Televisão digital terrestre: sistemas, padrões e modelos", entre outros livros e artigos.

Suporte harmonizado para interatividade de áudio imersivo na SBTVD TV 2.5 e TV 3.0.

MPEG-H Audio permite a transmissão de áudio imersivo altamente eficiente, com recursos avançados de acessibilidade, interação, personalização e adaptação. O MPEG-H Audio utiliza objetos de áudio e metadados que permitem aos espectadores interagir com o conteúdo, criando uma experiência auditiva personalizada. Os radiodifusores podem habilitar ou desabilitar opções de interatividade e estabelecer limites para as interações do espectador. Este artigo detalha a proposta do Fraunhofer IIS para o Projeto TV 3.0 sobre novas APIs (Interfaces de Programação de Aplicativos) de interatividade de áudio imersivo em alto nível para Ginga-NCL e Ginga CC WebServices. Essas APIs permitem que os radiodifusores desenvolvam e ofereçam aplicativos multimídia para controlar esses recursos avançados de áudio, usando sua própria identidade visual, design gráfico e até mesmo a interação multimodal esperada no TV 3.0. O artigo também discute as implicações das alterações nos metadados do fluxo de áudio, que ocorrem quando o conteúdo inclui diferentes cenas de áudio. O trabalho destaca que a proposta de API para o TV 3.0 está harmonizada com as especificações atuais do TV 2.5 e, dado o crescente número de receptores TV 2.5 que suportam o áudio MPEG-H, essas APIs também poderiam ser propostas para inclusão nos padrões atuais.

Palestrante: Marcelo F. Moreno, Professor Associado, Universidade Federal de Juiz de Fora (UFJF) | Módulo Técnico do Fórum SBTVD

Professor associado da Universidade Federal de Juiz de Fora (UFJF), com Doutorado em Informática pela PUC-Rio e atuação nas áreas de sistemas multimídia e redes de computadores. Em 2022–2023, foi Professor Visitante no International Audio Laboratories Erlangen (FAU/Fraunhofer IIS), na Alemanha. Coeditor da Recomendação ITU-T H.761 (“NCL and Ginga-NCL”), contribuiu para diversos padrões internacionais e coordenou grupos de trabalho na UIT-T por mais de uma década. Desde 2015, coordena o Grupo de Trabalho de Codificação de Aplicações do Fórum do Sistema Brasileiro de TV Digital (SBTVD), onde também atua como editor das normas ABNT para TV 2.5 e TV 3.0. Sua pesquisa integra inovação acadêmica e padronização técnica, com foco em radiodifusão orientada a aplicativos, integração com dispositivos de segunda tela, medição de audiência e plataformas de mídia com suporte à privacidade para a nova geração da TV digital.

Suporte harmonizado para interatividade de áudio imersivo na TV SBTVD 2.5 e TV 3.0.

Co- palestrante: Adrian Murtaza, Gerente Sênior, Tecnologia e Padrões - Fraunhofer IIS

Adrian Murtaza recebeu seu mestrado em Sistemas de Comunicação pela École Polytechnique Fédérale de Lausanne, Suíça em 2012 com uma tese sobre “Backward Compatible Smart and Interactive Audio Transmission”. Após a formatura, ingressou no Fraunhofer IIS, onde trabalha como Engenheiro de Pesquisa Sênior. Adrian Murtaza ingressou na MPEG em 2013 e desde então contribuiu para o desenvolvimento de vários padrões técnicos de áudio em MPEG-D e MPEG-H. Ele atua como Gerente Sênior de Padrões da Fraunhofer em vários órgãos de padrões do setor, incluindo DVB, ATSC, SBTVD, CTA e SCTE, e é coautor de várias especificações nesses grupos. Mais recentemente, ele se concentrou na especificação de entrega e transporte de áudio de próxima geração em sistemas ATSC 3.0 e sistemas DVB baseados em fluxo de transporte MPEG-2, bem como na habilitação de serviços de áudio MPEG-H em diferentes ecossistemas de transmissão e streaming.

O progresso de P&D da Academia na Codificação de Aplicativos da TV 3.0

O Projeto TV 3.0 do Fórum SBTVD tem como objetivo desenvolver tecnologias de transmissão de próxima geração para o Brasil. A televisão desempenhou um papel social e cultural crucial no país, e qualquer evolução tecnológica pode levar a mudanças significativas na sociedade. Atualmente, na Fase 3, o projeto realiza um esforço de P&D no suporte à codificação de aplicativos, reunindo 40 pesquisadores da Academia. Este artigo enfoca a metodologia, o progresso e as primeiras conquistas da equipe de P&D da Academia ao abordar as prioridades elevadas da codificação de aplicativos para a TV 3.0. Grupos de foco e pesquisas de opinião têm contribuído para estudos sociais relacionados à experiência de TV baseada em aplicativos. O grupo propõe mudanças arquitetônicas, novas interfaces de usuário e um reprodutor de mídia persistente para melhor interatividade e controle total do conteúdo audiovisual pelo radiodifusor. Além disso, são feitos esforços para avaliar os codecs de áudio e vídeo, incluindo a tecnologia de áudio MPEG-H adotada, para identificar a necessidade de novas APIs de forma harmonizada com os padrões atuais do SBTVD. A equipe também concentra-se no suporte à extensibilidade e nos requisitos de acessibilidade, especialmente no encaminhamento de legendas e língua de sinais para dispositivos móveis. O trabalho está em andamento para efeitos sensoriais, conteúdo imersivo e interação multimodal, utilizando as propostas NCL 4.0 e Guaraná adotadas para viabilizar aplicações mulsemídia avançadas e cenas em 360 graus. Uma demonstração de protótipos de casos de uso da TV 3.0 ocorrerá durante o SET Expo 2023 para exibir e discutir o progresso e as descobertas da equipe de P&D da Academia.

Palestrante: Marcelo F. Moreno, Professor Associado, Universidade Federal de Juiz de Fora (UFJF) | Módulo Técnico do Fórum SBTVD

Professor associado da Universidade Federal de Juiz de Fora (UFJF), com Doutorado em Informática pela PUC-Rio e atuação nas áreas de sistemas multimídia e redes de computadores. Em 2022–2023, foi Professor Visitante no International Audio Laboratories Erlangen (FAU/Fraunhofer IIS), na Alemanha. Coeditor da Recomendação ITU-T H.761 (“NCL and Ginga-NCL”), contribuiu para diversos padrões internacionais e coordenou grupos de trabalho na UIT-T por mais de uma década. Desde 2015, coordena o Grupo de Trabalho de Codificação de Aplicações do Fórum do Sistema Brasileiro de TV Digital (SBTVD), onde também atua como editor das normas ABNT para TV 2.5 e TV 3.0. Sua pesquisa integra inovação acadêmica e padronização técnica, com foco em radiodifusão orientada a aplicativos, integração com dispositivos de segunda tela, medição de audiência e plataformas de mídia com suporte à privacidade para a nova geração da TV digital.

O Uso da Inteligência Artificial Possibilitando a Escala da Descrição de Áudio na Televisão Brasileira: uma proposta de fluxo de trabalho.

Recentemente, as tecnologias de Inteligência Artificial (IA) têm encontrado espaço em diversos campos do conhecimento, impactando significativamente muitas esferas acadêmicas e empresariais. Uma das aplicações que pode se beneficiar da IA é a inclusão de pessoas com deficiências em conteúdos audiovisuais, onde a escalabilidade de certos processos pode trazer novas oportunidades de acessibilidade. Neste trabalho, mostramos como seria um fluxo básico de descrição de áudio para conteúdos audiovisuais de drama, e a partir disso, propomos um novo fluxo de trabalho para gerar descrições de áudio para pessoas com deficiência visual, utilizando vozes sintéticas criadas com modelos de IA. O fluxo de trabalho proposto, além de permitir a geração de áudio em uma escala maior em comparação com um fluxo tradicional, possibilita uma cobertura maior do público-alvo, reduzindo consideravelmente o tempo de produção. Ele também permite que várias pessoas trabalhem no mesmo projeto sem perder a identidade sonora, o que é muito importante para o consumidor desse tipo de serviço. Com essa proposta, acreditamos que a acessibilidade na televisão brasileira possa ser ampliada e alcançar um número muito maior de pessoas.

Palestrante: Luiz Kruszielski, Produtor de Áudio - Globo

Luiz Fernando Kruszielski se formou em Produção de Som (UFPR - Brasil) e possui mestrado e doutorado em Som e Meio Ambiente pela Universidade de Artes de Tóquio (Japão). Ele trabalha como designer de som profissional desde 2003 e, a partir de 2013, começou a trabalhar na Rede Globo como pesquisador de tecnologias de som, tornando-se posteriormente Produtor de Som, onde atuou em mais de 10 séries e novelas.

O Desafio Operacional Definitivo da Globo: uma edição de fluxo de trabalho criativo baseada inteiramente na nuvem

Em 2022, a famosa e épica novela “Chocolate com Pimenta” no Brasil se tornou uma boa surpresa para a TV Globo: a cadeia de pós-produção realizou um fluxo de trabalho simples, produtivo e econômico. Uma edição baseada em nuvem, remota e colaborativa produziu o conteúdo de entretenimento de forma inovadora. A Globo, rede de televisão aberta, viu nesse caminho uma excelente oportunidade para prosperar tecnologicamente e oferecer aos espectadores uma experiência única. O objetivo da Globo era disponibilizar uma edição especial da novela por meio do Globoplay, plataforma online de vídeos sob demanda, e pela TV Aberta. Tendo a equipe responsável localizada no Centro de Pós-Produção dos Estúdios Globo, o material foi editado de forma colaborativa em HD (codec XDCAM) conectado diretamente à nuvem. O processo foi realizado com sucesso e tem ajudado a manter a Globo no futuro das inovações tecnológicas. Além disso, o modelo de negócio desta abordagem única foi muito atraente para a Globo, resolvendo a necessidade do mercado por uma solução cloud-native, principalmente quando o Centro de Pós-Produção lida rotineiramente com grandes arquivos de mídias, possibilitando elevar a produção de conteúdo para um próximo patamar (custo benefício). A Globo interpreta essa iniciativa não como um mero avanço tecnológico, mas também como um passo dado em direção a um nível operacional mais concreto. Através de todo o esforço, a Globo, seus clientes e todos os envolvidos neste projeto puderam se unir para torcer e esperar por um novo futuro eficiente.

 

Palestrante: Priscila David, Product Owner de projetos de Pós-Produção na área de Soluções de Mídia da Globo

Priscila David nasceu no Rio de Janeiro. É graduada em Engenharia de Telecomunicações e possui MBA em Gestão Estratégica de Pessoas. Atualmente, está cursando uma especialização em Gestão de Tecnologia da Informação. Priscila é autora do pôster “4K and 4K-HDR VOD in Rio’s 2016 Olympic Games”, publicado pela IBC em 2017, e do artigo “Globo’s Ultimate Operational Challenge: a creative workflow editing in cloud”, publicado pela SET em 2023. Trabalha na Globo há 18 anos e, nos últimos três anos, ocupa o cargo de Product Owner Especialista em projetos de Pós-Produção na área de Soluções de Mídia.

O Desafio Operacional Definitivo da Globo: uma edição de fluxo de trabalho criativo baseada inteiramente na nuvem

Co- palestrante: Ariza Bertelli, Analista de Soluções de Mídias, Globo

Ariza Bertelli nasceu em Minas Gerais, Brasil, em 2000. Ela está graduando em Engenharia Elétrica com ênfase em Robótica e Automação Industrial. Foi membro do IEEE de 2019 a 2021. Recebeu o prêmio de 3º melhor projeto educacional da RNR: “Falando com as mãos” em 2020. Estava há 1 ano na Globo como estagiária de soluções de mídia e, em junho de 2023, como Analista de Soluções de Mídias.  

Ferramenta em  Pyhton para predição de sinais de redes sem fio em ambiente indoor com uso de redes neurais a partir de mapeamento e medições em campo

Este trabalho tem como objetivo apresentar os avanços e aplicações de Redes Neurais Artificiais (RNAs) utilizando a linguagem de programação Python. As RNAs têm se mostrado uma ferramenta poderosa no campo da inteligência artificial, imitando o funcionamento do cérebro humano para resolver problemas complexos e realizar tarefas que anteriormente requeriam algoritmos extremamente elaborados.
Além disso, será enfatizada a importância do Python como uma das linguagens mais populares e acessíveis para o desenvolvimento de redes neurais. Através de bibliotecas robustas, é possível criar, treinar e avaliar redes neurais de forma eficiente e intuitiva.

Palestrante: Breno Batista Nascimento Silva, Estudante de graduação - Faculdade de Engenharia Elétrica - Universidade Mackenzie

A eletricidade sempre foi uma paixão, tanto que aos 15 anos ele ingressou em um curso técnico de eletrônica no Senai Guarulhos, onde decidiu qual faculdade seguiria. Em 2019, ele ingressou na faculdade de Engenharia Elétrica, através de uma bolsa de estudos filantrópica da Mackenzie, onde encontrou várias oportunidades de desenvolvimento pessoal e profissional. Foi durante uma aula durante a pandemia que ele se interessou pela oportunidade de realizar uma iniciação científica com o Professor Edson Tafeli em Redes Neurais Artificiais (RNAs) em Python. Atualmente, ele trabalha como Analista de Medição Contábil na Câmara de Comercialização de Energia (CCEE).