Skip to content
A música conecta

Papo de Estúdio | Masterização: loudness na era do streaming

Por Johnny Da Cruz em Papo de Estúdio 18.06.2020

Em qualquer segmento ou mercado no mundo moderno, a tecnologia e o jeito como ela se desenvolve tem um enorme impacto na forma como as pessoas agem e consomem produtos e serviços. Isso não é diferente com o mercado musical, um ambiente que está constantemente evoluindo em todos os elos de sua cadeia produtiva, do modo como produzimos música até como ela é disponibilizada para os ouvintes.

Streaming e a indústria da música

A evolução dos tocadores de música já completou mais de um século de trajetória. O primeiro passo nessa linha do tempo foi dado pelo grande inventor americano Thomas Edison, em 1877, quando ele criou o fonógrafo. Depois disso, a música tem sido consumida por fitas magnéticas, vinis, fitas k7, CDs e arquivos de mp3. Com o passar dos anos, tocadores se tornaram cada vez mais compactos e as formas de armazenamento de áudio também foram melhoradas.

Quando analisamos os números do mercado musical no mundo, podemos dizer sem sombra de dúvida que a última grande revolução na maneira como as pessoas escutam música recentemente são as plataformas de streaming e serviços como Spotify, Apple Music, Deezer, Pandora e muitos outros. Elas dominam 75% de todo mercado musical com receita de mais de US$ 20 bi somente em 2019 e numa curva que, apesar de estar perto do seu pico de maturidade, continua a crescer.

Assim como todas as grandes mudanças tecnológicas do passado, serviços de streaming também apresentam peculiaridades que afetam diretamente o serviço do profissional que dá o tratamento final às músicas que serão tocadas nesses dispositivos, o engenheiro de masterização.

Em muitos casos, essas peculiaridades impactam a forma como pessoas escutam a uma música específica. A ideia deste artigo é explorar o efeito delas na track original e mostrar opções de como engenheiros de masterização podem abordar isso, expondo diferente ideias e perspectivas que irão ajudar outros profissionais em seus processos de decisão. Isso pode ser útil para garantir que uma track soe da forma como deve soar nessa nova realidade, tendo em vista que as tecnologias de streaming estão dominando o mercado nos últimos anos e provavelmente continuarão mais um longo período, até a chegada de uma nova revolução na maneira como as pessoas escutam música.

Fig.1 Fonte: MIDIA Research Music Model (02/2019)

Dynamic range em Digital e Analógico

Hoje em dia existe uma grande discussão sobre os (altíssimos) níveis de loudness da música popular. Para entender melhor como a música moderna chegou a esse ponto temos que voltar no tempo, na época em que o CD foi inventado e usado como principal meio para ouvir música nos anos 80. Um dos principais diferenciais do CD – além dos atributos óbvios de ser mais compacto e ter maior capacidade de armazenamento que as mídias anteriores – é o fato de que ele foi o primeiro modelo a armazenar áudio no formato digital, o que possibilitou um considerável aumento no dynamic range.

O dynamic range de uma música é a diferença da maior a menor intensidade de um som que pode ser transmitido ou reproduzido de forma confiável por um sound system. Sua medição é em decibéis (dB). Fitas k7, por exemplo, tem um dynamic range de 60 a 70 dB. As transmissões FM analógicas geralmente têm um dynamic range em torno de 50 dB. Já a de um disco de vinil de corte direto pode ultrapassar 70 dB. As fitas mestres do estúdio analógico podem ir até 77 dB. No entanto, um conversor analógico-digital de 16 bits, aplicado aos CDs, pode ter um dynamic range de 96 dB. De acordo com Alan Silverman, no MixCon 2019 Nova York, isso significa que “pela primeira vez na história do áudio, o dynamic range do meio é amplo o suficiente para capturar a música sem compressão”.

A guerra do loudness

Com um dynamic range aprimorado e fornecendo uma maior relação sinal / ruído em comparação aos modelos analógicos, o formato de áudio digital permitiu que os engenheiros de masterização aumentassem o volume percebido de uma track. A crença de que as pessoas gostam de sons altos existe desde bem antes dos anos 90, mas os avanços tecnológicos do CD, e também a criação do primeiro Brickwall digital em 1994, permitiu que os profissionais explorassem um dynamic range maior do que nunca. Adicione a isso ao medo de um artista de “soar mais baixo ” e o resultado foi uma guerra para soar mais alto do que outros. E em um curto período de tempo nós chegamos ao limite. Uma música pop moderna hoje tem em média apenas 6 dB de dynamic range. Essa ideia foi muito bem definida pelo engenheiro de som Matt Mayfield: “onde não há silêncio, não pode haver barulho”.

Mesmo que não haja evidências científicas de correlação significativa entre loudness e sucesso comercial, o que aconteceu nos anos 90 foi um aumento considerável na maioria das músicas populares, levando à chamada guerra de loudness (loudness war). Álbuns como ‘Californication’ (1999) de Red Hot Chili Peppers e ‘(What’s Story) Morning Glory’ (1995) de Oasis são exemplos perceptíveis desse período em que as faixas são empurradas para o limite da compressão e limitação, às vezes até com notável distorção nas tracks, mas ambos foram alguns dos maiores álbuns comerciais de sucesso da década.   

Fig. 2 A guerra do loudness: a média de loudness das tracks nos anos 90 sofreram um enorme e notável aumento – Granville, 2015

Contudo, a chegada e domínio de plataformas de streaming adicionou um novo fator que afeta diretamente a abordagem na masterização musical. Isso se deve ao fato de que todas essas plataformas têm um sistema que ajusta os níveis de todas as músicas para o mesmo nível de volume, um processo conhecido como normalização. Assim, o usuário não precisa ajustar o volume de seus aparelhos/dispositivos toda a vez que trocar de música – o que evita situações inconvenientes onde há grande diferença de volumes entre duas faixas.

Normalização de áudio

A normalização de áudio pode ser feita de duas maneiras diferentes: normalização de pico e normalização de loudness.

Normalização de pico

Normalização de pico consiste no processo onde o nível de cada sample em um áudio digital é mudado pelo mesmo tanto. Usualmente essa técnica é usada para assegurar que sinais de pico não passem de 0 dBFS, que é o nível mais alto permitido no sistema digital sem que distorça o material de áudio.

Normalização de loudness

Por outro lado, a normalização de loudness é baseada na medida dele próprio, onde muda-se o ganho para levar a amplitude média a um nível alvo. Essa média pode ser uma medida simples da potência média ou uma medida da intensidade percebida pelo homem.

A normalização de loudness foi criada para combater a variação de volume quando se escuta várias músicas em sequência. Antes disso, uma música em uma compilação com tracks de diferentes artistas (ou, no caso de plataformas de streaming, uma playlist) poderia soar mais baixa que as demais, então o ouvinte teria que ajustar o volume toda a vez que uma nova música começasse. Tendo isso em mente, o que o streaming significa em termos de áudio é que vivemos um momento do mundo do som normalizado de pico para o som normalizado de volume percebido.

A preferência do dynamic range

Thomas Lund conduziu uma série de estudos tentando entender que tipo de dynamic range as pessoas esperavam e descobriu que a resposta depende do lugar onde eles estavam quando escutavam música. Os experimentos levaram à imagem abaixo:

Fig. 3 Preferência do Dynamic Range – Lund, 2015

A imagem mostra que o ambiente onde não há muito ruído, como no cinema, o dynamic range é considerado alto, enquanto dentro de um avião, é extremamente reduzido por conta do constante barulho dos motores.

Considerando que o dynamic range da música pop hoje em dia é perto dos 6dB (por vezes menor ainda) e também que este é o mesmo valor dos entretenimentos do avião (filmes, jogos, mapa de vídeo) por conta das turbinas, fica claro quão alto é o loudness da música pop moderna produzida nos últimos anos.

Por que normalização do nível de loudness?

Os estudos de Thomas Lund também forneceram informações valiosas sobre os diferentes dynamic range entre estilos de música e outros meios onde o áudio é reproduzido.

Fig. 4 Normalização de Pico em diferentes tipos de música e uso de áudio – Lund, 2015

Até o começo do novo século, o uso da normalização de pico era muito comum, onde tudo era colocado até o 0dB por convenção geral. O problema disso é que diferentes tipos de música têm diferentes quantidades de pico. Uma faixa de Heavy Metal é muito mais alta que uma faixa de Jazz. E esse é um problema especialmente para o streaming, porque com o toque de um botão podemos ouvir qualquer faixa de qualquer estilo ou época, e a grande diferença de volume entre elas pode levar a problemas sérios. Por exemplo, se você estiver reproduzindo uma faixa antiga das décadas de 1930 ou 1940, que é silenciosa e sem compressão, mas acidentalmente muda para uma faixa de música pop moderna, que certamente será muito mais compactada com uma diferença que pode ser 24 dB mais alta, você pode causar sérios danos à sua audição.

Portanto, não se trata apenas da experiência do ouvinte, mas também de questões de segurança e saúde. As plataformas de streaming precisavam resolver esse problema e fazer com que as faixas tocassem em um nível constante para evitar ferir as pessoas e também não fazer com que seus consumidores tivessem que ajustar constantemente o volume. Elas então descobriram que a melhor alternativa era escolher um nível alvo e diminuir ( ou aumentar) os níveis de cada faixa para com base nesse alvo. Dessa forma, não importa que tipo de música o usuário esteja ouvindo, sempre que houver uma alteração em algo diferente ou o algoritmo do sistema reproduzir algo automaticamente, o nível será o predeterminado por cada plataforma de streaming.

Por exemplo, um usuário que está ouvindo música clássica onde a média é de 24dB de dynamic range não sentirá muita diferença quando trocar para uma track de pop music, que geralmente tem um nível maior de loudness, mas ambas foram trazidas a um mesmo nível previamente.

Fig. 5 Normalização de Pico vs Normalização de Loudness – Lund, 2015

Quando qualquer música é reproduzida em qualquer um dos serviços de streaming, ela é scaneada em busca de um valor de loudness, e esse valor permanece nessa faixa e não pode ser alterada. É uma medida regulada. O serviço de streaming, com base em seu alvo, aumentará ou diminuirá a faixa para alcançá-lo, e não há nada que o engenheiro de som possa fazer a respeito. Isso significa que o controle do nível das músicas não é mais dos engenheiros de masterização e, se isso não for levado em consideração ao masterizar uma track, os resultados ao ouvi-la em uma plataforma de streaming podem ser decepcionantes.

Alvos de loudness

Uma alternativa para essa nova realidade é otimizar o volume final em vez do nível. Atualmente, temos unidades de loudness em escala real (LU e LUFS) e todas as medidas e regulamentações em todo o planeta são baseadas neste sistema. O mundo moderno também nos forneceu novas ferramentas de medição que se baseiam nessa nova métrica.

Essas novas ferramentas podem ser extremamente úteis quando pensamos em nossos novos alvos, que são os serviços de streaming e cada um deles trabalha com um número diferente. Por exemplo, o nível de referência do Spotify é -14 LUFS, portanto, se uma música for analisada como -10 LUFS, o Spotify diminuirá o nível em 4 dB para trazê-lo para a referência de -14 LUFS.

Cada plataforma de streaming tem seu próprio alvo diferente:    
• Spotify: -14     
• Youtube: -13    
• Apple Music: -16     
• Tidal: -14

Nível vs Loudness

Desde os famosos estudos de Fletcher & Munson, ficou provado que o ouvido humano não funciona de maneira linear para todas as frequências sonoras tocadas. O loudness que ouvimos é afetado por muitos outros fatores além do nível, como tom, equilíbrio, tonalidade, resposta transitória e dynamic range. Nível e loudness estão obviamente relacionados – quanto mais nível, mais volume final -, mas faixas com níveis idênticos podem ter um loudness totalmente diferente.

Fig. 6 O gráfico de Fletcher & Munson: À medida que a intensidade real muda, a intensidade percebida capturada pelo nosso cérebro varia em taxas diferentes, dependendo da frequência.

Penalidade de loudness

Se uma faixa exceder o objetivo estabelecido por uma determinada plataforma de streaming, ela sofrerá uma penalidade de loudness, que basicamente é a quantidade de dB em que a música ou a faixa será reduzida durante sua normalização. Deve-se notar o quanto uma música terá seu volume reduzido pode mudar sempre que a intensidade do alvo for alterada. Isso significa que um serviço de streaming pode alterar o loudness desejado sempre que a empresa por trás dele decidir por isso. Em outras palavras, a penalidade de loudness tem o potencial de ser um alvo em movimento e deve ser tratada como tal.

Como evitar essa penalidade

Recentemente, a empresa de áudio MeterPlugs lançou uma ferramenta gratuita que pode determinar como a master será afetada pela normalização do loudness em vários serviços de streaming. Ele mostra quanto sua master será reduzida ou incrementada. De acordo com a empresa, o método para medir a música resultará em uma leitura de 0,5 dB de como a música será normalizada na plataforma de streaming específica.

Fig. 6 Analisador de Penalidade de Loudness da MeterPlugs

Basicamente, tudo o que o usuário precisa fazer é enviar a faixa para o sistema e ele informará quantos dBs da música será reduzido. A ferramenta também permite reproduzir uma simulação de como essa música soará em cada um desses serviços de streaming.

Isso certamente pode ser útil, uma maneira rápida e fácil de ver como a música será afetada. Embora o sistema seja muito fácil de usar, ultimamente as plataformas de streaming estão dando a opção aos usuários de ajustar o volume conforme desejarem. O Spotify, por exemplo, já oferece três modos diferentes para seus usuários premium, cada um com um alvo de loudness diferente, como mostra a figura:

Os efeitos na masterização

Por mais aterrorizante que possa parecer não ser capaz de trabalhar em níveis mais altos para alguns engenheiros de som, as plataformas de streaming podem indiretamente ter contribuído para pelo menos um ‘cessar fogo’ na guerra de volume. A mudança de baixar faixas e comprar CDs para ouvir música por serviços de streaming, como Spotify ou Apple Music, parece provável que mude as coisas para melhor.

Os serviços de streaming geralmente são configurados para que todas as faixas de música pareçam igualmente altas. Isso significa que, se uma faixa de música for excessivamente compactada enquanto está sendo gravada, para torná-la mais alta, uma vez passada pelo serviço de streaming, a vantagem do loudness desaparecerá e tudo o que restará nessa faixa será a desagradável distorção. O incentivo para faixas cada vez mais altas parece estar desaparecendo lentamente.

Mais importante que isso, o streaming retirou o controle de nível, mas deu em troca muito mais. O controle dos níveis por essas plataformas permite que os engenheiros de som trabalhem com muito mais espaço livre, sem se preocupar se o mix ou master parecerá mais silencioso que os outros. Isso também ajuda a evitar clipping e distorções nas músicas. Essa nova abordagem em relação aos compressores e limitadores nos permite trabalhar com uma melhor resposta transitória e também oferece liberdade para criar misturas tão dinâmicas quanto desejamos, sem o medo de não ser alto o suficiente. E talvez o mais importante de tudo isso, ele nos permita entregar nosso mix e master ao ouvinte da mesma maneira que eles são ouvidos no estúdio.

Ironicamente, essa nova tecnologia de streaming faz com que os medidores VU, uma tecnologia antiga usada em todos os tipos de gravações desde 1940, possam ser muito úteis, pois são baseados em logaritmos e mostram o som exatamente como o que ouvimos. Pode ser um bom guia visual para loudness. Os plug-ins modernos de medidores VU permitem até definir um valor calibrado de acordo com a referência ou o destino de uma plataforma de streaming específica.

É claro que, com diferentes alvos de volume em cada plataforma de streaming, além da variedade de opções que o consumidor tem em suas mãos para ajustar os níveis e o volume ao seu gosto pessoal, é quase impossível que uma música não sofra uma alteração mínima no seu níveis de loudness em pelo menos um serviço de streaming. Tendo isso em mente, nunca foi tão importante como hoje fazer várias análises com diferentes tipos de medidores em combinação ao masterizar uma track, de maneira que seja possível entender como essa música será ouvida em diferentes situações e plataformas de streaming.

A música conecta.

A MÚSICA CONECTA 2012 2024