Por que temos dois ouvidos?
A razão é similar à de termos dois olhos: para dar “profundidade” à audição. Inclusive, daí surgiu a ideia de se começar a usar o estéreo em sistemas de áudio. Ou seja, graças à presença dos dois ouvidos, nós não só escutamos, mas sabemos a posição de onde está vindo o som. Nosso cérebro processa o sinal sonoro captado por cada um dos ouvidos, e a diferença de intensidade e do tempo de chegada do sinal a cada ouvido vai indicar a posição da fonte sonora. Baseado nessa propriedade biológica, os estudiosos de áudio desenvolveram técnicas de gravação e de processamento de áudio para simular o funcionamento do nosso sistema de audição, e assim proporcionar um resultado sonoro que emule uma situação sonora real, onde o ouvinte está imerso no ambiente em que a gravação foi feita.
Para isso, analisamos como os sinais sonoros são modificados desde a emissão pela fonte sonora até chegar a cada ouvido (considerando a parte externa do canal auditivo), levando em consideração o som direto, os sons refletidos, e inclusive o som que atravessa a cabeça. Essas modificações incluem o formato da orelha do ouvinte, o formato e densidade da cabeça e do corpo, assim como as características acústicas do espaço em que o som é reproduzido. Cada um desses caminhos resulta numa resposta diferente que será captada pelo tímpano, e a soma de todas essas respostas será o sinal resultante que o cérebro entende.
Essas modificações codificam a posição da fonte sonora e podem ser obtidas através de uma resposta de impulso, que relaciona a posição de origem da fonte e a posição da orelha. Esta resposta de impulso é denominada Resposta de Impulso Relacionada à Cabeça (em inglês, Head-Related Impulse Response – HRIR). Uma resposta ao impulso é um gráfico que mostra o comportamento de um sinal sonoro muito curto (impulso) no decorrer do tempo.
Quando passado para o domínio da frequência, utilizando uma Tranformada de Fourier (artifício matemático), obtemos a Função de Tranferência Relacionada à Cabeça (em inglês, Head-Related Transfer Function – HRTF), também conhecida como Função de Tranferência Anatômica.
De uma forma grosseira, só pra entender, uma função de transferência é uma relação do resultado de um sistema com a entrada daquele sistema. Qualquer sistema. Imagine uma caixa preta com uma entrada e uma saída. Tudo o que “modifica” a entrada (X(s)) para a saída (Y(s)), é a função de transferência (G(s)).
Dessa forma, podemos imaginar uma função de transferência de qualquer coisa que tenha uma entrada e uma saída: um circuito, uma sistema de controle de vazão, um sistema de áudio, e assim vai. Quando se “passa o Smaart”, por exemplo, estamos fazendo justamente isso: identificando a função de transferência do sistema de áudio a partir da relação entre a saída (medição com microfone) com a entrada (sinal de teste).
No caso da função de transferência relacionada à cabeça (HTRF), esta pode ser descrita como as modificações sofridas pelo som original vindo de uma posição específica, até chegar ao tímpano. Essas modificações incluem o formato da orelha do ouvinte, o formato da cabeça e o corpo do ouvinte, assim como as características acústicas do espaço em que o som é reproduzido, e assim por diante. Ao se multiplicar essa função de transferência com um som arbitrário (convolução), este som se converte no som que teria sido ouvido pelo ouvinte se estivesse na posição onde foi feita a gravação. Ou seja, é possível simular qualquer sinal sonoro sendo reproduzido em um determinado ambiente (uma sala de concerto fuderosa ou um estúdio de referência)! Essa técnica é muito utilizada por fabricantes de equipamentos de áudio, para proporcionar um efeito surround virtual em sistemas estéreo e até mono.
Para produzir sons com características espaciais, também são utilizados microfones especiais que simulam a forma e densidade da cabeça e ouvidos humanos. Esta técnica é chamada Gravação Binaural. São utilizados dois microfones, um em cada ouvido de uma cabeça de manequim, com propriedades similares a uma cabeça humana.
Cada microfone na gravação simula um ouvido, e quando reproduzida em um headphone, a gravação dará ao ouvinte a impressão de estar no ambiente onde a gravação foi feita, sendo possível detectar e distinguir sons vindos de todas as direções. Um exemplo deste tipo de gravação pode ser conferida Neste vídeo
A cada dia, mais tecnologias interativas são desenvolvidas, como televisores 3D, reconhecimento de face, controle por voz e por movimento etc. Acompanhando esse desenvolvimento, a indústria de áudio se torna cada vez mais conectada a novas tecnologias, e a tendência é criar um sistema de áudio e vídeo onde o usuário esteja totalmente imerso.