Il suono digitale Digitaler Ton Le son numérique Audio digital Digital Audio

O que é o som ?

O som é uma vibração do ar, isto é, uma sequência de sobrepressões e depressões do ar em relação a uma média, que é a pressão atmosférica. De resto, para ficar convencido, basta que coloque um objecto ruidoso (despertador, por exemplo) debaixo duma cúpula vazia para se aperceber que o objecto inicialmente ruidoso não emite um único som se não estiver rodeado de ar!

A maneira mais simples de reproduzir um som actualmente é fazer vibrar um objecto. Desta maneira, um violino emite um som quando o arco faz vibrar as suas cordas, um piano emite uma nota quando se bate uma tecla porque um martelo vai bater numa corda e fazê-la vibrar.

Para reproduzir sons, utilizam-se geralmente altifalantes. Trata-se, com efeito, de uma membrana ligada a um eletroímã que, de acordo com as solicitações de uma corrente eléctrica vai avançar e recuar muito rapidamente, o que provoca uma vibração do ar situado à frente dele, isto é, som!




Desta maneira, produzem-se ondas sonoras que podem ser representadas num gráfico como as variações da pressão do ar (ou da eletricidade no eletroímã) em função do tempo. Obtém-se então uma representação da forma seguinte:





Esta representação de um som é chama-se espectro de modulação de amplitude (modulação da amplitude de um som em função do tempo). O sonograma representa em contrapartida a variação das frequências sonoras em função do tempo. Pode-se observar que um sonograma apresenta uma frequência fundamental, à qual se sobrepõem frequências mais elevadas, chamadas harmónicas.




É o que permite conseguir distinguir várias fontes sonoras:os sons graves terão frequências baixas, e os sons agudos frequências elevadas.


Amostragem do som

Para poder representar um som num computador, é necessário conseguir convertê-lo em valores numéricos, porque este só sabe trabalhar com este tipo de valores. Trata-se, por conseguinte, de aumentar pequenas amostras de som (o que corresponde a aumentar as diferenças de pressão) em intervalos de tempos precisos. Chama-se esta acção amostragem ou a digitalização do som. O intervalo de tempo entre duas amostras chama-se taxa de amostragem. Dado que para restituir um som que parece contínuo para os nossos ouvidos são necessárias amostras de cada 100 000i de segundo, é mais prático raciocinar sobre o número de amostras por segundo, exprimidas em Hertz (Hz). Eis alguns exemplos de taxas de amostragem e qualidades dos sons associados :


Taxa de amostragem Qualidade do som
44 100 Hzqualidade CD
22 000 Hzqualidade rádio
8 000 Hzqualidade telefone



O valor da taxa de amostragem, para um CD áudio por exemplo, não é arbitrário, decorre realmente do teorema de Shannon. A frequência de amostragem deve ser suficientemente grande, a fim de preservar a forma do sinal. O Teorema de Nyquist - Shannon estipula que a frequência de amostragem deve ser igual ou superior ao dobro da frequência máxima contida neste sinal. O nosso ouvido percebe os sons até cercq de 20 000 Hz, é necessário por conseguinte uma frequência de amostragem de pelo menos aproximadamente 40 000 Hz para obter uma qualidade satisfatória. Existem diversas frequências de amostragem normalizadas:

  • 32 kHz : para a rádio FM numérica (banda concorrida limitada a 15 kHz)
  • 44.1 kHz : para o áudio profissional e os compacto-discos
  • 48 kHz : para os registadores numéricos multipistas profissionais e o registo grande público (DAT, MiniDisc…)

Representação informática do som

A cada amostra (que corresponde a um intervalo de tempos) é associado um valor que determina o valor da pressão do ar nesse momento, o som por conseguinte não é representado como uma curva contínua que apresenta variações, mas como uma sequência de valores para cada intervalo de tempo:





O computador trabalha com bits, é necessário por isso determinar o número de valores que a amostra pode tomar, isso implica fixar o número de bits no qual se codificam os valores das amostras.

  • Com uma codificação de 8 bits, tem-se 28 possibilidades de valores, quer dizer de 256 valores possíveis
  • Com uma codificação das 16 bits, tem-se 216 possibilidades de valores, quer dizer de 65536 valores possíveis



Com a segunda representação, ter-se-á, obviamente, uma qualidade de som bem melhor, mas também uma necessidade de memória muito mais importante.


Por último, a estereofonia precisa de dois canais sobre os quais se regista individualmente um som, que será fornecido ao altifalante da esquerda, bem como um som que será difundido no da direita.

Um som é então representado (informaticamente) por vários parâmetros:

  • a frequência de amostragem
  • o número de bits de uma amostra
  • o número de vias (só uma corresponde ao mono, duas ao estéreo, e quatro à quadrifonia)

Memória requerida para armazenar um som

É simples de calcular a dimensão de uma sequência sonora não comprimida. Com efeito, conhecendo o número de bits sobre o qual é codificada uma amostra, conhece-se a dimensão deste (a dimensão de uma amostra é o número de bits…).


Para conhecer a dimensão de uma via, basta conhecer a taxa de amostragem, que vai permitir-nos saber o número de amostras por segundo, e por conseguinte a dimensão que ocupa um segundo de música. Este vale :
Taxa de amostragem x Número de bits

Assim, para saber o espaço memória que consome um extracto sonoro de vários segundos, basta multiplicar o valor precedente pelo número de segundos:
Taxa de amostragem x Número de bits x Número de segundos

Por último, a dimensão final do extracto deve multiplicar-se pelo número de vias (será então duas vezes mais importante em estéreo que em mono…).
A dimensão em bits de um extracto sonoro é então igual :

Taxa de amostragem x Número de bits x Número de segundos x Número de vias

Última modificação do dia Quinta 18 de Junho de 2009 às 19:38:21.Este documento, intitulado « O som digital »a partir de Kioskea (pt.kioskea.net) está disponibilizado sob a licença Creative Commons. Você pode copiar, modificar cópias desta página, nas condições estipuladas pela licença, como esta nota aparece claramente.

Melhores respostas por « O som digital » em :
Dolby Digital / AC3 Ver Apresentação do formato Dolby Digital Lançado em 1987,o formato dolby Digital é um standard de codificação numérico audio 5.1 desenvolvido pelos laboratórios Dolby Labs. Contrariamente aos sistemas Dolby ProLogic, as pistas audio...
Máquina fotográfica digital Ver Introdução às Máquinas fotográficas digitais Uma máquina fotográfica digital é, em oposição a um aparelho fotográfico clássico (chamado “máquina fotográfica”), um aparelho que permite fazer e armazenar as fotografias sob forma numérica. ...
Carta SD / SD Card (Secure Digital) Ver Secure Digital A memória Secure Digital (também designada SD ou SD Card) é um tipo de cartão de memória criado por Matsushita Electronic, SanDisk e Toshiba em Janeiro de 2000. A memória Secure Digital é uma memória especificamente...
Criar uma imagem ISO VerUma imagem ISO é um arquivo contendo uma copia idêntica a um suporte digital na maior parte do tempo um CD-Rom ou um DVD. Graças à uma imagem ISO, é possível criar uma cópia de salvaguarda de um CD ou de um DVD, depois de gravar de novo em um...
[Caméra-TV-->PC] Baixar os vídeos de uma filmadora no PC VerConexão Para uma câmera digital Você pode conectá-la diretamente ao computador com um cartão de aquisição multimídia (IEEE 1394, ou seja, Firewire) no formato PCMCIA Câmera ---> Cartão de aquisição multimídia ---> PC Material escolhido :...
O formato S/PDIF VerO formato S/PDIF O standard S/PDIF (“Sony/Philips Digital Interface”, às vezes notada SPDIF) é um formato que permite transferir dados áudio numéricos. Trata-se de um standard internacional, conhecido sob o nome “IEC-958 tipo II”, definindo...
ADSL VerO que significa xDSL e ADSL? O termo DSL ou xDSL significa Digital Subscriber Line (Linha numérica de assinante) e agrupa o conjunto das tecnologias instaladas para um transporte numérico da informação numa simples linha de conexão...
Introdução ao vídeo digital VerO que é um vídeo ? Um vídeo é uma sucessão de imagens a um certo ritmo. O olho humano tem como característica ser capaz de distinguir cerca de 20 imagens por segundo. Assim, afixando mais de 20 imagens por segundo, é possível enganar o...