| AnteriorRepresentações | O Código ASCII | PróximoQuoted-printable |
O morse foi a primeira codificação a permitir uma comunicação a longa distância. Foi Samuel F. B. Morse que o afinou em 1844. Este código é composto de pontos e travessões (uma código binário de certa forma…). Permitiu efectuar comunicações muito mais rápidas do que o permitia o sistema de correio da época nos Estados Unidos: o Pony Express. O intérprete, naquela época, era o homem, por isso era necessário um bom conhecimento do código…
Numerosos códigos foram inventados incluindo o código de Emile Baudot (levando de resto o nome de código Baudot, em contrapartida os ingleses chamavam-no Código Murray ).
A 10 de Março de 1876, o Dr. Graham Bell invemta o telefone, uma invenção revolucionária que permite fazer circular informação vocal através de linhas metálicas. Para informação, a Câmara dos Representantes decidiu que a invenção do telefone foi da responsabilidade de Antonio Meucci. Com efeito, este último tinha depositado um pedido de patente em 1871, mas não a tinha podido financiar depois de 1874.
Estas linhas permitiram o desenvolvimento dos téléscripteurs, máquinas que permitem codificar e descodificar caracteres graças ao código Baudot (os caracteres então eram codificados em 5 bits, havia por conseguinte 32 caracteres unicamente…).
Nos anos 60, o código ASCII (American Standard Code for Information Interchange ) é adoptado como standard. Permite a codificação de caracteres em 8 bits, quer dizer 256 caracteres possíveis.
A memória do computador conserva todos os dados sob a forma numérica. Não existe um método para armazenar directamente os caracteres. Cada caracter possui por conseguinte o seu equivalente em código numérico: é o código ASCII (American Standard Code for Information Interchange - traduz-se por “Código Americano Standard para a Troca de Informações”). O código ASCII básico representava os caracteres em 7 bits (quer dizer 128 caracteres possíveis, de 0 a 127).
| caracter | código ASCII | código hexadecimal | |||
|---|---|---|---|---|---|
| NUL (Null) | 0 | 00 | |||
| SOH (Start of heading) | 1 | 01 | |||
| STX (Start of text) | 2 | 02 | |||
| ETX (End of text) | 3 | 03 | |||
| EOT (End of transmission) | 4 | 04 | |||
| ENQ (Enquiry) | 5 | 05 | |||
| ACK (Acknowledge) | 6 | 06 | |||
| BEL (Bell) | 7 | 07 | |||
| BS (Backspace) | 8 | 08 | |||
| TAB (Tabulação horizontal) | 9 | 09 | |||
| LF (Line Feed, salto de linha) | 10 | 0A | |||
| VT (Vertical tabulation, tabulação vertical) | 11 | 0B | |||
| FF (Form feed) | 12 | 0C | |||
| CR (Carriage return, regresso à linha) | 13 | 0D | |||
| SO (Shift out) | 14 | 0E | |||
| SI (Shift in) | 15 | 0F | |||
| DLE (Data link escape) | 16 | 10 | |||
| DC1 (Device control 1) | 17 | 11 | |||
| DC2 (Device control 2) | 18 | 12 | |||
| DC3 (Device control 3) | 19 | 13 | DC4 (Device control 4) | 20 | 14 |
| NAK (Negative acknowledgement) | 21 | 15 | |||
| SYN (Synchronous idle) | 22 | 16 | |||
| ETB (End of transmission block, fim de bloco de transmissão) | 23 | 17 | |||
| CAN (Cancel, anulação) | 24 | 18 | |||
| EM (End of medium, fim do meio) | 25 | 19 | SUB (Substitute, substituto) | 26 | 1A |
| ESC (Escape, caráter de escape) | 27 | 1B | |||
| FS (File separator, separador de ficheiro) | 28 | 1C | |||
| GS (Group separator, separador de grupo) | 29 | 1D | |||
| RS (Record separator, separador de registo) | 30 | 1E | |||
| US (Unit separator, separador de registo) | 31 | 1F | |||
| SP (Space, espaço) | 32 | 20 | |||
| ! | 33 | 21 | |||
| " | 34 | 22 | |||
| # | 35 | 23 | |||
| $ | 36 | 24 | |||
| % | 37 | 25 | |||
| & | 38 | 26 | |||
| ' | 39 | 27 | |||
| ( | 40 | 28 | |||
| ) | 41 | 29 | |||
| * | 42 | 2A | |||
| + | 43 | 2B | |||
| , | 44 | 2C | |||
| - | 45 | 2D | |||
| . | 46 | 2E | |||
| / | 47 | 2F | |||
| 0 | 48 | 30 | |||
| 1 | 49 | 31 | |||
| 2 | 50 | 32 | |||
| 3 | 51 | 33 | |||
| 4 | 52 | 34 | |||
| 5 | 53 | 35 | |||
| 6 | 54 | 36 | |||
| 7 | 55 | 37 | |||
| 8 | 56 | 38 | |||
| 9 | 57 | 39 | |||
| : | 58 | 3A | |||
| ; | 59 | 3B | |||
| < | 60 | 3C | |||
| = | 61 | 3D | |||
| > | 62 | 3E | |||
| ? | 63 | 3F | |||
| @ | 64 | 40 | |||
| A | 65 | 41 | |||
| B | 66 | 42 | |||
| C | 67 | 43 | |||
| D | 68 | 44 | |||
| E | 69 | 45 | |||
| F | 70 | 46 | |||
| G | 71 | 47 | |||
| H | 72 | 48 | |||
| I | 73 | 49 | |||
| J | 74 | 4A | |||
| K | 75 | 4B | |||
| L | 76 | 4C | |||
| M | 77 | 4D | |||
| N | 78 | 4E | |||
| O | 79 | 4F | |||
| P | 80 | 50 | |||
| Q | 81 | 51 | |||
| R | 82 | 52 | |||
| S | 83 | 53 | |||
| T | 84 | 54 | |||
| U | 85 | 55 | |||
| V | 86 | 56 | |||
| W | 87 | 57 | |||
| X | 88 | 58 | |||
| Y | 89 | 59 | |||
| Z | 90 | 5A | |||
| [ | 91 | 5B | |||
| 92 | 5C | ||||
| ] | 93 | 5D | |||
| ^ | 94 | 5E | |||
| _ | 95 | 5F | |||
| ` | 96 | 60 | |||
| a | 97 | 61 | |||
| b | 98 | 62 | |||
| c | 99 | 63 | |||
| d | 100 | 64 | |||
| e | 101 | 65 | |||
| f | 102 | 66 | |||
| g | 103 | 67 | |||
| h | 104 | 68 | |||
| i | 105 | 69 | |||
| j | 106 | 6A | |||
| k | 107 | 6B | |||
| l | 108 | 6C | |||
| m | 109 | 6D | |||
| n | 110 | 6E | |||
| o | 111 | 6F | |||
| p | 112 | 70 | |||
| q | 113 | 71 | |||
| r | 114 | 72 | |||
| s | 115 | 73 | |||
| t | 116 | 74 | |||
| u | 117 | 75 | |||
| v | 118 | 76 | |||
| w | 119 | 77 | |||
| x | 120 | 78 | |||
| y | 121 | 79 | |||
| z | 122 | 7A | |||
| { | 123 | 7B | |||
| | | 124 | 7C | |||
| } | 125 | 7D | |||
| ~ | 126 | 7E | |||
| Toque de supressão | 127 | 7F |
O código ASCII foi concebido para a língua inglesa, não contém por isso caracteres acentuados, nem caracteres específicos de uma língua. Para codificar este tipo de caracter é necessário recorrer a outro código. O código ASCII foi então estendido a 8 bits (um byte) para poder codificar mais caracteres (fala-se, de resto, de código ASCII vasto…). Este código atribui os valores 0 a 255 (por conseguinte codificadas em 8 bits, quer dizer 1 byte) às letras maiúsculas e minúsculas, aos números, às marcas de pontuação e aos outros símbolos (caracteres acentuados no caso do código iso-latin1).
O código ASCII vasto não é único e depende fortemente da plataforma utilizada.
Os dois jogos de caracteres ASCII vastos o maisfrequentemente utilizados são:


O código EBCDIC (Extended Binary-Coded Decimal Interchange Code, desenvolvido pela IBM, permite codificar caracteres em 8 bits. Embora largamente utilizado nas máquinas IBM, não teve o sucesso que conheceu o código ASCII.
O código Unicode é um sistema de codificação dos caracteres em 16 bits postas inventado em 1991. O sistema Unicode permite representar qualquer caracter por um código em 16 bits, independentemente de qualquer sistema de exploração ou linguagem de programação.
Agrupa assim a quase totalidade dos alfabetos existentes (árabe, arménio, cirílico, grego, hebreu, latino,…) e é compatível com o código ASCII.
O conjunto dos códigos Unicode está disponível no site http://www.unicode.org.
Última modificação do dia Sexta 19 de Junho de 2009 às 14:23:06.