URL

Abril 2015

O que é um URL?


Um URL (Uniform Resource Locator) é um formato de designação universal para designar um recurso na Internet. Trata-se de uma cadeia de caracteres ASCII imprimíveis que se decompõe em cinco partes :

  • O nome do protocolo : quer dizer, em certa medida, a linguagem utilizada para comunicar na rede. O protocolo mais utilizado é o protocolo HTTP (HyperText Transfer Protocol), o protocolo que permite trocar páginas Web em formato HTML. Contudo, numerosos outros protocolos são utilizáveis (FTP, News, Mailto, Gopher,...)
  • Identificador e palavra-passe: permite especificar os parâmetros de acesso a um servidor protegido. Esta opção é desaconselhada porque a palavra-passe é visível na URL
  • O nome do servidor: Trata-se de um nome de domínio do computador que aloja o recurso pedido. Repare que é possível utilizar o endereço IP do servidor, que torna em contrapartida o URL menos legível.
  • O número de porta : trata-se de um número associado a um serviço que permite ao servidor saber que tipo de recurso é pedido. A porta associada por padrão ao protocolo é a porta número 80. Assim, quando o serviço Web do servidor é associado ao número de porta 80, o número de porta é facultativo
  • O caminho de acesso ao recurso : Esta última parte permite ao servidor conhecer o lugar onde o recurso está situado, ou seja, o lugar (diretório) e o nome do arquivo pedido




Um URL tem a seguinte estrutura:


Protocolopalavra-passe (facultativa)Nome do servidorPorta (facultativa se 80)Caminho
http://user:password@pt.kioskea.net:80/glossair/glossair.php3



Os protocolos seguintes podem, por exemplo, ser utilizados através do URL :

  • http, para a consulta de páginas web
  • ftp, para a consulta de sites FTP
  • telnet, para a conexão a um terminal distante
  • mailto, para o envio de um e-mail
  • wais
  • gopher



O nome de ficheiro na URL pode ser seguido de um ponto de interrogação e depois de dados no formato ASCII, tratam-se de dados suplementares enviados em parâmetro de uma aplicação sobre o servidor (um certificado CGI por exemplo). A URL assemelhar-se-á então a uma cadeia de caracteres como esta:

http://pt.kioskea.net/forum/index.php3?cat=1&page=2</code>  

A codificação de uma URL


Já que o URL é um meio para enviar informações através da Internet (para enviar dados a um certificado CGI por exemplo), é necessário poder enviar caracteres especiais. Ora, os URL não podem conter caracteres especiais. Além disso, certos caracteres são reservados porque têm um significado (o slash permite especificar um subdirectório, os caracteres & e? servem para o envio de dados por formulários, ...). Por último, as URL podem ser incluídas num documento HTML, o que torna difícil a inserção de caracteres como <ou> no URL

É por isso que uma codificação é necessária! A codificação consiste em substituir os caracteres especiais pelo carácter % (ele mesmo um carácter especial) acompanhado do código ASCII do carácter a codificar em notação hexadecimal.

Eis a lista dos caracteres que necessitam uma codificação específica :


CarácterCodificação URL
Tabulação%09
Espaço%20
"%22
#%23
%%25
&%26
(%28
)%29
+%2B
,%2C
.%2E
/%2F
:%3A
;%3B
<%3C
=%3D
>%3E
?%3F
@%40
[%5B
%5C
]%5D
^%5E
'%60
{%7B
%7C
}%7D
~%7E

Mais informação


O formato dos URLs é definido pelo RFC 1738 :

Para uma leitura offline, é possível baixar gratuitamente este artigo no formato PDF:
Url.pdf

A ver igualmente


URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
Este documento, intitulado « URL »a partir de Kioskea (pt.kioskea.net) está disponibilizado sob a licença Creative Commons. Você pode copiar, modificar cópias desta página, nas condições estipuladas pela licença, como esta nota aparece claramente.