Estrutura de um documento HTML

Noção de documento HTML

Uma página HTML é um simples ficheiro que contém texto formatado com balizas HTML. Por convenção, a extensão dada ao ficheiro é .htm ou .html, mas uma página web pode potencialmente ter qualquer extensão.

Uma página web pode ser construída a partir do mais básico dos editores de texto (uma aplicação bloco-notas, por exemplo), mas existem editores muito mais evoluídos.

Os editores WYSIWYG (“What You See Is What You Get”, literalmente “o que vê é o que obtém”) são editores gráficos que permitem trabalhar sobre uma página web praticamente tal como ela será apresentada num navegador. Graças a este tipo de editores, é possível acrescentar marcas com um simples clique e alterar os atributos editando as suas propriedades num formulário. Por essa razão, para utilizar o melhor possível este tipo de editor, um conhecimento prévio do HTML é muito útil.

Existem igualmente editores que permitem editar o código HTML afixando as balizas, os atributos e os seus valores com diferentes cores para uma melhor leitura e propondo às vezes instrumentos para verificar a validade do código HTML.

Por convenção, a extensão dada a uma página HTML é .htm ou .html, mas uma página web pode potencialmente ter qualquer extensão, nomeadamente as seguintes :

  • .asp para uma página gerada dinamicamente em ASP (Active Server Pages);
  • .cgi para uma página gerada dinamicamente com CGI (Common gateway Interface);
  • .php, .php3 ou .php4 para uma página gerada dinamicamente em PHP;
  • .pl para uma página gerada dinamicamente em Perl (Practical Extraction and Report Language);
  • etc.

Estrutura do documento HTML

Um documento HTML começa com a marca <HTML> e termina com a marca </HTML>. Contém igualmente uma rubrica que descreve o título da página, seguidamente um corpo no qual se encontra o conteúdo da página.

A rubrica é delimitada pelas balizas <HEAD> e </HEAD>. O corpo é delimitado pelas balizas <BODY> e </BODY>.

Eis com exemplo uma página HTML minimalista:

<HTML> 
 <HEAD> 
  <TITLE>Titre de la page</TITLE> 
 </HEAD> 

 <BODY> 
  Contenu de la page 
    </BODY> 
</HTML>

Declaração do tipo de documento

É aconselhado indicar na página HTML o prólogo do tipo de documento, isto é, uma referência à norma HTML utilizada, para especificar o standard utilizado para a codificação da página. Esta declaração faz-se com uma linha do tipo:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN"> 
<HTML> 
 <HEAD>...</HEAD> 
 <BODY>Contenu de la page</BODY> 
</HTML>



A declaração do documento indica a DTD (Document Type Definition) utilizada, quer dizer, a referência das características da linguagem utilizada. O quadro abaixo recapitula as declarações para as principais versões da linguagem HTML :


Versão Declaração
HTML 2.0<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
HTML 3.2<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
HTML 4.01
XHTML 1.0
  • Strict : <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
  • Transitional : <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-loose.dtd">
  • Frameset : <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">
  • XHTML 1.1
    <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
    Última modificação do dia Domingo 2 de Agosto de 2009 às 23:28:44 por owliance.pt_004
    Este documento, intitulado « Estrutura de um documento HTML »a partir de Kioskea.net (pt.kioskea.net) está disponibilizado sob a licença Creative Commons. Você pode copiar, modificar cópias desta página, nas condições estipuladas pela licença, como esta nota aparece claramente.
    Balizas HTML
    Caráteres especiais