Una pagina HTML è un semplice file che contiene del testo formattato con dei tag HTML. Per convenzione l'estensione data al file è .htm o .html, ma una pagina web può potenzialmente avere un'estensione qualsiasi.
Una pagina web può essere costruita partendo dal più semplice degli editori di testo (un'applicazione bloc-note ad esempio), ma esistono degli editori molto più evoluti.
Gli editori WYSIWYG («What You See Is What You Get», letteralmente «quello che vedete è quello che ottenete») sono degli editori grafici che permettono di lavorare su una pagina web per come sarà visualizzata su un navigatore tranne qualche piccola differenza di dettaglio. Grazie a questo genere di editori è possibile aggiungere dei tag con un semplice clic e di modificarne gli attributi digitando le loro proprietà in un formulario. Ma in questi casi, per usare al meglio questi editori, è utile avere una conoscenza preventiva dell'HTML.
Esistono anche degli editori che permettono di digitare il codice HTML visualizzando i tag, gli attributi e i rispettivi valori con differenti colori per una lettura migliore e che propongono talvolta degli strumenti per verificare la validità del codice HTML.
Per convenzione l'estensione data ad una pagina HTML è .htm o .html ma una pagina web potenzialmente può avere qualsiasi estensione soprattutto le seguenti :
Un documento HTML comincia con il tag <HTML> e finisce con il tag </HTML>. Esso contiene anche un' intestazione che descrive il titolo della pagina, poi un corpo nel quale si trova il contenuto della pagina.
L'intestazione è limitata dai tag <HEAD> e </HEAD>. Il corpo è limitato dai tag <BODY> e </BODY>.
Ecco un esempio di una pagina HTML minimalista :
<HTML> <HEAD> <TITLE>Tiolo della pagina</TITLE> </HEAD> <BODY> Contenuto della pagina </BODY> </HTML>
Si consiglia d'indicare nella pagina HTML il prologo del tipo di documento, cioè un riferimento alla norma HTML usata, per specificare lo standard usato per la codifica della pagina. Questa dichiarazione è fatta per una stringa del tipo :
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN"> <HTML> <HEAD>...</HEAD> <BODY>Contenuto della pagina</BODY> </HTML>
La dichiarazione del documento indica la DTD (Document Type Definition) usata, cioè la referenza delle caratteristiche del linguaggio usato. La tabella qui sotto riassume le dichiarazioni per le principali versioni del linguaggio HTML :
| Versione | Dichiarazione |
|---|---|
| HTML 2.0 | <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> |
| HTML 3.2 | <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> |
| HTML 4.01 |
|
| XHTML 1.0 |
|
| XHTML 1.1 | <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> |