Comprendre le Web

du HTML au XHTML

XTHML = HTML + XML

Un fichier HTML est destiné à être vu (par des humains)
Un fichier XML est destiné à être lu (par un programme)
Un fichier XHTML est destiné à être vu et lu.

Avantages

Écrit en XHTML le fichier est :

Si des articles codés en XHTML sont régulièrement créés comme dans un blog, un progamme écrit en PHP pourrait créer un flux RSS ou Atom - un fichier XML - afin que les visiteurs puissent s'y abonner et ainsi suivre que les dernières publications

Coder en XML

<?xml version="1.0" encoding="UTF-8"?>
Dans un fichier XML, le prologue n'est pas obligatoire. (1)

Pour qu'un fichier (*.htm ou *.html) puisse être validé HTML5 par la W3C, ce prologue ne doit pas être ajouté. D'où :
<!DOCTYPE html>
<html lang="fr-BE" xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr-BE">
<head>...

Il est préférable de placer les codes : Javascript, CSS, ... dans des fichiers externes

2 caractères spéciaux 

Les deux caractères suivants doivent être convertis en entités : & < (2)(3)
Aussi bien entre les balises que dans la valeur d'un attribut.

Attribut de balise

Nom des éléments

Le nom des balises et des attributs est sensible à la casse.
Leurs noms seront en minuscules = recommandation.

Le nombre de balises et d'attributs sont illimités

Coder en HTML5

1 caractère spécial

Le caractère suivant doit être converti (entité) : < (3).
Aussi bien entre les balises que dans la valeur d'un attribut.

Nom des éléments

Le nom des balises et des attributs est insensible à la casse.
Mais, les règles d'inclusion des balises les unes dans les autres sont définies.

Le nombre de balises et d'attributs sont limités.

A propos des commentaires. Dans un fichier HTML5 ou XML, le contenu d'un commentaire ne peut contenir la séquence suivante : --

A propos du caractère d'échappement. Lorsqu'une valeur d'attribut doit contenir le caractère qui entoure cette valeur, ce caractère doit être précédé par le caractère d'échappement : \

Coder en XHTML5

Le fichier que vous lisez est au format XTHML5 (regardez son code source)


(1) XML Cours et Exercice d'Alexandre Brillant, 2° édition (ISBN 978-2-212-12691-4), page 10. Le parseur considérera alors, par défaut, version="1.0" encoding="UTF-8". Raison supplémentaire d'encoder un fichier (X)HTML en UTF-8.

(2) Ce caractère (&) est celui qui commence une entité tel que &lt; pour représenter < ...

(3) Ce caractère (<) est celui qui commence une balise ...

HTML Versus XHTML (en anglais)