w3qc.org

w3qc.org

Quelles sont les différences entre HTML et XHTML ? – W3QCwiki

HTML signifie HyperText Markup Language. XHTML signifie eXtensible HyperText Markup Language.

Ressemblances et différences

HTML et XHTML sont des langages de balisage hypertexte. Ils servent à mettre en évidence la structure logique d’un document Web et à en rendre le contenu interopérable. Tous deux sont des formats libres, gratuits, documentés, universels et ouverts.

Mais HTML est une application SGML (Standard Generalized Markup Language), alors que XHTML est une application XML (eXtensible Markup Language), deux familles de langages différentes et incompatibles.

XHTML sert à faire le pont entre les deux. Il adopte la rigueur syntaxique du XML, tout en demeurant parfaitement compréhensible aux anciens navigateurs lorsqu’il leur est servi en tant que HTML. De ce point de vue, XHTML n’est rien d’autre qu’une version XMLisée du HTML.

Bref survol historique

HTML a été conçu pour permettre aux chercheurs et universitaires de se transmettre des informations en transparence, au-delà de toute limitation réseautique, matérielle ou logicielle. La navigation se faisait alors au travers d’une interface en mode texte, avec un simple clavier et un écran monochrome.

Avec la popularisation du Web, la volonté d’en exploiter le potentiel commercial et l’arrivée des navigateurs graphiques, les soucis de présentation ont commencé à se faire plus pressants. Les images et les formulaires vinrent enrichir le HTML, mais s’y glissèrent aussi des éléments et des technologies nouvelles, contraires à son esprit d’origine.

L’absence de direction se fit rapidement sentir. Au point où le Web ne tarda pas à ressembler davantage à une tour de Babel qu’à l’espace de communication sans frontières dont avait rêvé son inventeur.

Pour éviter que tout ne finisse par s’écrouler, Tim Berners-Lee fonda le W3C, un consortium indépendant et international chargé de conduire le Web à son plein potentiel.

Les spécifications HTML 3.2, HTML 4.0 et HTML 4.01 virent successivement le jour et réussirent à contenir l’hémorragie. Mieux, la technologie des feuilles de style et les différentes saveurs de DOCTYPE font progressivement retrouver au HTML sa vocation première.

Mais en cours de route, le W3C décida d’abandonner le développement du HTML au profit du XML, un langage plus souple et plus puissant.

Pour passer d’une technologie à l’autre sans marquer de rupture brutale avec l’ancien Web, une version XMLisée du HTML 4.01 est mise au point, le XHTML 1.0.

Dix règles d’écriture pour passer du HTML au XHTML

  1. Écrire les noms de balise en bas de casse.
  2. Écrire les noms d’attribut en bas de casse.
  3. Refermer explicitement toute balise ouvrante avec une balise de fin.
  4. Terminer toute balise vide avec une barre oblique précédée d’une espace ( et non ).
  5. Encadrer les valeurs d’attribut de guillemets droits.
  6. Expliciter les valeurs d’attribut ( et non ).
  7. Remplacer l’identificateur partiel NAME par ID.
  8. Assortir toute image d’un attribut ALT, même de valeur nulle.
  9. Assortir tout tableau d’un attribut SUMMARY.
  10. Protéger le contenu des éléments STYLE et SCRIPT avec au début et ]]> à la fin.

Ressources

Passer du HTML au XHTML, sur OpenWeb : http://www.openweb.eu.org/articles/html_au_xhtml/