Tel qu’il a été pensé à ses origines par Tim Berners-Lee, le HTML ne sert pas à décrire le rendu visuel des pages Web (contrairement à la publication assistée par ordinateur), mais plutôt le sens des différentes parties du texte : titre, liste, passage important, citation, etc. Cette séparation du fond et de la forme n’a pas toujours été respectée au cours du développement du langage, comme en témoigne par exemple le balisage de style de texte, qui permet d’indiquer notamment la police de caractères souhaitée pour l’affichage, sa taille, ou sa couleur.
Interopérabilité
Le Web dépend des auteurs de pages et des éditeurs de logiciels qui partagent les mêmes conventions pour HTML. Cela a motivé un travail commun sur les spécifications de HTML. Permettre aux documents HTML d’être accessibles sur des plates-formes et des navigateurs différents est fondamental dans la conception de ce langage.
L’ambition de Tim Berners-Lee était d’avoir un langage de description de documents au format ouvert qui soit indépendant de ce qui servirait à lire les pages. Par conséquent, il n’est pas prévu que telle ou telle police de caractère soit utilisée explicitement, ni que le moniteur du client utilise telle ou telle résolution. Le logiciel exploité pour la navigation devrait lui aussi ne pas être une source de discrimination.
Parvenir à l’interopérabilité permet de baisser les coûts des fournisseurs de contenus parce qu’ils n’ont à développer qu’une seule version d’un document. Si cet effort n’est pas fait, le risque est grand de voir le Web régresser vers un monde propriétaire de formats incompatibles, en réduisant en fin de compte son potentiel commercial au détriment de tous ses participants.
Chaque version HTML a essayé de refléter le plus grand consensus entre les acteurs de l’industrie, de sorte que les investissements consentis par les fournisseurs de contenus ne soient pas gaspillés et que leurs documents ne deviennent en peu de temps illisibles.
Le langage HTML a été développé avec l’intuition que les appareils de toutes sortes devaient pouvoir utiliser les informations sur le Web : les ordinateurs personnels avec des écrans de résolution et de profondeur de couleurs variables, les téléphones cellulaires, les appareils portables, les appareils de synthèse et de reconnaissance de la parole, les ordinateurs avec une bande passante faible comme élevée, et ainsi de suite.
Interopérabilité des caractères
Les caractères utilisés dans une page Web posent parfois problème. Lors de l’utilisation des premiers documents HTML, l’Unicode n’était pas encore inventé. Aujourd’hui, il est normal qu’une page soit codée en UTF-8.
Toutefois, certains systèmes contiennent toujours des anomalies, qui font que le logiciel ne sait pas quel est l’encodage utilisé. À la fois HTML et HTTP permettent de le préciser, mais l’information donnée est parfois fausse ou divergente.