Sur Internet les documents peuvent être dotés de diverses informations concernant leur contenu, dont la langue.

Pour faciliter les négociations, les langues les plus communes sont identifiées par un code sur deux lettres dans la norme ISO 639-1.

Par exemple : « it », « ca », « el » représentent respectivement l'italien, le catalan, le grec.


Un attribut géographique peut être ajouté pour désigner plus précisément une langue. Ce code optionnel supplémentaire est également sur deux lettres, mais repose sur l'ISO 3166-1.

Ainsi : « es-mx », « es-es », « es » désigneront l'espagnol du Mexique, le castillan d'Espagne, ou la langue espagnole de façon générique (internationale).


Les adresses Internet (courrier, sites...) utilisent également ce code pour spécifier les pays (ou plus précisément des territoires). Dans ce cas le code est dénommé « ccTLD » car il est très légèrement différent.