UTF-8

UTF-8 (abréviation de l'anglais Universal Character Set Transformation Format^[1] - 8 bits) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l'anglais de base, mais très largement répandue depuis des décennies.

L'UTF-8 est utilisé par 82,2 % des sites web en décembre 2014^[2], 87,6 % en 2016^[3], 90,5 % en 2017^[4], 93,1 % en février 2019^[5] et près de 95,2 % en octobre 2020. Par sa nature, UTF-8 est d'un usage de plus en plus courant sur Internet, et dans les systèmes devant échanger de l'information. Il s'agit également du codage le plus utilisé dans les systèmes GNU/Linux et compatibles pour gérer le plus simplement possible des textes et leurs traductions dans tous les systèmes d'écritures et tous les alphabets du monde.

↑ https://www.unicode.org/L2/Historical/wg20-n193-fss-utf.pdf.
↑ « Usage of character encodings for websites », sur W3Techs (consulté le 18 décembre 2014).
↑ « Usage of character encodings for websites », sur W3Techs (consulté le 13 septembre 2016).
↑ (en) « Usage Statistics of Character Encodings for Websites, December 2017 », sur w3techs.com (consulté le 28 décembre 2017)
↑ « Usage Survey of Character Encodings broken down by Ranking », sur w3techs.com (consulté le 15 février 2019).

[1] ttps://www.unicode.org/L2/Historical/wg20-n193-fss-utf.pdf.

[2] « Usage of character encodings for websites », sur W3Techs (consulté le 18 décembre 2014).

[W3Techs-3] « Usage of character encodings for websites », sur W3Techs (consulté le 13 septembre 2016).

[4] (en) « Usage Statistics of Character Encodings for Websites, December 2017 », sur w3techs.com (consulté le 28 décembre 2017)

[5] « Usage Survey of Character Encodings broken down by Ranking », sur w3techs.com (consulté le 15 février 2019).

[1]

[2]

[3]

[4]

[5]