UTF-8

UTF-8 (abréviation de l'anglais Universal Character Set Transformation Format[1] - 8 bits) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l'anglais de base, mais très largement répandue depuis des décennies.

L'UTF-8 est utilisé par 82,2 % des sites web en [2], 87,6 % en 2016[3], 90,5 % en 2017[4], 93,1 % en [5] et près de 95,2 % en . Par sa nature, UTF-8 est d'un usage de plus en plus courant sur Internet, et dans les systèmes devant échanger de l'information. Il s'agit également du codage le plus utilisé dans les systèmes GNU/Linux et compatibles pour gérer le plus simplement possible des textes et leurs traductions dans tous les systèmes d'écritures et tous les alphabets du monde.

  1. https://www.unicode.org/L2/Historical/wg20-n193-fss-utf.pdf.
  2. « Usage of character encodings for websites », sur W3Techs (consulté le ).
  3. « Usage of character encodings for websites », sur W3Techs (consulté le 13 septembre 2016).
  4. (en) « Usage Statistics of Character Encodings for Websites, December 2017 », sur w3techs.com (consulté le )
  5. « Usage Survey of Character Encodings broken down by Ranking », sur w3techs.com (consulté le ).

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search