UTF-8

Ordet "Wikipedia" kodat i ASCII / UTF-8 (i det här fallet är kodningen identisk), visat som en följd av binära siffror.

UTF-8 (åtta-bitars Unicode transformationsformat) är en längdvarierande teckenkodning som används för att representera text kodad i Unicode, som en sekvens av byte (oktetter). Unicode använder upp till 21 bitar per tecken, vilket inte får plats i en byte, och därför används till exempel i textfiler vanligen en av metoderna UTF-8 eller UTF-16 för att få en serie bytes.

UTF-8 har valts som huvudsaklig teckenkodning i internetprotokoll: nya protokoll måste ge stöd till denna teckenkodning, om det inte av speciella skäl är olämpligt.[1]

  1. ^ RFC 2277: IETF Policy on Character Sets and Languages (status: best current practice)

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search