Unicode

Unicode

Nyaste versjon15.1.0 (12. september 2023)[1]
OS-familieXerox Character Code Standard, ISO/IEC 10646, ISO/IEC 2022, ISO 8859, ISO/IEC 646
LisensUnicode® Copyright and Terms of Use
Nettstadhttps://unicode.org/

Unicode er eit teiknsett som blir vidareutvikla av organisasjonen The Unicode Consortium. Organisasjonen vart stifta i 1991 med det føremål å skape eit standard teiknsett for alle datamaskiner og som støtter alle språk som er i praktisk bruk. Unicode-standarden hadde i versjon 3.1 95221 skriftteikn. Standarden har seinare vorte utvida.

Unicode har fleire kodesett som har sin måte å framstille teikna. I UTF-32 blir det brukt 32 bit per teikn for å representere dagens Unicode-teiknsett, medan teikna i UTF-16, som blir brukt i nyare versjonar av Windows, vert delt opp i porsjoner på 16 bit. I UTF-8 blir Unicodeverdiane overført til ein- eller fleirbyte-sekvensar, etter ein matematisk algoritme. I og med at mange operativsystem (t.d. UNIX) krev 8-bits bytes, er UTF-8 kanskje det viktigaste Unicode-formatet i dag. I tillegg vil ein med UTF-8 kunne spare mykje minne ved handsaming av store mengder tekst, som inneheld hovudsakleg teikn som passar inn i første byten.

Det store fortrinnet med Unicode er at det gjer fleirspråkleg kommunikasjon mogleg. Medan ANSI-teiknsetta hindrar brukaren i å skrive på fleire språk innanfor eitt og same dokument, støttar Unicode dei fleste språk.

  1. https://www.unicode.org/versions/Unicode15.1.0/.

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search