UTF-8

UTF-8 (Universal Character Set (UCS) Transformation Format — 8-bit[1]) adalah sebuah pengkodean karakter dengan lebar variabel tertentu (variable-width encoding) yang mewakili setiap karakter komputer (character) dalam himpunan karakter Unicode. Didesain untuk backward compatibility dengan ASCII dan untuk menghindari komplikasi endianness dan byte order mark dalam UTF-16 dan UTF-32.

UTF-8 telah menjadi metode pengkodean karakter (character encoding) yang dominan untuk World Wide Web, meliputi lebih dari setengah jumlah seluruh halaman Web.[2][3][4] Internet Engineering Task Force (IETF) mengharuskan semua protokol Internet untuk mengidentifikasi encoding yang dipakai untuk data karakter, dan pengkodean karakter yang didukung (supported character encoding) untuk menyertakan UTF-8.[5] Internet Mail Consortium (IMC) merekomendasi seluruh program e-mail dapat menayangkan dan membuat e-mail menggunakan UTF-8.[6] UTF-8 juga terus meningkat penggunaannya sebagai default character encoding dalam sistem operasi, bahasa pemrograman, API, dan aplikasi perangkat lunak.


  1. ^ "Chapter 2. General Structure". The Unicode Standard (edisi ke-6.0). Mountain View, California, USA: The Unicode Consortium. ISBN 978-1-936213-01-6. 
  2. ^ Davis, Mark (28 January 2010). "Unicode nearing 50% of the web". Official Google Blog. Google. Diakses tanggal 5 December 2010. 
  3. ^ "UTF-8 Usage Statistics". BuiltWith. Diakses tanggal March 28, 2011. 
  4. ^ "Usage of character encodings for websites". W3Techs. Diakses tanggal March 30, 2010. 
  5. ^ Alvestrand, H. (1998). "RFC 2277". Internet Engineering Task Force.  Parameter |contribution= akan diabaikan (bantuan)
  6. ^ "Using International Characters in Internet Mail". Internet Mail Consortium. August 1, 1998. Diarsipkan dari versi asli tanggal 2007-10-26. Diakses tanggal November 8, 2007. 

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search