Tavu (tietotekniikka)

Tämä artikkeli käsittelee tietoteknistä mittayksikköä. Luonnollisen kielen tavu on äänteistä muodostuva sanan rakenneosa.
Tavun monikerrat
Binäärijärjestelmä
JEDEC IEC  Arvo 
kilotavu - KB kibitavu - KiB 210
megatavu - MB mebitavu - MiB 220
gigatavu - GB gibitavu - GiB 230
- tebitavu - TiB 240
- pebitavu - PiB 250
- eksbitavu - EiB 260
- tsebitavu - ZiB 270
- jobitavu - YiB 280
Kymmenjärjestelmä (SI)
Nimi Lyhenne  Arvo 
 kilotavu kB, kt 103
 megatavu MB, Mt 106
 gigatavu GB, Gt 109
 teratavu TB, Tt 1012
 petatavu PB, Pt 1015
 eksatavu EB, Et 1018
 tsettatavu ZB 1021
 jottatavu YB 1024
Binäärisen ja desimaalisen tavun ero kasvaa yksiköiden kasvaessa

Tavu (engl. byte) on tietotekniikassa käytettävä mittayksikkö sellaiselle tallennuskapasiteetille, joka on riippumaton tallennetun datan tyypistä. Tavua kerrannaisineen käytetään ilmoittamaan tietokoneen keskusmuistin tai massamuistin tallennuskapasiteetin määrä. Tavu on pienin tietokoneen muistiosoitteella suoraan osoitettava yksikkö.[1] Se on myös yleinen tietotyyppi ohjelmointikielissä.

Tavun koko on de facto kahdeksan bittiä. IEC standardissa IEC 80000-13:2008 käytäntö on myös kirjattu.[2]

Aiemmissa tietokonejärjestelmien arkkitehtuureissa käytettiin myös kuuden, seitsemän, yhdeksän, kymmenen ja kahdentoista bitin tavuja.[3] IBM S/360 vaikutti tavun standardoimiseen kahdeksaksi bitiksi.[4] Epäselvyyksien ehkäisemiseksi kahdeksan bitin tavusta käytetään muun muassa tietoliikenteessä nimeä oktetti (lyh. o).[5] Termi puolitavu (engl. nibble) tarkoittaa nimensä mukaisesti puolikasta tavua eli käytännössä neljän bitin jonoa.

Kahdeksan bitin tavuun voidaan tallentaa kokonaisluku väliltä 0–255 (28 arvoa). Tavun sisällön merkitys voidaan tulkita usealla tavalla, esimerkiksi yhtenä kirjaimena tietyssä merkistössä. Tavun sisältö ilmoitetaan usein heksadesimaalijärjestelmässä.

Tavu lyhennetään tyypillisesti t[6] (vain suomenkielinen lyhenne), mutta toinen yleinen ja täysin pätevä tapa, myös suomenkielisessä tekstissä, on kansainvälinen tavun yksikkö B[6] (varsin usein käytetään virheellisesti lyhennettä b, joka on bitin lyhenne).

Englanniksi tavua kutsutaan nimellä byte, joka on muunnos sanasta engl. bite (suom. ”haukkaisu”). Puolitavu sen sijaan on englanniksi nibble (suom. ”näykkäisy”). Suomessa termiksi on muodostunut tavu lähinnä siksi, että kahdesta tai useammasta tavusta muodostuu – tietokoneen tyypistä riippuen – sana (engl. word).

  1. Bitwise Operators cs.fsu.edu. Viitattu 16.2.2020. (englanniksi)
  2. IEC 80000-13:2008, sivu 13:

    »In English, the name byte, symbol B, is used as a synonym for octet. Here byte means an eight-bit byte. However, byte has been used for numbers of bits other than eight. To avoid the risk of confusion, it is strongly recommended that the name byte and the symbol B be used only for eight-bit bytes.»

  3. Built-in / Intrinsic / Primitive Data Types isocpp.org. Viitattu 25.1.2017.
  4. Gordon Bell: Rise and Fall of Minicomputers ethw.org. Viitattu 22.1.2020. (englanniksi)
  5. Binary Information and Representation: Bits, Bytes, Nibbles, Octets and Characters tcpipguide.com. Viitattu 26.8.2021. (englanniksi)
  6. a b Lyhenneluettelo: T Kotimaisten kielten keskus. Viitattu 25.1.2017.

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search