Binärpräfix

Binärpräfixe (auch IEC-Präfixe oder IEC-Vorsätze) sind Vorsätze für Maßeinheiten (Einheitenvorsätze), die Vielfache bestimmter Zweierpotenzen bezeichnen. Sie werden vorwiegend mit Einheiten wie Bit (Symbol „bit“, selten „b“) oder Byte (Symbol „B“) verwendet, um Datenmengen zu bemessen, da hier aus technischen Gründen häufig Zweierpotenzen auftreten. Im Unterschied dazu sind Dezimalpräfixe Einheitenvorsätze, die Vielfache bestimmter Zehnerpotenzen bezeichnen. SI-Präfixe sind Dezimalpräfixe für die Benutzung im SI-Einheitensystem, IEC-Binärpräfixe sind Binärpräfixe, gedacht für die Verwendung bei Datenmengen. Als Einheitenvorsatz wird sowohl der Name als auch das zugehörige Symbol bezeichnet.

Historisch betrachtet wurden für Datenmengen zunächst nur die SI-Präfixe als Binärpräfixe verwendet, während für physikalische SI-Einheiten die SI-Präfixe (als Dezimalpräfixe) dienen. Später wurden für Datenmengen je nach Kontext die SI-Präfixe mal als Binärpräfix und mal als Dezimalpräfix verwendet. Um eine Alternative zur mehrdeutigen Verwendung der SI-Präfixe zu haben, legte die IEC eigene Präfixe fest, die nun ausschließlich als Binärpräfixe dienen sollen.

IEC-Präfixe zur Basis 2

Die Binärpräfixe sind gemäß der folgenden Tabelle nach IEC 60027-2 definiert:

Name Symbol Wert
kibi Ki 210 = 10241 = 1.024
mebi Mi 220 = 10242 = 1.048.576
gibi Gi 230 = 10243 = 1.073.741.824
tebi Ti 240 = 10244 = 1.099.511.627.776
pebi Pi 250 = 10245 = 1.125.899.906.842.624
exbi Ei 260 = 10246 = 1.152.921.504.606.846.976
zebi Zi 270 = 10247 = 1.180.591.620.717.411.303.424
yobi Yi 280 = 10248 = 1.208.925.819.614.629.174.706.176

Beispiel: 512 MiB (Mebibyte) = 512 · 220 Byte = 536.870.912 Byte ≈ 537 MB (Megabyte).

Normen

Um Mehrdeutigkeiten zu vermeiden, schlug die Internationale elektrotechnische Kommission (IEC) im Juni 1996 einen neuen Normentwurf für Binärpräfixe vor, die nur in der binären Bedeutung verwendet werden sollten. Dieser Entwurf wurde im Dezember 1998 als Norm beschlossen und im Januar 1999 als Ergänzung zu IEC 60027-2 veröffentlicht. Er führte die Präfixe kibi, mebi, gibi, tebi, pebi und exbi für binäre Vielfache von Einheiten ein. In diesen Bezeichnungen wurden die ersten zwei Buchstaben der bereits genormten SI-Präfixe um „bi“ für „binär“ ergänzt. Für die Symbole der Binärpräfixe wurden die Symbole der SI-Präfixe verwendet und an diese der Kleinbuchstabe „i“ angehängt, wobei für das kibi im Gegensatz zum „kilo“ der Großbuchstabe „K“ verwendet wurde. In der Norm wurde außerdem darauf hingewiesen, dass die SI-Präfixe nur für auf Zehnerpotenzen basierende Vielfache verwendet werden sollten. Diese Ergänzungen wurden in die im November 2000 veröffentlichte zweite Auflage der Norm IEC 60027-2 (2000-11) integriert. In die im August 2005 veröffentlichte dritte Ausgabe der Norm IEC 60027-2 (2005-08) wurden auch die Binärpräfixe zebi und yobi aufgenommen.

Viele Standardisierungsorganisationen schlossen sich dieser Empfehlung an. Darunter sind zu nennen das BIPM/CIPM (1998), das IEEE 1541 (2002) und speziell in Deutschland die Physikalisch-Technische Bundesanstalt (2007) (weitere: NIST, CENELEC, DIN/EN).

Auch das für die SI-Präfixe zuständige Internationale Büro für Maß und Gewicht (BIPM) rät von der binären Verwendung der SI-Präfixe ausdrücklich ab und empfiehlt für die Bezeichnung von Zweierpotenzen die Binärpräfixe gemäß der bisherigen IEC 60027-2, die durch die weltweite ISO-Norm IEC 80000-13:2008 (bzw. DIN EN 80000-13:2009-01) gleichlautend ersetzt wurde.

SI-Präfixe für binäre Vielfache zur Basis 10

Da es bis 1996 keine speziellen Einheitenvorsätze für Zweierpotenzen gab, hat es sich verbreitet, die SI-Präfixe im Zusammenhang mit Speicherkapazitäten zur Bezeichnung von Zweierpotenzen zu verwenden (mit Faktor 210 = 1024 statt 1000), die den gewünschten Zweierpotenzen am nächsten kamen. Es sollte dann aus der Kombination mit den Einheiten Bit oder Byte oder einem anderen Kontext hervorgehen, dass eine Zweierpotenz gemeint war. Diese binäre Verwendung der SI-Präfixe wurde 1986 von der IEEE auch in einem Glossar dokumentiert.

Während dies bei Speicherbausteinen, die üblicherweise nur in Größen von Zweierpotenzen hergestellt werden, wenig problematisch ist, führte dies beispielsweise bei der Angabe von Festplattenkapazitäten in GB oder Datenübertragungsraten in MB/s oder Mbit/s zu Zweifeln hinsichtlich der genauen Bedeutung. Zudem wird die Abweichung bei höherwertigen Präfixen immer größer, sodass sie oft nicht mehr vernachlässigbar ist. Auch kommen vereinzelt Mischformen vor, etwa bei der Speicherkapazität einer 3,5-Zoll-Diskette: 1,44 MB = 1440 kB = 1440 × 1024 Byte.

Das für die SI-Präfixe zuständige Internationale Büro für Maß und Gewicht (BIPM) rät daher von dieser nicht normgemäßen Verwendung der SI-Präfixe ausdrücklich ab und empfiehlt für die Bezeichnung von Zweierpotenzen die Binärpräfixe gemäß IEC 60027-2.

Trotzdem war diese empfohlene Bezeichnungsweise auch nach 2009 nicht sehr weit verbreitet). Ausnahme ist Linux in seinen Distributionen, während Windows die Angebe in Bit vorzieht.

Eine Übersicht mit Werten über die möglichen SI-Präfixe und die nächstliegenden Zweierpotenzen sowie die prozentualen (gerundeten) Unterschiede bietet die folgende Tabelle:

Dezimalpräfixe   Unterschied
gerundet
  Binärpräfixe gemäß IEC
Name Symbol Anzahl Bytes[G 1] Name Symbol Anzahl Bytes
Kilobyte kB[G 2] 1 000 = 1030 2,4 % Kibibyte KiB[G 3] 1 024 = 210
Megabyte MB 1 000 000 = 1060 4,9 % Mebibyte MiB 1 048 576 = 220
Gigabyte GB 1 000 000 000 = 1090 7,4 % Gibibyte GiB 1 073 741 824 = 230
Terabyte TB 1 000 000 000 000 = 1012 10,0 % Tebibyte TiB 1 099 511 627 776 = 240
Petabyte PB 1 000 000 000 000 000 = 1015 12,6 % Pebibyte PiB 1 125 899 906 842 624 = 250
Exabyte EB 1 000 000 000 000 000 000 = 1018 15,3 % Exbibyte EiB 1 152 921 504 606 846 976 = 260
Zettabyte ZB 1 000 000 000 000 000 000 000 = 1021 18,1 % Zebibyte ZiB 1 180 591 620 717 411 303 424 = 270
Yottabyte YB 1 000 000 000 000 000 000 000 000 = 1024 20,9 % Yobibyte YiB 1 208 925 819 614 629 174 706 176 = 280
  1. SI-Präfixe sind nur für SI-Einheiten standardisiert; Byte ist keine SI-Einheit
  2. wird gelegentlich mit „KB“ abgekürzt
  3. wird gelegentlich (standardwidrig) mit „KB“ abgekürzt, mitunter um den Unterschied zu „kB“ zu kennzeichnen

Ein anderer zuweilen verwendeter Ansatz, um auf die beabsichtigte Abweichung von der Zehnerpotenz hinzuweisen, besteht darin, für die Zweierpotenzen den Großbuchstaben „K“ (häufig nur als „Ka“ gesprochen) an Stelle des Kleinbuchstabens „k“ zu verwenden. So kann „k“ für 1000 Einheiten verwendet werden und „K“ für 1024. Diese Konvention ist jedoch weder normiert noch wird sie konsequent angewendet. Auch kann dieser Ansatz nicht auf die größeren Präfixe übertragen werden, da die Symbole für die SI-Präfixe ab mega in Großbuchstaben geschrieben werden („M“ für mega, „G“ für giga und so weiter).

Verhältnis binärer und dezimaler Präfixe

Verhältnis bin : dez
Relative Unterschiede für dez : bin

Die Werte der SI-Präfixe steigen in Zehnerpotenzen, weswegen die SI-Präfixe auch als dezimale Präfixe bezeichnet werden, während die Werte der Binärpräfixe in Zweierpotenzen ansteigen. Konkret steigen die Werte der dezimalen Präfixe – ausgehend von kilo – jeweils um den Faktor 10^{3}=1000 und die Werte der binären Präfixe um den Faktor 2^{{10}}=1024. D.h. kilo entspricht 1000^{1}, mega 1000^{2}, giga 1000^{3} und so weiter, und kibi entspricht 1024^{1}, mebi 1024^{2}, gibi 1024^{3} und so weiter. Beschreibt n\in \mathbb{N} die Präfixe derart, dass n=1 für kilo und kibi steht, n=2 für mega und mebi, n=3 für giga und gibi und so weiter, so ergeben sich die Werte der dezimalen Präfixe zu 1000^{n} und die Werte der binären Präfixe zu 1024^{n}. Aus dieser Tatsache lässt sich leicht eine Formel erstellen, welche das Verhältnis der Präfix-Werte zueinander angibt.

\Phi _{{{\frac  {{\mathrm  {bin}}}{{\mathrm  {dez}}}}}}(n)={\frac  {1024^{n}}{1000^{n}}}=\left({\frac  {1024}{1000}}\right)^{n}=1{,}024^{n},\quad n\in \mathbb{N}
\Phi _{{{\frac  {{\mathrm  {dez}}}{{\mathrm  {bin}}}}}}(n)={\frac  {1000^{n}}{1024^{n}}}=\left({\frac  {1000}{1024}}\right)^{n}=1{,}024^{{-n}},\quad n\in \mathbb{N}

Die folgende Tabelle gibt eine Übersicht über die sich daraus ergebenden Verhältnisse:

Name bin : dez dez : bin Beispiel Unterschied in %
Kilobyte, kibibyte 1,024 0,977 100 kB = 97,7 KiB +2,4 % bzw. −2,3 %
Megabyte, mebibyte 1,049 0,954 100 MB = 95,4 MiB +4,9 % bzw. −4,6 %
Gigabyte, gibibyte 1,074 0,931 100 GB = 93,1 GiB +7,4 % bzw. −6,9 %
Terabyte, tebibyte 1,100 0,909 100 TB = 90,9 TiB +10,0 % bzw. −9,1 %
Petabyte, pebibyte 1,126 0,888 100 PB = 88,8 PiB +12,6 % bzw. −11,2 %
Exabyte, exbibyte 1,153 0,867 100 EB = 86,7 EiB +15,3 % bzw. −13,3 %
Zettabyte, zebibyte 1,181 0,847 100 ZB = 84,7 ZiB +18,1 % bzw. −15,3 %
Yottabyte, yobibyte 1,209 0,827 100 YB = 82,7 YiB +20,9 % bzw. −17,3 %

Motivation und Geschichte

Ein wichtiger Bestandteil eines Computers ist der Arbeitsspeicher, der heute üblicherweise als Halbleiterspeicher realisiert wird. Die einzelnen Speicherzellen werden mit Hilfe von parallelen, binär arbeitenden Leitungen adressiert, die zusammengefasst als Adressbus bezeichnet werden. Mit einem Adressbus, der n Leitungen besitzt, können 2^{n} Speicherzellen adressiert werden. Daher werden direktadressierbare Halbleiterspeicher (RAM, ROM, (E)EPROM) üblicherweise in Größen von Zweierpotenzen hergestellt. Mit zunehmender Größe der Speicher wurde es mangels standardisierter Alternativen üblich, SI-Präfixe mit den Speichereinheiten Bit und Byte zu verwenden, um Zweierpotenzen zu quantifizieren, obwohl die SI-Präfixe auf Zehnerpotenzen basieren. Bei Datenspeichern mit sequentieller Adressierung oder bei der sequentiellen Übertragung von Daten gibt es allerdings keinen Grund, mit Zweierpotenzen zu arbeiten, sodass hier die SI-Präfixe meist normgerecht verwendet werden. Dies führt zu Verwirrungen, da meist auch für Fachleute nicht mehr eindeutig erkennbar ist, ob der jeweilige SI-Vorsatz normgerecht als Zehnerpotenz oder normwidrig als Zweierpotenz interpretiert werden soll. Festplattenhersteller verwenden beide Systeme, Zehnerpotenzen bei den Speichergrößen, Zweierpotenzen bei den Cache-Größen.

Beispielsweise haben sich für die Bezeichnung „1,44 MB“ in der Praxis drei verschiedene Interpretationen eingebürgert:

Außerdem findet sich noch die Bezeichnung „1 Mb“ (mit kleinem „b“ für „Bit“):

Diese inkonsequente Vorgehensweise kann beim Rechnen mit Einheiten zu schwer nachvollziehbaren Fehlern führen, wie an folgendem einfachen Beispiel gezeigt werden soll:

Ein Computerbenutzer will eine Datei mit der angegebenen Größe von „40 MB“ aus dem Internet herunterladen und hat dazu eine Datenleitung mit einer Datenübertragungsrate von 8 Mbit/s zur Verfügung. Die zur vollständigen Übertragung dieser Datei benötigte Zeit lässt sich mit der Umrechnung 1 B = 8 bit (vereinfacht) folgendermaßen berechnen:

{\displaystyle t={\frac {40\,\mathrm {MB} }{8\,\mathrm {Mbit} /\mathrm {s} }}={\frac {40\,\mathrm {MB} }{8\,\mathrm {Mbit} /\mathrm {s} \cdot 1\,\mathrm {B} /8\,\mathrm {bit} }}={\frac {40\,\mathrm {MB} }{1\,\mathrm {MB} /\mathrm {s} }}}

Hier drängt es sich auf, die „MB“ im Zähler gegen die „MB“ im Nenner zu kürzen, sodass sich ein Ergebnis von t=40\,{\mathrm  s} ergibt. Wenn jedoch mit dem „MB“ im Zähler eine Zweierpotenz gemeint ist, während im Nenner eine Zehnerpotenz gemeint ist, kann man diese Einheiten nicht gegeneinander kürzen, obwohl dies praktisch nicht mehr ersichtlich ist.

Für eine saubere Lösung dieses Problems gibt es mehrere Möglichkeiten:

  1. Verzicht auf Präfixe größer 1
  2. Benutzung der Potenzschreibweise
  3. ausschließliche und normgerechte(!) Verwendung der SI-Präfixe,
  4. (zusätzliche) Verwendung der von der IEC genormten Binärpräfixe für Zweierpotenzen.

Die Einführung der Binärpräfixe bedeutet nicht, dass sie die SI-Präfixe für die Verwendung mit Bits und Bytes ersetzen sollen. Beispielsweise kann man die Größe eines 230 B großen Arbeitsspeichers mit 1.073.741.824 B, circa 1074 MB oder eben praktischerweise als exakt 1 GiB angeben. Dadurch können die SI-Präfixe stets eindeutig in ihrer genormten Bedeutung verwendet werden.

Welche Angabe sinnvoller ist, hängt vom Verwendungszweck ab, insbesondere davon, ob der Hintergrund einer binären Adressierung besteht und ob dieser von Belang ist (wie z.B. bei der Größe eines Halbleiterspeichers oder der Partitionierung einer Festplatte), oder ob dieser Hintergrund nicht mehr relevant ist (z.B. beim späteren Arbeiten mit Dateien auf denselben Medien). Das Arbeiten mit Zweierpotenzen kann allerdings beim Addieren oder Subtrahieren von Datenmengen mit verschiedenen Binärpräfixen und beim Übergang auf größere oder kleinere Binärpräfixe umständlicher sein als bei der Verwendung der auf das Dezimalsystem zugeschnittenen SI-Präfixe (wie beispielsweise 537 MB).

Trenner
Basierend auf einem Artikel in: Wikipedia.de
Seitenende
Seite zurück
©  biancahoegel.de
Datum der letzten Änderung: Jena, den: 03.05. 2020