Сколько в байте символов: Сколько символов в 1 байте
Сколько символов в 1 байте
Информационный объем текста складывается из информационных весов составляющих его символов.
Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется всего два символа 0 и 1. Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).
Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц – машинным языком.
Какой длины должен быть двоичный код, чтобы с его помощью можно было закодировать васе символы клавиатуры компьютера?
Достаточный алфавит
В алфавит мощностью 256 символов можно поместить практически все символы, которые есть на клавиатуре. Такой алфавит называется достаточным.
Т.к. 256 = 2 8 , то вес 1 символа – 8 бит.
Единице в 8 бит присвоили свое название – байт.
1 байт = 8 бит.
Таким образом, информационный вес одного символа достаточного алфавита равен 1 байту.
Для измерения больших информационных объемов используются более крупные единицы измерения информации:
Единицы измерения количества информации:
1 килобайт = 1 Кб = 1024 байта
1 мегабайт = 1 Мб = 1024 Кб
1 гигабайт = 1 Гб = 1024 Гб
Информационный объем текста
Книга содержит 150 страниц.
На каждой странице – 40 строк.
В каждой строке 60 символов (включая пробелы).
Найти информационный объем текста.
1. Количество символов в книге:
60 * 40 * 150 = 360 000 символов.
2. Т.к. 1 символ весит 1 байт, информационный объем книги равен
3. Переведем байты в более крупные единицы:
360 000 / 1024 = 351,56 Кб
351,56 / 1024 = 0,34 Мб
Ответ: Информационный объем текста 0,34 Мб.
Задача:
Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Кб. Сколько символов содержит этот текст?
Информационный объем текста 3,5 Мб. Найти количество символов в тексте.
1. Переведем объем из Мб в байты:
3,5 Мб * 1024 = 3584 Кб
3584 Кб * 1024 = 3 670 016 байт
2. Т.к. 1 символ весит 1 байт, количество символов в тексте равно
На основании одной ячейки информационной ёмкостью 1 бит можно закодировать только 2 различных состояния. Для того чтобы каждый символ, который можно ввести с клавиатуры в латинском регистре, получил свой уникальный двоичный код, требуется 7 бит. На основании последовательности из 7 бит, в соответствии с формулой Хартли, может быть получено N =2 7 =128 различных комбинаций из нулей и единиц, т.е. двоичных кодов. Поставив в соответствие каждому символу его двоичный код, мы получим кодировочную таблицу. Человек оперирует символами, компьютер – их двоичными кодами.
Для латинской раскладки клавиатуры такая кодировочная таблица одна на весь мир, поэтому текст, набранный с использованием латинской раскладки, будет адекватно отображен на любом компьютере. Эта таблица носит название ASCII (American Standard Code of Information Interchange) по-английски произносится [э́ски], по-русски произносится [а́ски]. Ниже приводится вся таблица ASCII, коды в которой указаны в десятичном виде. По ней можно определить, что когда вы вводите с клавиатуры, скажем, символ “*”, компьютер его воспринимает как код 42(10), в свою очередь 42(10)=101010(2) – это и есть двоичный код символа “*”. Коды с 0 по 31 в этой таблице не задействованы.
Это первая часть перевода статьи What Every Programmer Absolutely, Positively Needs To Know About Encodings And Character Sets To Work With Text
Если вы работаете с текстом в компьютере, вам обязательно нужно знать про кодировки. Даже если вы посылаете электронные письма. Даже если вы их только получаете. Необязательно понимать каждую деталь, но надо хотя бы знать, что из себя представляют кодировки. И вот первая хорошая новость: статья может быть немного запутанной, но основная идея очень и очень простая.
Эта статья о кодировках и наборах символов.
Статья Джоеэля Спольски под названием «Абсолютный минимум о Unicode и наборе символов для каждого разработчика(без исключений!)» будет хорошей вводной и мне доставляет большое удовольствие перечитывать ее время от времени. Я стесняюсь отсылать к ней тех людей, которые испытывают трудности с пониманием проблем с кодировкам, хотя она довольно легкая в плане технических деталей. Я надеюсь, эта статья прольет немного света на то, чем именно являются кодировки, и почему все ваши тексты оказываются испорченными в самый ненужный момент. Статья предназначена для разработчиков(главным образом, на PHP), но пользу от нее может получить любой пользователь компьютера.
Основы
Все более или менее слышали об этом, но каким-то образом знание испаряется, когда дело доходит до обсуждения, так что вот вам: компьютер не может хранить буквы, числа, картинки или что-либо еще. Он может запомнить только биты. Бит имеет только два значения: ДА или НЕТ, ПРАВДА или ЛОЖЬ, 1 или 0 или любую другую пару, которую вы можете вообразить. Раз уж компьютер работает с электричеством, бит представлен электрическим зарядом: он либо есть, либо его нет. Людям проще представлять это в виде 1 и 0, так что я буду придерживаться этих обозначений.
Чтобы с помощью битов представлять нечно полезное, нам нужны правила. Надо сконвертировать последовательность бит в что-то похожее на буквы, числа и изображения, используя схему кодирования, или, коротко, кодировку. Вот так, например:
01100010 01101001 01110100 01110011
b i t s
В этой кодировке, 01100010 представляет из себя ‘b’, 01101001 — ‘i’, 01110100 — ‘t’, 01110011 — ‘s’. Конкретная последовательность бит соответствует букве, а буква – конкретной последовательности битов. Если вы можете запомнить последовательности для 26 букв или умеете действительно быстро находить нужное соответствие, то вы сможете читать биты, как книги.
Упомянутая схема носит название ASCII. Строка с нолями и единицами разбивается на части по 8 бит(по байтам). Кодировка ASCII определяет таблицу перевода байтов в человеческие буквы. Вот небольшой кусочек этой таблицы:
01000001 A
01000010 B
01000011 C
01000100 D
01000101 E
01000110 F
В ней 95 символов, включая буквы от A до Z, в нижнем и верхнем регистре, цифры от 0 до 9, с десяток знаков препинания, амперсанд, знак доллара и прочие. В нее также включены 33 значения, такие как пробел, табуляция, перевод строки, возврат символа и прочие. Это непечатаемые символы, хотя они видимы человеку и используются им. Некоторые значения полезны только компьютеру, такие как коды начала и конца текста. Всего в кодировку ASCII включены 128 символов — прекрасное ровное число для тех, кто смыслит в компьютерах, так как оно использует все комбинации 7ми битов (от 0000000 до 1111111).
Вот вам способ представить человеческую строку, используя только единицы и нули:
01001000 01100101 01101100 01101100 01101111 00100000
01010111 01101111 01110010 01101100 01100100
Важные термины
Для кодирования чего-либо в ASCII двигайтесь справа налево, подменяя буквы на биты. Для декодирования битов в символы, следуйте по таблице слева направо, подменяя биты на буквы.
encode |enˈkōd|
verb [ with obj. ]
convert into a coded form
code |kōd|
noun
a system of words, letters, figures, or other symbols substituted for other words, letters, etc.
Кодирование – это представление чего-либо чем-нибудь другим. Кодировка – это набор правил, описывающий способ перевода одного представления в другое.
Прочие термины, заслуживающие прояснения:
Набор символов, чарсет, charset – Набор символов, который может быть закодирован. «Кодировка ASCII включает набор из 128 символов». Синоним к кодировке.
Кодовая страница – страница кодов, закрепляюшая за символом набор битов. Таблица. Синоним к кодировке.
Строка – пачка чего-нибудь, объединенных вместе. Битовая строка – это пачка бит, такая как 00011011. Символьная строка – это пачка символов, например «Вот эта». Синоним к последовательности.
Двоичный, восьмеричный, десятичный, шестнадцатеричный
Существует множество способов записывать числа. 10011111 – это бинарная запись для 237 в восьмеричной, 159 в десятичной и 9F в шестнадцатиричной системах. Значения у всех этих чисел одинаково, но шестнадцатиричная система короче и проще для понимания, чем двоичная. Я буду придерживаться двоичной системы в этой статье, чтобы улучшить понимание и убрать лишний уровень абстракции. Не пугайтесь, встречая коды символов в других нотациях, все значения эквиваленты.
Excusez-Moi?
Раз уж мы теперь знаем, о чем говорим, заметим: 95 символов – это совсем немного, когда речь идет о языках. Этот набор покрывает базовый английский, но как насчет французских символов? А вот это Straßen¬übergangs¬änderungs¬gesetz из немецкого языка? А приглашение на smörgåsbord в шведском? В-общем, не получится. Не в ASCII. Спецификация на представление é, ß, ü, ä, ö просто отсутствует.
“Постойте-ка”, скажут европейцы, “в обычных компьютерах с 8 битами в байте, ASCII никак не использует бит, который всегда равен 0! Мы можем использовать его, чтобы расширить таблицу еще на 128 значений”. И было так. Но способов обозначить звучание гласных еще слишком много. Не все сочетания букв и значений, используемые в европейских языках, влезают в таблицу из 256 записей. Так мир пришел к изобилию кодировок, стандартов, стандартов де-факто и недостандартов, которые покрывают все субнаборы символов. Кому-то понадобилось написать документ на шведском или чешском, и, не найдя нужной кодировки, просто изобрел еще одну. Или я думаю, что все так и произошло.
Не забывайте о русском, хинди, арабском, корейском и множестве других живых языков планеты. Про мертвые уж молчим. Как только вы найдете способ писать документ, использующий несколько языков, попробуйте добавить китайский. Или японский. Оба содержат тысячи символов. И у вас всего 256 значений. Вперед!
Многобайтные кодировки
Для создания таблиц, которые содержат более 256 символов, одного байта просто недостаточно. Двух байтов (16 бит) хватит для кодировки 65536 различных значений. Big-5 например, кодировка двухбайтная. Вместо разбиения последовательности битов в блоки по 8, она использует блоки по 16 битов и содержит большую(я имею ввиду БОЛЬШУЮ) таблицу с соответствием. Big-5 в своем основном виде покрывает большинство символов традиционного китайского. GB18030 – это похожая кодировка, но она включает как традиционный, так и упрощенный китайский. И, прежде чем вы спросите, да, есть кодировки только для упрощенного китайского. А разве одной недостаточно?
Вот кусок таблицы GB18030:
bits character
10000001 01000000 丂
10000001 01000001 丄
10000001 01000010 丅
10000001 01000011 丆
10000001 01000100 丏
GB18030 покрывает довольно большой диапазон символов, включая большую часть латинских символов, но в конце концов, это всего лишь еще одна кодировка среди многих других.
Путаница с Unicode
В итоге тем, кому больше всех надоела эта каша, пришла в голову идея разработать единый стандарт, объединяющий все кодировки. Этим стандартом стал Unicode. Он определяет невероятную таблицу из 1 114 112 пунктов, используемую для всех вариантов букв и символов. Этого хватит для кодирования всех европейских, средне-азиатских, дальневосточных, южных, северных, западных, доисторических и будущих символов, о которых человечеству известно. Unicode позволяет создать документ на любом языке любыми символами, которые можно ввести в компьютер. Это было невозможно, или очень затруднительно до эры Unicode. В стандарте есть даже неофициальная секция под клингонский. Вы поняли, Unicode настолько большой, чтобы допускает неофициальные секции.
Итак, и сколько же байт использует Unicode для кодирования? Нисколько. Потому что Unicode – это не кодировка.
Смущены? Не вы одни. Unicode в первую и главную очередь определяет таблицу пунктов для символов. Это такой способ сказать «65 – A, 66 – B, 9731 – »(я не шучу, так и есть). Как эти пункты кодируются в байты является предметом другого разговора. Для представления 1 114 112 значений двух байт недостаточно. Трех достаточно, но 3 – странное число, так что 4 является комфортным минимумом. Но, пока вы не используете китайский, или другой язык со множеством символов, которые требуют большого количества битов для кодирования, вам никогда не придет в голову использовать толстую колбасу из 4х байт. Если “A” всегда кодируется в 00000000 00000000 00000000 01000001, а “B” – в 00000000 00000000 00000000 01000010, то документ, использующий такую кодировку, распухнет в 4 раза.
Существует несколько способов решения этой проблемы. UTF-32 – это кодировка, которая переводит все символы в наборы из 32 бит. Это простой алгоритм, но изводящий много места впустую. UTF-16 и UTF-8 являются кодировками с переменной длиной кодирования. Если символ может быть закодирован одним байтом(потому что номер пункта символа очень маленький), UTF-8 закодирует его одним байтом. Если нужно 2 байта, то используется 2 байта. Кодировка сообщает старшими битами, сколькими битами кодируется текущий символ. Такой способ экономит место, но так же и тратит его в случае, если эти сигнальные биты часто используются. UTF-16 является компромиссом: все символы как минимум двухбайтные, но их размер может увеличиваться до 4 байт, если нужно.
character encoding bits
A UTF-8 01000001
A UTF-16 00000000 01000001
A UTF-32 00000000 00000000 00000000 01000001
あ UTF-8 11100011 10000001 10000010
あ UTF-16 00110000 01000010
あ UTF-32 00000000 00000000 00110000 01000010
И все. Unicode – это огромная таблица соответствия символов и чисел, а различные UTF кодировки определяют, как эти числа переводятся в биты. В-общем, Unicode – это просто еще одна схема. Ничего особенного, она просто пытается покрыть все, что можно, оставаясь эффективной. И это хорошо.
Пункты
Символы определяются по их Unicode-пунктам. Эти пункты записаны в шестнадцатеричной системе и предварены “ U+” (просто для удобство, не значит ничего, кроме “Это пункт Unicode”). Символ Ḁ имеет пункт U+1E00. Иными(десятичными) словами, это 7680й символ таблицы Unicode. Он официально называется “ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА А С КОЛЬЦОМ СНИЗУ”.
Ниасилил
Суть вышесказанного: любой символ может быть закодирован множеством разных последовательностей бит, и любая последовательность бит может представлять разные символы, в зависимости от используемой кодировки. Причина в том, что разные кодировки используют разное число бит на символ и разные значения для кодирования разных символов.
11000100 01000010 Windows Latin 1 ÄB
11000100 01000010 Mac Roman ƒB
11000100 01000010 GB18030 腂
characters encoding bits
Føö Windows Latin 1 01000110 11111000 11110110
Føö Mac Roman 01000110 10111111 10011010
Føö UTF-8 01000110 11000011 10111000 11000011 10110110
Заблуждения, смущения и проблемы
Имея все вышесказанное, мы приходим к насущным проблемам, которые испытывают множество пользователей и разработчиков каждый день, как они соотносятся с указанным выше, и каковы пути решения. Сама большая проблема – это
Какого черта мой текст нечитаем?
Если вы откроете документ, и он выглядит так, как текст выше, то причина у этого одна: ваша программа ошиблась с кодировкой. И все. Документ не испорчен(по крайней мере, пока), и не нужно никакое волшебство. Вместо него надо просто выбрать правильную кодировку для отображения текста. Предполагаемый документ выше содержит биты:
10000011 01000111 10000011 10010011 10000011 01010010 10000001 01011011
10000011 01100110 10000011 01000010 10000011 10010011 10000011 01001111
10000010 11001101 10010011 11101111 10000010 10110101 10000010 10101101
10000010 11001000 10000010 10100010
Так, быстренько угадали кодировку? Если вы пожали плечами, то вы правы. Да кто знает?
Попробуем с ASCII. Большая часть этих байтов начинается с 1. Если вы правильно помните, ASCII вообще-то не использует этот бит. Так что ASCII не вариант. Как насчет UTF-8? Большая часть байт не является валидными значениями в этой кодировке. Как насчет Mac Roman(еще одна европейская кодировка)? Хм, для нее эти байты являются правильными значениями. 10000011 декодируетися в ”É”, в “G” и так далее. Так что в Mac Roman текст будет выглядеть так: ÉGÉìÉRÅ[ÉfÉBÉìÉOÇÕìÔǵÇ≠ǻǢ. Правильно? Нет? Может быть? А компьютер-то откуда знает? Может кто-то хотел написать именно это. Насколько я знаю, это может быть последовательностью ДНК! Так и порешим: это Mac Roman, и это ДНК.
Конечно, это полный бред. Правильный ответ таков: текст закодирован в Japanes Shift-JIS и должен выглядеть как エンコーディングは難しくない. Кто бы мог подумать?
Первая причина нечитаемости текста в том, что кто-то пытается прочитать последовательность байт в неверной кодировке. Компьютеру всегда нужно подсказывать. Сам он не догадается. Некоторые типы документов определяют кодировку своего содержимого, но последовательность байт всегда остается черным ящиком.
Большинство браузеров предоставляют возможность указать кодировку страницы с помощью специального пункта меню. Иные программы тоже имеют аналогичные пункты.
У автора нет разбиения на части, но статья и так длинна. Продолжение будет через пару дней.
Кодирование символов. Байт.
<<Назад
|
Содержание
| Далее>>
На основании одной ячейки информационной
ёмкостью 1 бит можно закодировать только 2 различных состояния.
Для того чтобы каждый символ, который можно ввести с клавиатуры
в латинском регистре, получил свой уникальный двоичный
код, требуется 7 бит. На основании последовательности из 7
бит, в соответствии с формулой Хартли, может быть получено
N=27=128 различных
комбинаций из нулей и единиц, т.е. двоичных кодов. Поставив в
соответствие каждому символу его двоичный код, мы получим
кодировочную таблицу. Человек оперирует символами, компьютер
– их двоичными кодами.
Для латинской раскладки клавиатуры такая
кодировочная таблица одна на весь мир, поэтому текст, набранный
с использованием латинской раскладки, будет адекватно отображен
на любом компьютере. Эта таблица носит название ASCII
(American Standard Code of Information Interchange)
по-английски произносится [э́ски], по-русски произносится
[а́ски]. Ниже приводится вся таблица ASCII, коды в
которой указаны в десятичном виде. По ней можно определить, что
когда вы вводите с клавиатуры, скажем, символ “*”, компьютер его
воспринимает как код 42(10), в свою очередь 42(10)=101010(2)
– это и есть двоичный код символа “*”. Коды с 0 по 31 в этой
таблице не задействованы.
Таблица 8.
Таблица символов ASCII
код |
символ |
код |
символ |
код |
символ |
код |
символ |
код |
символ |
код |
символ |
32 |
|
48 |
|
64 |
|
80 |
|
96 |
|
112 |
|
33 |
|
49 |
|
65 |
|
81 |
|
97 |
|
113 |
|
34 |
|
50 |
|
66 |
|
82 |
|
98 |
|
114 |
|
35 |
|
51 |
|
67 |
|
83 |
|
99 |
|
115 |
|
36 |
|
52 |
|
68 |
|
84 |
|
100 |
|
116 |
|
37 |
|
53 |
|
69 |
|
85 |
|
101 |
|
117 |
|
38 |
|
54 |
|
70 |
|
86 |
|
102 |
|
118 |
|
39 |
|
55 |
|
71 |
|
87 |
|
103 |
|
119 |
|
40 |
|
56 |
|
72 |
|
88 |
|
104 |
|
120 |
|
41 |
|
57 |
|
73 |
|
89 |
|
105 |
|
121 |
|
42 |
|
58 |
|
74 |
|
90 |
|
106 |
|
122 |
|
43 |
|
59 |
|
75 |
|
91 |
|
107 |
|
123 |
|
44 |
|
60 |
|
76 |
|
92 |
|
108 |
|
124 |
|
45 |
|
61 |
|
77 |
|
93 |
|
109 |
|
125 |
|
46 |
|
62 |
|
78 |
|
94 |
|
110 |
|
126 |
|
47 |
|
63 |
|
79 |
|
95 |
|
111 |
|
127 |
|
Чтобы хранить также и коды национальных
символов каждой страны (в нашем случае – символов кириллицы)
требуется добавить еще 1 бит, что увеличит количество уникальных
комбинаций из нулей и единиц вдвое, т.е. в нашем распоряжении
дополнительно появится 128 свободных кодов (со 128-го по 255-й),
в соответствие которым можно поставить символы русского
алфавита.
Таким образом, отведя под хранение
информации о коде каждого символа 8 бит, мы получим
N=28=256 уникальных
двоичных кодов, что достаточно, чтобы закодировать все символы,
которые можно ввести с клавиатуры.
Так мы подошли к необходимости
познакомиться с еще одной базовой единицей измерения – байтом.
Байт — последовательность из 8 бит.
1 байт = 23 бит = 8 бит.
На основании одного байта можно получить 28=256
уникальных двоичных кодов.
В современных кодировочных таблицах под хранение информации
о коде каждого символа отводится 1 байт.
1 символ = 1 байт.
В байтах измеряется объем данных (V) при их хранении и
передаче по каналам связи. Например, текст “Добрый
день!” занимает объем равный 12 байтам.
Биты в байте нумеруются с конца с 0-го по 7-й. Минимальная
комбинация на основании одного байта – восемь нулей,
максимальная – восемь единиц. Рис. 18а.
11111111(2)=27+26+25+24+23+22+21+20=128+64+32+16+8+4+2+1=255(10)
При хранении на физическом уровне каждый байт может быть
реализован, например, на базе восьми конденсаторов, каждый
из которых либо разряжен (0), либо заряжен (1). Рис. 18b.
| |
|
|
Возвращаясь к кодировочным таблицам,
заметим, что на сегодняшний день в использовании не одна, а
несколько кодировочных таблиц, включающих коды кириллицы, – это
стандарты, выработанные в разные годы и различными учреждениями.
В этих таблицах различен порядок, в котором расположены друг за
другом символы кирилличного алфавита, поэтому одному и тому же
коду соответствуют разные символы. По этой причине, мы иногда
сталкиваемся с текстами, которые состоят из русских букв, но в
бессмысленной для нас последовательности.
Например, текст “Компьютерные вирусы”,
введенный в кодировке Windows-1251 в кодировке КОИ-8
будет отображен так: ”лПНРШАФЕТОШЕ ЧЙТХУЩ”.
Таблица 9.
Несоответствие кодов символов в различных
кодировках кириллицы.
Код |
|
|
|
Под национальные кодировки отданы коды с
|
192 |
А |
ю |
Р | |
193 |
Б |
а |
С | |
194 |
В |
б |
Т |
Эта проблема разрешима — на каждом
компьютере найдутся все основные кодировочные таблицы, и если
тест выглядит неадекватно, нужно попробовать перекодировать его,
просто указав использовать другую кодировочную таблицу. Но
наличие такой проблемы, конечно, вносит неудобства.
Используя 8-битную кодировочную таблицу мы не сможем адекватно
увидеть на мониторе и тексты, созданные на тех языках, где
используются символы, отличные от латинских и кирилличных,
например символы с умляутами в немецком языке.
<<Назад
|
Содержание
| Далее>>
байт [Б] в символ • Конвертер единиц измерения количества информации • Популярные конвертеры единиц • Компактный калькулятор • Онлайн-конвертеры единиц измерения
Конвертер длины и расстоянияКонвертер массыКонвертер мер объема сыпучих продуктов и продуктов питанияКонвертер площадиКонвертер объема и единиц измерения в кулинарных рецептахКонвертер температурыКонвертер давления, механического напряжения, модуля ЮнгаКонвертер энергии и работыКонвертер мощностиКонвертер силыКонвертер времениКонвертер линейной скоростиПлоский уголКонвертер тепловой эффективности и топливной экономичностиКонвертер чисел в различных системах счисления.Конвертер единиц измерения количества информацииКурсы валютРазмеры женской одежды и обувиРазмеры мужской одежды и обувиКонвертер угловой скорости и частоты вращенияКонвертер ускоренияКонвертер углового ускоренияКонвертер плотностиКонвертер удельного объемаКонвертер момента инерцииКонвертер момента силыКонвертер вращающего моментаКонвертер удельной теплоты сгорания (по массе)Конвертер плотности энергии и удельной теплоты сгорания топлива (по объему)Конвертер разности температурКонвертер коэффициента теплового расширенияКонвертер термического сопротивленияКонвертер удельной теплопроводностиКонвертер удельной теплоёмкостиКонвертер энергетической экспозиции и мощности теплового излученияКонвертер плотности теплового потокаКонвертер коэффициента теплоотдачиКонвертер объёмного расходаКонвертер массового расходаКонвертер молярного расходаКонвертер плотности потока массыКонвертер молярной концентрацииКонвертер массовой концентрации в раствореКонвертер динамической (абсолютной) вязкостиКонвертер кинематической вязкостиКонвертер поверхностного натяженияКонвертер паропроницаемостиКонвертер плотности потока водяного параКонвертер уровня звукаКонвертер чувствительности микрофоновКонвертер уровня звукового давления (SPL)Конвертер уровня звукового давления с возможностью выбора опорного давленияКонвертер яркостиКонвертер силы светаКонвертер освещённостиКонвертер разрешения в компьютерной графикеКонвертер частоты и длины волныОптическая сила в диоптриях и фокусное расстояниеОптическая сила в диоптриях и увеличение линзы (×)Конвертер электрического зарядаКонвертер линейной плотности зарядаКонвертер поверхностной плотности зарядаКонвертер объемной плотности зарядаКонвертер электрического токаКонвертер линейной плотности токаКонвертер поверхностной плотности токаКонвертер напряжённости электрического поляКонвертер электростатического потенциала и напряженияКонвертер электрического сопротивленияКонвертер удельного электрического сопротивленияКонвертер электрической проводимостиКонвертер удельной электрической проводимостиЭлектрическая емкостьКонвертер индуктивностиКонвертер Американского калибра проводовУровни в dBm (дБм или дБмВт), dBV (дБВ), ваттах и др. единицахКонвертер магнитодвижущей силыКонвертер напряженности магнитного поляКонвертер магнитного потокаКонвертер магнитной индукцииРадиация. Конвертер мощности поглощенной дозы ионизирующего излученияРадиоактивность. Конвертер радиоактивного распадаРадиация. Конвертер экспозиционной дозыРадиация. Конвертер поглощённой дозыКонвертер десятичных приставокПередача данныхКонвертер единиц типографики и обработки изображенийКонвертер единиц измерения объема лесоматериаловВычисление молярной массыПериодическая система химических элементов Д. И. Менделеева
Числа в двоичной системе
Общие сведения
Данные и их хранение необходимы для работы компьютеров и цифровой техники. Данные — это любая информация, от команд до файлов, созданных пользователями, например текст или видео. Данные могут храниться в разных форматах, но чаще всего их сохраняют как двоичный код. Некоторые данные хранятся временно и используются только во время исполнения определенных операций, а потом удаляются. Их записывают на устройствах временного хранения информации, например, в оперативной памяти, известной под названием запоминающего устройства с произвольным доступом (по-английски, RAM — Random Access Memory) или ОЗУ — оперативное запоминающее устройство. Некоторую информацию хранят дольше. Устройства, обеспечивающие более длительное хранение — это жесткие диски, твердотельные накопители, и различные внешние накопители.
Подробнее о данных
Данные представляют собой информацию, которая хранится в символьной форме и может быть считана компьютером или человеком. Бо́льшая часть данных, предназначенных для компьютерного доступа, хранится в файлах. Некоторые из этих файлов — исполняемые, то есть они содержат программы. Файлы с программами обычно не считают данными.
Избыточный массив независимых дисков RAID.
Избыточность
Во избежание потери данных при поломках используют принцип избыточности, то есть хранят копии данных в разных местах. Если эти данные перестанут читаться в одном месте, то их можно будет считать в другом. На этом принципе основывается работа избыточного массива независимых дисков RAID (от английского reduntant array of independent discs). В нем копии данных хранятся на двух или более дисках, объединенных в один логический блок. В некоторых случаях для большей надежности копируют сам RAID-массив. Копии иногда хранят отдельно от основного массива, иногда в другом городе или даже в другой стране, на случай уничтожения массива во время катаклизмов, катастроф, или войн.
Форматы хранения данных
Иерархия хранения данных
Данные обрабатываются в центральном процессоре, и чем ближе к процессору устройство, которое их хранит, тем быстрее их можно обработать. Скорость обработки данных также зависит от вида устройства, на котором они хранятся. Пространство внутри компьютера рядом с микропроцессором, где можно установить такие устройства, ограничено, и обычно самые быстрые, но маленькие устройства находятся ближе всего к микропроцессору, а те, что больше но медленнее — дальше от него. Например, регистр внутри процессора очень мал, но позволяет считывать данные со скоростью одного цикла процессора, то есть, в течение нескольких миллиардных долей секунды. Эти скорости с каждым годом улучшаются.
Карта памяти
Первичная память
Первичная память включает память внутри процессора — кэш и регистры. Это — самая быстрая память, то есть время доступа к ней — самое низкое. Оперативная память также считается первичной памятью. Она намного медленнее регистров, но ее емкость гораздо больше. Процессор имеет к ней прямой доступ. В оперативную память записываются текущие данные, постоянно используемые для работы выполняемых программ.
Вторичная память
Устройства вторичной памяти, например накопитель на жестких магнитных дисках (НЖМД) или винчестер, находятся внутри компьютера. На них хранятся данные, которые не так часто используются. Они хранятся дольше, и не удаляются автоматически. В основном их удаляют сами пользователи или программы. Доступ к этим данным происходит медленнее, чем к данным в первичной памяти.
Внешняя память
Внешнюю память иногда включают во вторичную память, а иногда — относят в отдельную категорию памяти. Внешняя память — это сменные носители, например оптические (CD, DVD и Blu-ray), Flash-память, магнитные ленты и бумажные носители информации, такие как перфокарты и перфоленты. Оператору необходимо вручную вставлять такие носители в считывающие устройства. Эти носители сравнительно дешевы по сравнению с другими видами памяти и их часто используют для хранения резервных копий и для обмена информацией из рук в руки между пользователями.
Третичная память
Третичная память включает в себя запоминающие устройства большого объема. Доступ к данным на таких устройствах происходит очень медленно. Обычно они используются для архивации информации в специальных библиотеках. По запросу пользователей механическая «рука» находит и помещает в считывающее устройство носитель с запрошенными данными. Носители в такой библиотеке могут быть разные, например оптические или магнитные.
Виды носителей
Привод DVD
Оптические носители
Информацию с оптических носителей считывают в оптическом приводе с помощью лазера. Во время написания этой статьи (весна 2013 года) самые распространенные оптические носители — оптические диски CD, DVD, Blu-ray и Ultra Density Optical (UDO). Накопитель может быть один, или их может быть несколько, объединенных в одном устройстве, как например в оптических библиотеках. Некоторые оптические диски позволяют осуществлять повторную запись.
Полупроводниковый накопитель
Полупроводниковые носители
Полупроводниковая память — одна из наиболее часто используемых видов памяти. Это вид памяти параллельного действия, позволяющий одновременный доступ к любым данным, независимо в какой последовательности эти данные были записаны.
Почти все первичные устройства памяти, а также устройства флеш-памяти — полупроводниковые. В последнее время в качестве альтернативы жестким дискам становятся более популярными твердотельные накопители SSD (от английского solid-state drives). Во время написания этой статьи эти накопители стоили намного дороже жестких дисков, но скорость записи и считывания информации на них значительно выше. При падениях и ударах они повреждаются намного меньше, чем магнитные жесткие диски, и работают практически безшумно. Кроме высокой цены, твердотельные накопители, по сравнению с магнитными жесткими дисками, со временем начинают работать хуже, и потерянные данные на них очень сложно восстановить, по сравнению с жесткими дисками. Гибридные жесткие диски совмещают твердотельный накопитель и магнитный жесткий диск, увеличивая тем самым скорость и срок эксплуатации, и уменьшая цену, по сравнению с твердотельными накопителями.
Накопитель на жестких магнитных дисках
Магнитные носители
Поверхности для записи на магнитных носителях намагничиваются в определенной последовательности. Магнитная головка считывает и записывает на них данные. Примерами магнитных носителей являются накопители на жестких магнитных дисках и дискеты, которые уже почти полностью вышли из употребления. Аудио и видео также можно хранить на магнитных носителях — кассетах. Пластиковые карты часто хранят информацию на магнитных полосах. Это могут быть дебетовые и кредитные карты, карты-ключи в гостиницах, водительские права, и так далее. В последнее время в некоторые карты встраивают микросхемы. Такие карты обычно содержат микропроцессор и могут выполнять криптографические вычисления. Их называют смарт-картами.
Перфокарта для ткацкого станка
Бумажные носители
Перфокарта и USB-флеш-накопитель
До появления магнитных и других носителей данные хранили на бумаге. Обычно в таком виде были записаны машинные команды, и их могли читать как люди, так и машины, например компьютеры или ткацкие станки. В основном для этих целей использовали перфокарты и перфоленты, где информация хранилась в виде чередующихся отверстий, и отсутствия отверстий. Перфоленту использовали, чтобы записывать текст на телеграфе и в типографии или редакции газет, а также в кассовых аппаратах. Постепенно с конца 50-x и до конца 80-х их заменили магнитные носители. Сейчас бумажные носители используют для подсчета голосов на выборах и для автоматической проверки контрольных работ, ответы к которым записываются на специальную карту, а потом читаются компьютером.
Литература
Автор статьи: Kateryna Yuri
Вы затрудняетесь в переводе единицы измерения с одного языка на другой? Коллеги готовы вам помочь. Опубликуйте вопрос в TCTerms и в течение нескольких минут вы получите ответ.
Информационный объем текста и единицы измерения информации
- Главная
- Справочник
- Единицы измерений
- Разное
- Информационный объем текста и единицы измерения информации
Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется всего два символа 0 и 1. Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).
Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц — машинным языком.
Какой длины должен быть двоичный код, чтобы с его помощью можно было закодировать васе символы клавиатуры компьютера?
Информационный объем текста
Информационный объем текста складывается из информационных весов составляющих его символов.
Достаточный алфавит
В алфавит мощностью 256 символов можно поместить практически все символы, которые есть на клавиатуре. Такой алфавит называется достаточным.
Т.к. 256 = 28, то вес 1 символа – 8 бит.
Единице в 8 бит присвоили свое название — байт.
1 байт = 8 бит.
Таким образом, информационный вес одного символа достаточного алфавита равен 1 байту.
Для измерения больших информационных объемов используются более крупные единицы измерения информации:
Единицы измерения количества информации:
1 байт = 8 бит
1 килобайт = 1 Кб = 1024 байта
1 мегабайт = 1 Мб = 1024 Кб
1 гигабайт = 1 Гб = 1024 Гб
В вашем браузере отключен Javascript.
Чтобы произвести расчеты, необходимо разрешить элементы ActiveX!
Сколько байтов занимает один символ Unicode?
я знаю, этот вопрос старый и уже есть принятый ответ, но я хочу предложить несколько примеров (надеюсь, что это будет полезно кому-то).
насколько я знаю, старые символы ASCII занимали один байт на символ.
право. На самом деле, поскольку ASCII является 7-битной кодировкой, он поддерживает 128 кодов (95 из которых можно распечатать), поэтому он использует только половину байта (если это имеет смысл).
сколько байтов делает Unicode характер требуется?
Unicode просто сопоставляет символы с кодовыми точками. Он не определяет, как их кодировать. Текстовый файл содержит не символы Юникода, а байты/октеты, которые могут представлять символы Юникода.
я полагаю, что один символ Юникода может содержать все возможные
характер с любого языка-я прав?
нет. Но почти. Так что в принципе да. Но все равно нет.
Так сколько байты нужны для каждого символа?
то же, что и ваш 2-й вопрос.
и что означает UTF-7, UTF-6, UTF-16 и т. д.? Являются ли они своего рода Unicode
версии?
нет, это кодировки. Они определяют, как байты / октеты должны представлять символы Юникода.
пара примеров. Если некоторые из них не могут быть отображены в вашем браузере (возможно, потому, что шрифт их не поддерживает), перейдите в http://codepoints.net/U+1F6AA
(заменить 1F6AA
С кода в hex), чтобы увидеть изображение.
- U + 0061 ЛАТИНСКАЯ СТРОЧНАЯ БУКВА A:
a
- Nº: 97
- UTF-8: 61
- UTF-16: 00 61
- U + 0061 ЛАТИНСКАЯ СТРОЧНАЯ БУКВА A:
- U + 00A9 ЗНАК АВТОРСКОГО ПРАВА:
©
- Nº: 169
- UTF-8: C2 A9
- UTF-16: 00 A9
- U+00AE ЗАРЕГИСТРИРОВАННЫЙ ЗНАК:
®
- Nº: 174
- UTF-8: C2 AE
- UTF-16: 00 AE
- U + 00A9 ЗНАК АВТОРСКОГО ПРАВА:
- U+1337 ЭФИОПСКИЙ СЛОГ PHWA:
ጷ
- Nº: 4919
- UTF-8: E1 8C B7
- UTF-16: 13 37
- U + 2014 EM DASH:
—
- Nº: 8212
- кодировка UTF-8: Е2 80 94
- UTF-16: 20 14
- U + 2030 ЗА МИЛЛЕ ЗНАК:
‰
- Nº: 8240
- в UTF-8: Е2 80 В0
- UTF-16: 20 30
- U + 20AC ЗНАК ЕВРО:
€
- Nº: 8364
- UTF-8: E2 82 AC
- UTF-16: 20 AC
- ЗНАК ТОРГОВОЙ МАРКИ U+2122:
™
- Nº: 8482
- в UTF-8: Е2 84 А2
- UTF-16: 21 22
- U+2603 СНЕГОВИК:
☃
- Nº: 9731
- UTF-8: E2 98 83
- UTF-16: 26 03
- U+260E ЧЕРНЫЙ ТЕЛЕФОН:
☎
- Nº: 9742
- UTF-8: E2 98 8E
- UTF-16: 26 0E
- U+2614 ЗОНТИК С КАПЛЯМИ ДОЖДЯ:
☔
- Nº: 9748
- UTF-8: E2 98 94
- UTF-16: 26 14
- U + 263A БЕЛОЕ УЛЫБАЮЩЕЕСЯ ЛИЦО:
☺
- Nº: 9786
- UTF-8: E2 98 BA
- UTF-16: 26 3A
- U + 2691 ЧЕРНЫЙ ФЛАГ:
⚑
- Nº: 9873
- UTF-8: E2 9A 91
- UTF-16: 26 91
- U + 269B СИМВОЛ АТОМА:
⚛
- Nº: 9883
- UTF-8: E2 9A 9B
- UTF-16: 26 9Б
- U+2708 САМОЛЕТ:
✈
- Nº: 9992
- UTF-8: E2 9C 88
- UTF-16: 27 08
- U+271E ЗАТЕНЕННЫЙ БЕЛЫЙ ЛАТИНСКИЙ КРЕСТ:
✞
- Nº: 10014
- UTF-8: E2 9C 9E
- UTF-16: 27 1E
- U + 3020 ПОЧТОВЫЙ ЗНАК ЛИЦО:
〠
- Nº: 12320
- UTF-8: E3 80 А0
- UTF-16: 30 20
- U+8089 CJK УНИФИЦИРОВАННАЯ ИДЕОГРАММА-8089:
肉
- Nº: 32905
- UTF-8: E8 82 89
- UTF-16: 80 89
- U+1337 ЭФИОПСКИЙ СЛОГ PHWA:
- U+1F4A9 КУЧА КАКАШЕК:
- Nº: 128169
- UTF-8: F0 9F 92 A9
- UTF-16: D8 3D DC A9
- U+1F680 ROCKET:
- Nº: 128640
- UTF-8: F0 9F 9A 80
- УТФ-16: Д8 3Д-де-80
- U+1F4A9 КУЧА КАКАШЕК:
ОК Я увлекся…
интересные факты:
Кратко об UTF-8 — Perlover’s Blog
Просто об UTF-8
Этот пост для тех, кто не понимает, что такое UTF-8, но хочет это понять, а доступная документация часто очень обширно освещает этот вопрос. Я попробую здесь описать это так, как сам бы хотел, чтобы раньше мне кто-то так рассказал. Так как часто у меня по поводу UTF-8 была в голове каша.
Несколько простых правил
- Итак, UTF-8 — это «обертка» для Unicode. Это не отдельная кодировка символов, это «обертнутый» Unicode. Вы, наверное, знаете Base64 кодировку, или слышали о ней — она может обернуть бинарные данные в печатаемые символы. Дак вот, UTF-8 это такой же Base64 для Unicode, как Base64 для бинарных данных. Это раз. Если вы это поймете, то уже многое станет ясно. И она также, как Base64, признана решить проблему совместимости в символах (Base64 была придумана для email, чтобы передавать файлы почтой, в которой все символы — печатаемые)
- Далее, если код работает с UTF-8, то внутри он все равно работает с Unicode кодировками, то есть, где-то глубоко внутри есть таблицы символов именно Unicode символов. Правда, можно не иметь таблиц символов Unicode, если надо просто посчитать, сколько символов в строке, например (см. ниже)
- UTF-8 сделан с той целью, чтобы старые программы и сегодняшние компьютеры могли работать нормально с Unicode символами, как со старыми кодировками, типа KOI8, Windows-1251 и т.п.. В UTF-8 нет байтов с нулями, все байты — они либо от 0x01 — 0x7F, как обычный ASCII, либо 0x80 — 0xFF, что также работает под программами, написанными на Си, как и работало бы не с ASCII символами. Правда, для корректной работы с символами программа должна знать Unicode таблицы.
- Все, что имеет старший 7-ой бит в байте (если считать биты с нулевого) UTF-8 — часть кодированного потока Unicode.
UTF-8 изнутри
Если вы знаете битовую систему, то вот вам краткая памятка, как кодируется UTF-8:
Первый байт Unicode символа в UTF-8 начинается с байта, где 7-ой бит всегда единица, и 6-ой бит всегда также единица. При этом в первом байте, если смотреть на биты слева направо (7-ой, 6-ой и так до нулевого), идет столько единиц, сколько байтов, включая первый, идет на кодирование одного Unicode символа. Заканчивается последовательность единиц нулем. А после этого идут биты самого Unicode символа. Остальные биты Unicode символа попадают во второй, или даже в третий байты (максимум три, почему — смотрите чуть ниже). Остальные байты, кроме первого, всегда идут с началом ’10’ и потом 6 битов следующей части Unicode символа.
Пример
Например: есть байты 11010000 и второй 10011110. Первый — начинается с ‘110’ — это значит, что раз две единицы — будет два байта UTF-8 потока, и второй байт, как и все остальные, начинается с ’10’. А кодируют эти два байта символ Unicode, который состоит из 10100 битов от первого куска + 101101 от второго, получается [10000][011110] -> 10000011110 -> 41E в 16-ричной системе, или U+041E в написании Unicode обозначений. Это символ большая русская О.
Сколько максимум байт на символ?
Также, давайте посмотрим, сколько максимум байт уходит в UTF-8, чтобы закодировать 16 бит кодировки Unicode. Вторые и далее байты всегда максимум могут вместить 6 бит. Значит, если начать с конечных байтов, то два байта уйдут точно (2-ой и третий), а первый должен начинаться с ‘1110’, чтобы закодировать три. Значит первый байт максимум в таком варианте может закодировать первые 4 бита символа Unicode. Получается 4 + 6 + 6 = 16 байт. Выходит, что UTF-8 может иметь либо 2, либо 3 байта на символ Unicode (один не может, так как нет надобности кодировать 6 бит (8 — 2 бита ’10’) — они будут ASCII символом. Именно поэтому первый байт UTF-8 никогда не может начинаться с ’10’).
Заключение
Кстати, благодаря такой кодировке, можно взять любой байт в потоке, и определить: является ли байт Unicode символом (если 7-ой бит — значит не ASCII), если да, то первый ли он в потоке UTF-8 или не первый (если ’10’, значит не первый), если не первый, то мы можем переместиться назад побайтово, чтобы найти первый код UTF-8 (у которого 6-ой бит будет 1), либо переместится вправо и пропустить все ’10’ байты, чтобы найти следующий символ. Благодаря такой кодировке, программы также могут, не зная Unicode, считать, сколько символов в строке (на основании первого байта UTF-8 вычислить длину символа в байтах). Вообщем, если подумать, кодировка UTF-8 придумана очень грамотно, и в то же время очень эффективно.
mysql — Сколько символов можно сохранить в 1 байте?
Переполнение стека
- Около
Продукты
- Для команд
Переполнение стека
Общественные вопросы и ответыПереполнение стека для команд
Где разработчики и технологи делятся частными знаниями с коллегамиВакансии
Программирование и связанные с ним технические возможности карьерного ростаТалант
Нанимайте технических специалистов и создавайте свой бренд работодателяРеклама
Обратитесь к разработчикам и технологам со всего мира- О компании
Загрузка…
.
Simple English Wikipedia, бесплатная энциклопедия
байт — это единица измерения размера информации на компьютере или другом электронном устройстве. Один байт обычно равен восьми битам. Некоторые ранние компьютеры использовали шесть бит на каждый байт. Биты — это наименьшая единица хранения на компьютере, одно значение включения / выключения. Байты часто представлены заглавной буквой B , биты — строчной b .
Одиночный типизированный символ (например, «x» или «8») хранится в одном байте.Символ хранится как двоичное число, которое кодирует текстовый символ. Чтобы сопоставить каждое число с символом, необходим согласованный код, такой как EBCDIC или ASCII. EBCDIC — это кодировка символов, используемая в основном на мэйнфреймах. Он использует 8 бит на байт. ASCII — это еще одна кодировка, в которой используется всего семь бит. Extended ASCII использует 8 битов для обозначения большего количества типов символов, в основном используемых на персональных компьютерах.
Байт — это наименьшая полезная единица измерения, показывающая, сколько символов может содержать компьютер (или электронное устройство).Это полезно для таких вещей, как ОЗУ или устройства хранения, такие как USB-накопители и другие типы флэш-памяти. Отправка данных (для модема или Wi-Fi) обычно измеряется в битах, а не в байтах.
На современных компьютерах один байт равен восьми битам. Некоторые ранние компьютеры использовали меньшее количество бит для каждого байта. Чтобы отличить их друг от друга, компьютерные ученые назвали 8-битный байт октетом. В современном использовании октет и байт одинаковы.
Символ для байта — «B». Иногда используется строчная буква «b», но это использование неверно, поскольку «b» на самом деле является символом IEEE для «бит».Символ IEC для бита — бит. Например, «МБ» означает «мегабайт», а «Мбит» означает «мегабит». Разница важна, потому что 1 мегабайт (МБ) равен 1 000 000 байтов, а 1 мегабит (Мбит) равен 1 000 000 бит или 125 000 байтов. Их легко спутать, но биты намного меньше байтов, поэтому следует использовать символ «бит» при обращении к «битам» и прописную букву «B» при обращении к «байтам».
Для больших данных часто используется байт с двоичным префиксом:
Следующие термины представляют даже большие единицы байтов, но используются очень редко:
Некоторые люди придумали неофициальные имена для даже больших единиц байтов:
- Бронтобайт (BB) (2 90 )
- Hellabyte (HB) (2 90 )
- Геопбайт (Гбит / с) (2 100 )
- Saganbyte (2 110 )
- Пиджабайт (2 120 )
Согласно Международной электротехнической комиссии (IEC), которая устанавливает множество компьютерных стандартов, эти диаграммы показывают, как следует относиться к байтам.
Люди, которые ссылаются на 1 килобайт как на 1024 байта, например, технически неверны; 1024 байта следует рассматривать как 1 кибибайт, согласно IEC. [1] Однако использование 1024 для килограммов и 1048576 для мега- и т. Д. Широко практиковалось до того, как стандарты IEC были установлены в 1998 году. На рынке существует некоторая путаница и смешанные термины. Компьютерная память по-прежнему обозначается степенью 2, поэтому 1 КБ памяти составляет 1024 байта, тогда как в памяти компьютера используются мощности 10, поэтому 1 КБ составляет 1000 байтов.
«килограмм» = 1000 [изменить | изменить источник]
При использовании стандартных названий метрик, таких как «кило-», «мега-» и «гига-», они должны соответствовать той же мере, что и другие метрические измерения, например, километр (1 километр = 1000 метров) или гигагерц (1 гигагерц = 1000000000 герц) например.
Агрегат | Номер | Короткая шкала | Длинная шкала |
---|---|---|---|
байт (B) | 1 | 1 байт | 1 байт |
Килобайт (КБ) | 1000 | 1 тысяча байт | 1 тысяча байт |
мегабайт (МБ) | 1 000 000 | 1 миллион байт | 1 миллион байт |
Гигабайт (ГБ) | 1 000 000 000 | 1 миллиард байт | 1 миллиард байт |
Терабайт (ТБ) | 1 000 000 000 000 | 1 триллион байт | 1 миллиард байт |
Петабайт (PB) | 1 000 000 000 000 000 | 1 квадриллион байт | 1 биллиард байт |
эксабайт (ЭБ) | 1 000 000 000 000 000 000 | 1 квинтиллион байт | 1 триллион байт |
Зеттабайт (ZB) | 1 000 000 000 000 000 000 000 | 1 секстиллион байт | 1 триллиард байт |
Йоттабайт (YB) | 1 000 000 000 000 000 000 000 000 | 1 септиллион байт | 1 квадриллион байт |
Brontobyte (BB) (неофициально) | 1 000 000 000 000 000 000 000 000 000 | 1 октиллион байт | 1 квадриллиард байт |
Geopbyte (GpB / GeB) (неофициально) | 1,000,000,000,000,000,000,000,000,000,000 | 1 нониллион байт | 1 квинтиллион байт |
«kibi-» = 1,024 [изменить | изменить источник]
Поскольку компьютеры представляют собой очень сложные цифровые устройства, основанные на двоичной системе счисления, а не на широко используемой десятичной системе счисления или двоично-десятичной системе счисления, существует множество ситуаций, когда стандартная метрическая система не работает должным образом, особенно с объемом памяти для компьютер или запоминающее устройство.Если в памяти или запоминающем устройстве для адресов используется двоичное число, количество различных позиций, к которым необходимо получить доступ (размер памяти), может быть выражено в степени 2, а не в степени 10.
байт (B) | 1 | 2 0 байт |
Кибибайт (KiB) | 1,024 | 2 10 байт |
Мебибайт (МиБ) | 1 048 576 | 2 20 байт |
Гибибайт (ГиБ) | 1 073 741 824 | 2 30 байт |
Тебибайт (ТиБ) | 1 099 511 627 776 | 2 40 байт |
Пебибайт (ПиБ) | 1 125 899 906 842 624 | 2 50 байт |
Эксбибайт (EiB) | 1,152,921,504,606,846,976 | 2 60 байт |
Зебибайт (ЗиБ) | 1,180,591,620,717,411,303,424 | 2 70 байт |
Йобибайт (ЙиБ) | 1,208,925,819,614,629,174,706,176 | 2 80 байт |
Bronbibyte (BiB) (неофициально) | 1,237,940,039,285,380,274,899,124,224 | 2 90 байт |
Gebibyte (GeiB) (неофициально) | 1,267,650,600,228,229,401,496,703,205,376 | 2 100 байт |
.