Информатика / Кодирование информации
Количество информации по алфавитному подходу
Количество информации по алфавитному подходу равно числу символов сообщения, умноженному на информационный вес одного символа в битах.
Формула
Обозначения
- $I$
- количество информации, бит
- $K$
- число символов в сообщении
- $i$
- информационный вес одного символа, бит
Подробное объяснение
Алфавитный подход считает объем сообщения по длине записи и фиксированному весу одного символа. Если каждый символ занимает i бит, то K символов занимают K одинаковых порций по i бит, поэтому общий объем равен K·i.
Информационный вес символа зависит от мощности алфавита. Если алфавит содержит N равновозможных кодовых символов, то минимальное число бит i связано с N соотношением N=2^i или i=log2 N. В школьных задачах часто выбирают N как степень двойки.
Формула не анализирует смысл текста. Два сообщения одинаковой длины в одной фиксированной кодировке имеют одинаковый объем по алфавитному подходу, даже если одно из них содержательно важнее другого. Здесь измеряется размер кодовой записи, а не смысловая новизна.
Единицы нужно отслеживать отдельно. Если i задано в битах, то I сначала получается в битах. Для перевода в байты делят на 8, в килобайты — с учетом принятого в задаче соотношения, обычно 1024 байта.
Формула применима для равномерного кодирования. В Unicode, архиваторах или кодах переменной длины реальный объем может отличаться, поэтому в условии школьной задачи обычно явно указано, сколько бит отводится на один символ.
Как пользоваться формулой
- Определите количество символов K в сообщении.
- Найдите информационный вес одного символа i.
- Умножьте K на i.
- Если нужно, переведите биты в байты, разделив на 8.
Историческая справка
Измерение информации в битах связано с развитием теории связи и вычислительной техники в XX веке. Клод Шеннон в 1948 году сформулировал математическую теорию связи, где информация измеряется через логарифмы числа возможных сообщений и вероятности событий.
Школьный алфавитный подход является упрощенной моделью этой идеи. Он рассматривает символы как элементы фиксированного алфавита и предполагает равную длину кода для каждого символа. Такая модель удобна для первых задач о памяти компьютера и двоичном кодировании.
С развитием компьютеров бит стал основной единицей представления данных, а байт — практической единицей хранения. Поэтому формула I=K·i соединяет теоретическую идею выбора из вариантов с прикладным расчетом объема текстовых данных.
Историческая линия формулы
Современная единица «бит» и логарифмическое измерение информации связаны с теорией связи Клода Шеннона. Формула I=K·i в школьном алфавитном подходе является учебным следствием равномерного кодирования, а не отдельным результатом, опубликованным одним автором.
Пример
Задача. Сообщение состоит из 120 символов, каждый символ кодируется 5 битами. Найти информационный объем сообщения. Дано: K=120, i=5 бит. По формуле I=K·i получаем I=120·5=600 бит. Переведем в байты: 600/8=75 байт. Ответ: 600 бит, или 75 байт. Проверка: каждый из 120 символов занимает одинаковые 5 бит, поэтому общий объем должен быть в 120 раз больше веса одного символа. Деление на 8 корректно, потому что 1 байт = 8 бит. Дополнительная проверка: если бы символов было вдвое меньше, 60, объем стал бы 300 бит. При неизменном весе символа объем прямо пропорционален длине сообщения.
Частая ошибка
Часто путают количество символов K и мощность алфавита N. В формуле I=K·i нужно число символов сообщения, а не число разных символов в алфавите. Вторая ошибка — забывать перевод битов в байты и делить или умножать на 8 в неверную сторону. Еще одна ловушка — применять алфавитный подход к кодировке переменной длины, где разные символы могут занимать разное число бит.
Калькулятор
Посчитать по формуле
Дополнительные источники
- Босова Л.Л., Босова А.Ю. Информатика. 7 класс, раздел «Информация и информационные процессы»
- Семакин И.Г. Информатика. 8 класс, кодирование информации
- ФИПИ: кодификатор ОГЭ по информатике, кодирование и измерение информации
- ФИПИ: кодификатор ЕГЭ по информатике, информация и кодирование
- Shannon C.E. A Mathematical Theory of Communication, 1948
Связанные формулы
Информатика
Мощность алфавита
Мощность алфавита N=2^i показывает, сколько различных символов можно закодировать, если на один символ отводится ровно i бит.
Информатика
Количество наборов битовой строки
Количество наборов битовой строки длины n равно 2^n, потому что каждая позиция независимо принимает одно из двух значений: 0 или 1.
Excel и Google Workspace
LEN / ДЛСТР: длина текста в Excel и Google Таблицах
LEN / ДЛСТР: длина текста в Excel и Google Таблицах: формула =LEN(A2) помогает требуется требуется требуется требуется требуется требуется в отчете быстро обработать текстовую строку: подготовить сводку, очистить импорт, проверить качество данных или сделать расчет без ручного копирования. В тексте есть условия, п...
Excel и Google Workspace
POWER / СТЕПЕНЬ: возведение в степень в Excel и Google Таблицах
POWER / СТЕПЕНЬ: возведение в степень в Excel и Google Таблицах: формула =POWER(A2,B2) помогает требуется требуется требуется требуется требуется требуется в отчете быстро обработать основание и показатель: подготовить сводку, очистить импорт, проверить качество данных или сделать расчет без ручного копирования. В...
Математика
Классическая вероятность события
Классическая вероятность события равна отношению числа благоприятных исходов к числу всех равновозможных исходов в конечном случайном опыте.