Информатика / Кодирование информации

Количество информации по алфавитному подходу

Количество информации по алфавитному подходу равно числу символов сообщения, умноженному на информационный вес одного символа в битах.

Опубликовано: Обновлено:

Формула

$$I = K \cdot i$$

Обозначения

$I$
количество информации, бит
$K$
число символов в сообщении
$i$
информационный вес одного символа, бит

Подробное объяснение

Алфавитный подход считает объем сообщения по длине записи и фиксированному весу одного символа. Если каждый символ занимает i бит, то K символов занимают K одинаковых порций по i бит, поэтому общий объем равен K·i.

Информационный вес символа зависит от мощности алфавита. Если алфавит содержит N равновозможных кодовых символов, то минимальное число бит i связано с N соотношением N=2^i или i=log2 N. В школьных задачах часто выбирают N как степень двойки.

Формула не анализирует смысл текста. Два сообщения одинаковой длины в одной фиксированной кодировке имеют одинаковый объем по алфавитному подходу, даже если одно из них содержательно важнее другого. Здесь измеряется размер кодовой записи, а не смысловая новизна.

Единицы нужно отслеживать отдельно. Если i задано в битах, то I сначала получается в битах. Для перевода в байты делят на 8, в килобайты — с учетом принятого в задаче соотношения, обычно 1024 байта.

Формула применима для равномерного кодирования. В Unicode, архиваторах или кодах переменной длины реальный объем может отличаться, поэтому в условии школьной задачи обычно явно указано, сколько бит отводится на один символ.

Как пользоваться формулой

  1. Определите количество символов K в сообщении.
  2. Найдите информационный вес одного символа i.
  3. Умножьте K на i.
  4. Если нужно, переведите биты в байты, разделив на 8.

Историческая справка

Измерение информации в битах связано с развитием теории связи и вычислительной техники в XX веке. Клод Шеннон в 1948 году сформулировал математическую теорию связи, где информация измеряется через логарифмы числа возможных сообщений и вероятности событий.

Школьный алфавитный подход является упрощенной моделью этой идеи. Он рассматривает символы как элементы фиксированного алфавита и предполагает равную длину кода для каждого символа. Такая модель удобна для первых задач о памяти компьютера и двоичном кодировании.

С развитием компьютеров бит стал основной единицей представления данных, а байт — практической единицей хранения. Поэтому формула I=K·i соединяет теоретическую идею выбора из вариантов с прикладным расчетом объема текстовых данных.

Историческая линия формулы

Современная единица «бит» и логарифмическое измерение информации связаны с теорией связи Клода Шеннона. Формула I=K·i в школьном алфавитном подходе является учебным следствием равномерного кодирования, а не отдельным результатом, опубликованным одним автором.

Пример

Задача. Сообщение состоит из 120 символов, каждый символ кодируется 5 битами. Найти информационный объем сообщения. Дано: K=120, i=5 бит. По формуле I=K·i получаем I=120·5=600 бит. Переведем в байты: 600/8=75 байт. Ответ: 600 бит, или 75 байт. Проверка: каждый из 120 символов занимает одинаковые 5 бит, поэтому общий объем должен быть в 120 раз больше веса одного символа. Деление на 8 корректно, потому что 1 байт = 8 бит. Дополнительная проверка: если бы символов было вдвое меньше, 60, объем стал бы 300 бит. При неизменном весе символа объем прямо пропорционален длине сообщения.

Частая ошибка

Часто путают количество символов K и мощность алфавита N. В формуле I=K·i нужно число символов сообщения, а не число разных символов в алфавите. Вторая ошибка — забывать перевод битов в байты и делить или умножать на 8 в неверную сторону. Еще одна ловушка — применять алфавитный подход к кодировке переменной длины, где разные символы могут занимать разное число бит.

Калькулятор

Посчитать по формуле

Введите значения и нажмите «Рассчитать».

Дополнительные источники

  • Босова Л.Л., Босова А.Ю. Информатика. 7 класс, раздел «Информация и информационные процессы»
  • Семакин И.Г. Информатика. 8 класс, кодирование информации
  • ФИПИ: кодификатор ОГЭ по информатике, кодирование и измерение информации
  • ФИПИ: кодификатор ЕГЭ по информатике, информация и кодирование
  • Shannon C.E. A Mathematical Theory of Communication, 1948

Связанные формулы

Информатика

Мощность алфавита

$N = 2^i$

Мощность алфавита N=2^i показывает, сколько различных символов можно закодировать, если на один символ отводится ровно i бит.

Информатика

Количество наборов битовой строки

$N = 2^n$

Количество наборов битовой строки длины n равно 2^n, потому что каждая позиция независимо принимает одно из двух значений: 0 или 1.

Excel и Google Workspace

LEN / ДЛСТР: длина текста в Excel и Google Таблицах

$=LEN(A2)$

LEN / ДЛСТР: длина текста в Excel и Google Таблицах: формула =LEN(A2) помогает требуется требуется требуется требуется требуется требуется в отчете быстро обработать текстовую строку: подготовить сводку, очистить импорт, проверить качество данных или сделать расчет без ручного копирования. В тексте есть условия, п...

Excel и Google Workspace

POWER / СТЕПЕНЬ: возведение в степень в Excel и Google Таблицах

$=POWER(A2,B2)$

POWER / СТЕПЕНЬ: возведение в степень в Excel и Google Таблицах: формула =POWER(A2,B2) помогает требуется требуется требуется требуется требуется требуется в отчете быстро обработать основание и показатель: подготовить сводку, очистить импорт, проверить качество данных или сделать расчет без ручного копирования. В...

Математика

Классическая вероятность события

$P(A)=\frac{m}{n}$

Классическая вероятность события равна отношению числа благоприятных исходов к числу всех равновозможных исходов в конечном случайном опыте.