Что такое информационный вес символа. Конспект "Измерение информации." Информационный вес и объем."
Решение задач на измерение информации
Для решения задач нам понадобится формула, связывающая между собой информационный вес каждого символа, выраженный в битах (b), и мощность алфавита (N):N = 2 b
Задача 1:
Алфавит содержит 32 буквы. Какое количество информации несет одна буква?
1. 32 = 2 5 , значит вес одного символа b = 5 бит.
Ответ: одна буква несет 5 бит информации.
Задача 2:
Сообщение, записанное буквами из 16 символьного алфавита, содержит 10 символов. Какой объем информации в битах оно несет?
1. 16 = 2 4 , значит вес одного символа b = 4 бита.
2. Всего символов 10, значит объем информации 10 * 4 = 40 бит.
Ответ: сообщение несет 40 бит информации (8 байт).
Задача 3:
Информационное сообщение объемом 300 бит содержит 100 символов. Какова мощность алфавита?
1. Определим вес одного символа: 300 / 100 = 3 бита.
2. Мощность алфавита определяем по формуле: 2 3 = 8.
Ответ: мощность алфавита N = 8.
Попробуйте следующие задачи решить самостоятельно.
Задача 4:
Объем сообщения, содержащего 20 символов, составил 100 бит. Каков размер алфавита, с помощью которого записано сообщение?
Задача 5:
Сколько символов содержит сообщение, записанное с помощью 8 символьного алфавита, если объем его составил 120 бит?
Задача 6:
В книге 100 страниц. На каждой странице 60 строк по 80 символов в строке. Вычислить информационный объем книги.
РЕШЕНИЕ ЗАДАЧ
При хранении и передаче информации с помощью технических устройств информацию следует рассматривать как последовательность символов - знаков (букв, цифр, кодов цветов точек изображения и т.д.).
Набор символов знаковой системы (алфавит) можно рассматривать как различные возможные состояния (события).
Тогда, если считать, что появление символов в сообщении равновероятно, количество возможных событийN
можно вычислить как N=2 i
Количество информации в сообщении I
можно подсчитать умножив количество символов K
на информационный вес одного символа i
Итак, мы имеем формулы, необходимые для определения количества информации в алфавитном подходе:
Возможны следующие сочетания известных (Дано) и искомых (Найти) величин:
Тип | Дано | Найти | Формула |
---|---|---|---|
1 | i | N | N=2 i |
2 | N | i | |
3 | i,K | I | I=K*i |
4 | i,I | K | |
5 | I, K | i | |
6 | N, K | I | Обе формулы |
7 | N, I | K | |
8 | I, K | N |
Если к этим задачам добавить задачи на соотношение величин, записанных в разных единицах измерения, с использованием представления величин в виде степеней двойки мы получим 9 типов задач.
Рассмотрим задачи на все типы. Договоримся, что при переходе от одних единиц измерения информации к другим будем строить цепочку значений. Тогда уменьшается вероятность вычислительной ошибки.
Задача 1 . Получено сообщение, информационный объем которого равен 32 битам. чему равен этот объем в байтах?
Решение: В одном байте 8 бит. 32:8=4
Ответ: 4 байта.
Задача 2 . Объем информацинного сообщения 12582912 битов выразить в килобайтах и мегабайтах.
Решение: Поскольку 1Кбайт=1024 байт=1024*8 бит, то 12582912:(1024*8)=1536 Кбайт и
поскольку 1Мбайт=1024 Кбайт, то 1536:1024=1,5 Мбайт
Ответ:1536Кбайт и 1,5Мбайт.
Задача 3. Компьютер имеет оперативную память 512 Мб. Количество соответствующих этой величине бит больше:
1) 10 000 000 000бит 2) 8 000 000 000бит 3) 6 000 000 000бит 4) 4 000 000 000бит Решение: 512*1024*1024*8 бит=4294967296 бит.Ответ: 4.
Задача 4.
Определить количество битов в двух мегабайтах, используя для чисел только степени 2.
Решение: Поскольку 1байт=8битам=2 3 битам, а 1Мбайт=2 10 Кбайт=2 20 байт=2 23 бит. Отсюда, 2Мбайт=2 24 бит.
Ответ: 2 24 бит.
Задача 5.
Сколько мегабайт информации содержит сообщение объемом 2 23 бит?
Решение: Поскольку 1байт=8битам=2 3 битам, то
2 23 бит=2 23 *2 23 *2 3 бит=2 10 2 10 байт=2 10 Кбайт=1Мбайт.
Ответ: 1Мбайт
Задача 6.
Один символ алфавита "весит" 4 бита. Сколько символов в этом алфавите?
Решение:
Дано:
Ответ: 16
Задача 7.
Каждый символ алфавита записан с помощью 8 цифр двоичного кода. Сколько символов в этом алфавите?
Решение:
Дано:
Ответ: 256
Задача 8.
Алфавит русского языка иногда оценивают в 32 буквы. Каков информационный вес одной буквы такого сокращенного русского алфавита?
Решение:
Дано:
Ответ: 5
Задача 9.
Алфавит состоит из 100 символов. Какое количество информации несет один символ этого алфавита?
Решение:
Дано:
Ответ: 5
Задача 10.
У племени "чичевоков" в алфавите 24 буквы и 8 цифр. Знаков препинания и арифметических знаков нет. Какое минимальное количество двоичных разрядов им необходимо для кодирования всех символов? Учтите, что слова надо отделять друг от друга!
Решение:
Дано:
Ответ: 5
Задача 11.
Книга, набранная с помощью компьютера, содержит 150 страниц. На каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге? Ответ дайте в килобайтах и мегабайтах
Решение:
Дано:
Ответ: 351Кбайт или 0,4Мбайт
Задача 12.
Информационный объем текста книги, набранной на компьютере с использованием кодировки Unicode, — 128 килобайт. Определить количество символов в тексте книги.
Решение:
Дано:
Ответ: 65536
Задача 13.
Информационное сообщение объемом 1,5 Кб содержит 3072 символа. Определить информационный вес одного символа использованного алфавита
Решение:
Дано:
Ответ: 4
Задача 14.
Сообщение, записанное буквами из 64-символьного алфавита, содержит 20 символов. Какой объем информации оно несет?
Решение:
Дано:
Ответ: 120бит
Задача 15.
Сколько символов содержит сообщение, записанное с помощью 16-символьного алфавита, если его объем составил 1/16 часть мегабайта?
Решение:
Дано:
Ответ: 131072
Задача 16.
Объем сообщения, содержащего 2048 символов,составил 1/512 часть мегабайта. Каков размер алфавита, с помощью которого записано сообщение?
Решение:
Дано:
Ответ: 256
Задачи для самостоятельного решения:
- Каждый символ алфавита записывается с помощью 4 цифр двоичного кода. Сколько символов в этом алфавите?
- Алфавит для записи сообщений состоит из 32 символов, каков информационный вес одного символа? Не забудьте указать единицу измерения.
- Информационный объем текста, набранного на компьюте¬ре с использованием кодировки Unicode (каждый символ кодируется 16 битами), — 4 Кб. Определить количество символов в тексте.
- Объем информационного сообщения составляет 8192 бита. Выразить его в килобайтах.
- Сколько бит информации содержит сообщение объемом 4 Мб? Ответ дать в степенях 2.
- Сообщение, записанное буквами из 256-символьного ал¬фавита, содержит 256 символов. Какой объем информации оно несет в килобайтах?
- Сколько существует различных звуковых сигналов, состоящих из последовательностей коротких и длинных звонков. Длина каждого сигнала — 6 звонков.
- Метеорологическая станция ведет наблюдение за влажностью воздуха. Результатом одного измерения является целое число от 20 до 100%, которое записывается при помощи минимально возможного количества бит. Станция сделала 80 измерений. Определите информационный объем результатом наблюдений.
- Скорость передачи данных через ADSL-соединение равна 512000 бит/с. Через данное соединение передают файл размером 1500 Кб. Определите время передачи файла в секундах.
- Определите скорость работы модема, если за 256 с он может передать растровое изображение размером 640х480 пикселей. На каждый пиксель приходится 3 байта. А если в палитре 16 миллионов цветов?
Информационный объем текста и единицы измерения информации
Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется всего два символа 0 и 1. Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).
Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц - машинным языком.
Какой длины должен быть двоичный код, чтобы с его помощью можно было закодировать васе символы клавиатуры компьютера?
Таким образом, информационный вес одного символа достаточного алфавита равен 1 байту
.
Для измерения больших информационных объемов используются более крупные единицы измерения информации:
Единицы измерения количества информации:
1 байт = 8 бит
1 килобайт = 1 Кб = 1024 байта
1 мегабайт = 1 Мб = 1024 Кб
1 гигабайт = 1 Гб = 1024 Гб
Информационный объем текста
1. Количество символов в книге:
60 * 40 * 150 = 360 000 символов.
2. Т.к. 1 символ весит 1 байт, информационный объем книги равен
360 000 байтов.
3. Переведем байты в более крупные единицы:
360 000 / 1024 = 351,56 Кб
351,56 / 1024 = 0,34 Мб
Ответ: Информационный объем текста 0,34 Мб.
Задача:
Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Кб. Сколько символов содержит этот текст?
1. Переведем объем из Мб в байты:
3,5 Мб * 1024 = 3584 Кб
3584 Кб * 1024 = 3 670 016 байт
2. Т.к. 1 символ весит 1 байт, количество символов в тексте равно
На меня действительно нашло затмение. Однако, под чутким руководством коллеги pythonchik я осознал свои заблуждения и встал на путь истинный.
Тем не менее, изложение материала по приведенной в той заметке ссылке я считаю очень запутанным.
Вот как этот материал излагал бы я.
Тема урока :Кодирование информации и вычисление информационного объема сообщения.
Теория
1. Все сообщения состоят из символов алфавита. Например, этот текст состоит из символов русского алфавита.
2. Символ - это минимальная неделимая частица алфавита. Например, символами русского алфавита являются буквы "а", "б", "в" и так далее.
3. Мощность алфавита - это количество символов, из которых состоит алфавит. Например, мощность русского алфавита - 33 символа.
4. Теоретически, любой алфавит может использоваться сам по себе, без какого либо кодирования. В этом случае каждый символ алфавита означает сам себя и имеет самостоятельный смысл. Например, в бумажной книге каждая буква означает сама себя, никакого кодирования нет.
5. Но на практике часто бывает нужно закодировать один алфавит с помощью другого алфавита. Например, в компьютере, на самом деле, нет никаких букв, только цифры. Поэтому, чтобы компьютер понимал буквы "человеческого алфавита", их нужно кодировать с помощью специального "машинного алфавита".
6. Таким образом, при кодировании используется два алфавита - кодируемый и кодирующий.
7. Один символ кодируемого алфавита кодируется несколькими символами кодирующего алфавита.
8. Мощность кодируемого алфавита определяется по формуле N=M i , где M - мощность кодирующего алфавита, а i - количество символов кодирующего алфавита, которыми закодирован кодируемый алфавит.
9. Особая оговорка! Если нет отдельных указаний, то следует считать, что мощность кодирующего алфавита - 2 символа. Все современные компьютеры работают с двумя символами, единицей и нулем, поэтому все расчеты делаются исходя из этого факта.
Практика
Как уже говорилось, компьютер ничего не знает про буквы. Чтобы на компьютере можно было писать буквы, их требуется кодировать. В качестве кодирующего алфавита используются два символа машинного алфавита - 0 и 1. Таким образом, мощность машинного алфавита - два символа.
Чаще всего, хотя и не обязательно, для кодирования одного символа человеческого алфавита в компьютере используется восемь символов машинного алфавита. Вот как это выглядит внутри компьютера:
Эти восемь нулей и единичек кодируют один символ - & .
А сколько всего символов может быть закодировано с помощью восьми нулей и единичек? Ответ можно посчитать по формуле N=M i . Мощность кодирующего алфавита - 2, количество кодирующих символов - 8.
Т.е. с помощью восьми нулей и единичек можно закодировать 256 символов. Иначе говоря, с помощью двух символов машинного алфавита (кодирующий алфавит) можно закодировать 256 символов человеческого алфавита (кодируемый алфавит). В эти 256 символов отлично помещаются русские буквы, латинские буквы, знаки препинания и всякие разные знаки, вроде упоминавшегося выше знака & .
Теперь решим простую задачу
Объем сообщения, содержащего 4096 символов, равен 1/512 части Мбайта. Какова мощность алфавита, с помощью которого записано это сообщение?
Мощность алфавита N=M i . M известно, оно всегда равно 2. Значит, нам нужно узнать i - количество символов кодирующего алфавита, которыми закодирован один символ кодированного алфавита.
Для этого 1/512 Мбайта символов кодирующего алфавита поделим на 4096 символов кодированного алфавита.
Объем 1/512 Мбайта это 1024/512 = 2 Кбайта = 2*1024 = 2048 байт = 2048*8 = 16384 бита.
Значит i = 16384/4096 = 4 бита на символ.
Отсюда мощность кодированного алфавита = 2 4 = 16 символов.
А теперь решим сложную задачу
Милиционер Дядя Степа хочет передать сообщение своему коллеге на соседнем перекрестке с помощью светофора. Сколько светофоров понадобится Дяде Степе, если он хочет использовать все буквы русского языка?
В данном случае кодируемым алфавитом является русский язык. В русском языке 33 буквы, значит мощность кодируемого алфавита - 33 символа.
Кодирующим алфавитом будут светофорные сигналы. Светофор имеет 5 сигналов: красный, желтый, красно-желтый, мигающий желтый, зеленый. Стало быть, мощность кодирующего алфавита - 5 символов.
Вспоминаем, как вычисляется мощность кодируемого алфавита: N=M i . В отличие от простой задачи, тут у нас M не будет равно 2. В случае со светофорами M будет равно 5. Значит, N=5 i .
Мы знаем, что мощность русского языка равна 33. Значит, N=33. Тогда формула будет 33=5 i . Вычислим i.
Если взять i=2, то 5 2 будет равно 25. Т.е. двумя светофорами можно закодировать 25 символов. 25 меньше, чем 33, а это значит, что двух светофоров будет недостаточно для кодирования всех букв русского языка.
Если взять i=3, то 5 3 будет равно 125. Т.е. двумя светофорами можно закодировать 125 символов. 125 больше, чем 33, а это значит, что трех светофоров будет достаточно для кодирования всех букв русского языка.
Остается даже много лишних символов, так что с помощью трех светофоров Дядя Степа сможет не только буквы закодировать, но еще и кучу смайликов в свое сообщение вставить:)