Виды кодирования и декодирования информации. Кодирование и декодирование. Кодирование текстовой информации. Кодировка ASCII. Основные используемые кодировки кириллицы

Здравствуйте! Меня зовут Александр Георгиевич! Я работаю репетитором по , и уже на протяжении 10 лет.

Ключевые направления моей преподавательской деятельности:

    Подготовка школьников к успешной сдаче и по информатике и математике.

    Подготовка студентов по различным .

    Выполнение на заказ всевозможных .

    Ведение образовательного YouTube-канала , на который я регулярно выкладываю мультимедийные видеоматериалы.

Если у вас есть непонимания, что такое « Декодирование информации » и что под этим процессом понимается, то рекомендую вам записаться на . На своих частных занятиях я со своими учениками помимо знакомства с теоретической частью решаю колоссальное количество различных тематических примеров.

В отличие от большинства других репетиторов я предлагаю своим клиентам абсолютно любые взаимодействия:

Информация, свойства информации, кодирование информации

Прежде чем переходить к анализу сведений, связанных с декодированием информации , вам в обязательном порядке стоит освежить в памяти такие темы, как « » и « ».

С таким понятием как «Декодирование информации » неразрывно связано другое – « ». Эти процессы являются антагонистами, то есть противопоставляются друг другу. Процесс декодирования невозможен без начального процесса кодирования какой-либо информации.

Если бы не существовало кодирования информации, то тогда бы не требовалось и проводить декодирование.

Рассмотрим два конкретных примера. Первый – бытовой, второй – промышленный.

Вы хотите передать другу текстовое email-сообщение, но не в обычном русскоязычном варианте, а специальном, чтобы никто не смог его правильно прочитать. Следовательно, вы задумываетесь о том, каким образом его можно зашифровать, закодировать. Не долго думая, вы выбираете следующий способ кодирования.

В чем его суть: каждую русскую букву передаваемого сообщения вы заменяется на букву, стоящую в алфавите через 5 позиций дальше. То есть буква « а» становится буквой «е», буква «б» становится буквой «ё» и так далее. По факту вы производите сдвиг позиции буквы на 5 единиц вперед.

Да, подобное кодирование крайне неустойчивое и легко «взламывается» злоумышленниками, но большинство людей не смогу раскодировать подобное сообщение за разумное время, так как не догадаются об алгоритме шифрования.

Когда ваш друг получает от вас закодированное текстовое сообщение он должен его декодировать, то есть воспользоваться алгоритмом вашего кодирования, но в «обратную сторону». Чтобы декодировать информацию , представленную таким информационным сообщением, ему следует произвести сдвиг каждой буквы на 5 позиций назад.

То есть буква «ё» станет буквой «б», а буква «е» станет буквой «а» и так далее. Это пример простейшего, тривиального кодирования и декодирования информации .

Пример промышленного "банковского" кодирования и декодирования информации

Давайте рассмотрим более сложный вариант шифрования информации. Допустим банковский служащий планирует передать в другую страну документ, содержащий информацию о банковских счетах клиентов банка. Передавать подобное сообщение в незащищенном варианте абсолютно опасно.

Существует большое количество устойчивых алгоритмов кодирования информации, я лишь вкратце поясню суть. Сначала вычисляется контрольная сумма файла (под файлом можно понимать передаваемый документ), затем файл разбивается на несколько пакетов.

Для каждого пакета также вычисляется контрольная сумма. Информация внутри каждого пакета кодируется одним из сложнейших современных алгоритмов шифрования. После этого начинается передача пакетов адресату. Адресат, получая пакеты, отправляет отправителю контрольные суммы.

Если контрольные суммы пакетов у отправителя и адресата совпадают, то все в порядке, несанкционированного доступа к этим пакетам не проводилось. Когда все пакеты переданы, они комплектуются в единый файл, происходит этап декодирования информации .

Разная информация кодируется по-разному

Также вам нужно понимать, что разные виды информации проходят различную обработку при декодировании. Под разными видами информации следует понимать

Остались вопросы? Звоните и записывайтесь на первый урок!

Если у вас остались вопросы, касающиеся декодирования информации , то звоните мне на мобильный телефон и записывайтесь на индивидуальные уроки по информатике и ИКТ. Я смогу вам пояснить абсолютно любой момент из данной темы, а также продемонстрирую на примерах, как правильно проводить декодирование «сложной» информации.

Своим потенциальным клиентам я предлагаю финансового взаимодействия, поэтому даже самый взыскательные клиент сумеет подобрать вариант, полностью удовлетворяющий его текущим потребностям.

Описание презентации по отдельным слайдам:

1 слайд

Описание слайда:

Кодирование и декодирование информации Выполнила: учитель информатики МОУ Сургутской СОШ Плешанова Татьяна Сергеевна *

2 слайд

Описание слайда:

Кодирование и декодирование Для обмена информацией с другими людьми человек использует естественные языки. Наряду с естественными языками были разработаны формальные языки для профессионального применения их в какой-либо сфере. Представление информации с помощью какого-либо языка часто называют кодированием. Код - набор символов (условных обозначений) для представления информации. Код - система условных знаков (символов) для передачи, обработки и хранения информации(со общения). Кодирование - процесс представления информации (сообщения) в виде кода. Все множество символов, используемых для кодирования, называется алфавитом кодирования. Например, в памяти компьютера любая информация кодируется с помощью двоичного алфавита, содержащего всего два символа: 0 и1. Декодирование- процесс обратного преобразования кода к форме исходной символьной системы, т.е. получение исходного сообщения. Например: перевод с азбуки Морзе в письменный текст на русском языке. В более широком смысле декодирование - это процесс восстановления содержания закодированного сообщения. При таком подходе процесс записи текста с помощью русского алфавита можно рассматривать в качестве кодирования, а его чтение - это декодирование. *

3 слайд

Описание слайда:

Способы кодирования информации Для кодирования одной и той же информации могут быть использованы разные способы; их выбор зависит от ряда обстоятельств: цели кодирования, условий, имеющихся средств. Если надо записать текст в темпе речи - используем стенографию; если надо передать текст за границу - используем английский алфавит; если надо представить текст в виде, понятном для грамотного русского человека, - записываем его по правилам грамматики русского языка. «Здравствуй, Саша!» «Zdravstvuy, Sasha!» *

4 слайд

Описание слайда:

Способы кодирования информации Выбор способа кодирования информации может быть связан с предполагаемым способом ее обработки. Покажем это на примере представления чисел - количественной информации. Используя русский алфавит, можно записать число "тридцать пять". Используя же алфавит арабской десятичной системы счисления, пишем «35». Второй способ не только короче первого, но и удобнее для выполнения вычислений. Какая запись удобнее для выполнения расчетов: "тридцать пять умножить на сто двадцать семь" или "35 х 127"? Очевидно - вторая. *

5 слайд

Описание слайда:

Шифрование сообщения В некоторых случаях возникает потребность засекречивания текста сообщения или документа, для того чтобы его не смогли прочитать те, кому не положено. Это называется защитой от несанкционированного доступа. В таком случае секретный текст шифруется. В давние времена шифрование называлось тайнописью. Шифрование представляет собой процесс превращения открытого текста в зашифрованный, а дешифрование - процесс обратного преобразования, при котором восстанавливается исходный текст. Шифрование - это тоже кодирование, но с засекреченным методом, известным только источнику и адресату. Методами шифрования занимается наука под названием криптография. *

6 слайд

Описание слайда:

Оптический телеграф Шаппа В 1792 году во Франции Клод Шапп создал систему передачи визуальной информации, которая получила название «Оптический телеграф». В простейшем виде это была цепь типовых строений, с расположенными на кровле шестами с подвижными поперечинами, которая создавалась в пределах видимости одно от другого. Шесты с подвижными поперечинами - семафоры - управлялись при помощи тросов специальными операторами изнутри строений. Шапп создал специальную таблицу кодов, где каждой букве алфавита соответствовала определенная фигура, образуемая Семафором, в зависимости от положений поперечных брусьев относительно опорного шеста. Система Шаппа позволяла передавать сообщения на скорости два слова в минуту и быстро распространилась в Европе. В Швеции цепь станций оптического телеграфа действовала до 1880 года. *

7 слайд

Описание слайда:

Первый телеграф Первым техническим средством передачи информации на расстояние стал телеграф, изобретенный в1837 году американцем Сэмюэлем Морзе. Телеграфное сообщение - это последовательность электрических сигналов, передаваемая от одного телеграфного аппарата по проводам к другому телеграфному аппарату. Изобретатель Сэмюель Морзе изобрел удивительный код(Азбука Морзе, код Морзе, «Морзянка»), который служит человечеству до сих пор. Информация кодируется тремя «буквами»: длинный сигнал (тире), короткий сигнал (точка) и отсутствие сигнала (пауза) для разделения букв. Таким образом, кодирование сводится к использованию набора символов, расположенных в строго определенном порядке. Самым знаменитым телеграфным сообщением является сигнал бедствия "SOS" (Save Our Souls - спасите наши души). Вот как он выглядит: « – – – » *

8 слайд

Описание слайда:

Азбука Морзе A − И P − Ш − − − − Б − Й − − − С Щ − − − В − − К − − Т − Ъ − − − Г − − Л − У − Ь − − Д − М − − Ф − Ы − − − Е H − Х Э − Ж − О − − − Ц − − Ю − − З − − П − − Ч − − − Я − − *

9 слайд

Описание слайда:

Азбука Морзе 1 − − − − 9 − − − − 2 − − − 0 − − − − − 3 − − Точка 4 − Запятая − − − 5 / − − 6 ? − − 7 − − ! − − − − 8 − − − @ − − − *

10 слайд

Описание слайда:

Неравномерность кода − − − − − − Характерной особенностью азбуки Морзе является переменная длина кода разных букв, поэтому код Морзе называют неравномерным кодом. Буквы, которые встречаются в тексте чаще, имеют более короткий код, чем редкие буквы. Это сделано для того, чтобы сократить длину всего сообщения. Но из-за переменной длины кода букв возникает проблема отделения букв друг от друга в тексте. Поэтому для разделения приходится использовать паузу (пропуск). Следовательно, телеграфный алфавит Морзе является троичным, т.к. в нем используются три знака: точка, тире, пропуск. *

11 слайд

Описание слайда:

Первый беспроводной телеграф (радиоприемник) 7 мая 1895 года российский ученый Александр Степанович Попов на заседании Русского Физико-Химического Общества продемонстрировал прибор, названный им "грозоотметчик", который был предназначен для регистрации электромагнитных волн. Этот прибор считается первым в мире аппаратом беспроводной телеграфии, радиоприемником. В 1897 году при помощи аппаратов беспроводной телеграфии Попов осуществил прием и передачу сообщений между берегом и военным судном. В 1899 году Попов сконструировал модернизированный вариант приемника электромагнитных волн, где прием сигналов (азбукой Морзе) осуществлялся на головные телефоны оператора. В 1900 году благодаря радиостанциям, построенным на острове Гогланд и на российской военно-морской базе в Котке под руководством Попова, были успешно осуществлены аварийно-спасательные работы на борту военного корабля "Генерал-адмирал Апраксин", севшего на мель у острова Гогланд. В результате обмена сообщениями, переданным методом беспроводной телеграфии, экипажу российского ледокола Ермак была своевременно и точно передана информация о финских рыбаках, находящихся на оторванной льдине. *

12 слайд

Описание слайда:

Телеграфный аппарат Бодо Равномерный телеграфный код был изобретен французом Жаном Морисом Бодо в конце XIX века. В нем использовалось всего два разных вида сигналов. Не важно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала. Длина кода всех символов одинаковая и равна пяти. В таком случае не возникает проблемы отделения букв друг от друга: каждая пятерка сигналов - это знак текста. Поэтому пропуск не нужен. Код называется равномерным, если длина кода всех символов равна. Код Бодо - это первый в истории техники способ двоичного кодирования, информации. Благодаря этой идее удалось создать буквопечатающий телеграфный аппарат, имеющий вид пишущей машинки. Нажатие на клавишу с определенной буквой вырабатывает соответствующий пятиимпульсный сигнал, который передаетсяпо линии связи. В честь Бодо была названа единица скорости передачи информации - бод. В современных компьютерах для кодирования текста также применяется равномерный двоичный код. Telex Это интересно: Отель, не имеющий телекса, не может иметь рейтинг "пять звезд". *

Но голосом ведь всем её не донесёшь. Поэтому с давних времён был важен момент кодирования данных, чтобы они могли был прочитаны теми, для кого предназначалось. Постепенно также стало актуальным их шифрование. Необходимо было поместить в сообщение информацию, которая была понятна своим и не раскрыла смысла перед чужими. Обо всём этом мы и поговорим, выясняя, что такое кодирование и декодирование.

Разбираемся с терминологией

Без этого никак. Когда говорят о закодированном тексте, то это значит, что ему был сопоставлен другой набор символов. Это может быть использовано для увеличения надежности или же по той простой причине, что канал может использовать только ограниченное количество символом. Например, двоичный код, на котором работают современные компьютеры, построен на нулях и единицах.

Информация может быть закодирована в определённые символы и для того, чтобы её сохранить. В качестве примера можно привести результаты анализов, где содержатся показатели организма человека. Но наиболее популярным вопросом является такой: "Что такое кодирование и декодирование в информатике?" Искать ответ на него мы и будем.

О значении

Ранее процесс кодирования и декодирования информации играл вспомогательную роль и не рассматривался как отдельное направление математики. Но с появлением электронно-вычислительных машин ситуация существенно изменилась. Сейчас кодирование является центральным вопросом во время решения широкого спектра практических задач в программировании и поэтому пронизывает все информационные технологии. Так, с его помощью:

  1. Защищается информация от несанкционированного доступа.
  2. Обеспечивается помехоустойчивость при передаче по каналам связи данных.
  3. Представляется информация произвольной природы (графика, текст, числа) в памяти компьютера.
  4. Сжимается содержимое баз данных.

Об алфавите

Говоря о том, что такое кодирование и декодирование, сложно обойти вниманием основу всего этого. А именно, алфавит. Выделяют два вида - исходный и кодовый. В первом имеется начальная информация. Под кодовым подразумеваются изменённые данные, которые тем не менее могут при наличии ключа передать нам зашифрованное содержимое. В информатике для этого используется двоичный код, в основу которого положен алфавит, состоящий из нуля и единицы.

Давайте рассмотрим небольшой пример. Допустим, у нас есть два алфавита (А и Б), что состоят из конечного числа символов. Допустим, они выглядят следующим образом: А = {А0, А1, А2….А33}, Б = {Б0, Б1, Б3…Б34}. Элементы алфавита - это буквы. Тогда как их упорядоченный набор называется словом. У него есть определённая длина. Первая буква слова называется началом (префиксом), тогда как последняя - окончанием (постфиксом). Могут существовать различные правила построения конструкций. Например, одни системы кодирования информации требуют, чтобы был пропуск между словами, вторые обходятся без него. В целом алфавит необходим для построения универсальной системы отображения информации, её хранения, обработки и передачи. При этом предусматривается определённое соответствие между различными сигналами и элементами сообщений, которые в них зашифрованы.

Работа с данными

Когда информация преобразовывается в первоначальный вид, то происходящий при этом процесс называется декодирующим. Он должен выполняться по отношению к любым данным, что были зашифрованы. При этом используется так называемое обратное отображение (биекция). Давайте рассмотрим ситуацию с двоичной системой. У неё все кодовые слова обладают одинаковой длиной. Поэтому код называют равномерным (блочным). При этом кодирующей функцией выступает определённая подстановка. Можно взять в качестве примера вышеприведенную систему алфавита. Для обозначения определённых последовательностей используется множество элементарных кодов.

Допустим, что у нас есть А0 = {А, Б, В, Г} и Б0 = {1, 0}. Каким образом это можно представить компьютеру? А используя вот такую последовательность: А = 00, Б = 01, В = 10, Г = 11. Как видите, каждый символ имеет определённую кодировку. В компьютерную технику заносится справочная информация про алфавит кодирования, и она начинает ждать поступающих сигналов. Приходит нуль, за ним ещё один - ага, значит, это буква А. Если проводить параллели с набором слова в текстовом редакторе, то следует отметить, что будет передана не только одна буква, но и запущена соответствующая реакция на неё. Например, загорится определённая последовательность светодиодов монитора, где отображаются все введённые символы.

Специфика работы

Говоря про примеры кодирования и декодирования информации, следует отметить, что рассматриваемая система не является взаимно-однозначной. Например, букве А может соответствовать комбинация не только 00, но и 11, 10 или 01. Но при этом следует учитывать, что может быть только что-то одно. То есть за комбинацией закрепляется исключительно только определённый символ. Если схема кодирования подразумевает разделение любого слова на элементарные составляющие, то она называется разделимой. В случаях, когда одна буква не выступает в качестве начала другой, это префиксный подход. Это относится к вопросам программно-аппаратной составляющей. Определённое влияние на кодирование оказывает и архитектура, но из-за большого количества вариантов реализации рассматривать её довольно проблематично.

Побуквенное кодирование

Это наиболее простой подход. Если говорить про языки кодирования информации, то, пожалуй, это наиболее популярный вариант. В ограниченном варианте он был рассмотрен выше. Давайте узнаем, как выглядит код без разделителей. Допустим, у нас есть алфавит (исходный), в который помещены все русские буквы. Для кодирования используются десятичные цифры. Здесь А = 1, а Я = 33. Таким образом, последовательность букв АЯЯА можно передать как 133331. Если есть желание сделать алфавит равномерным, то необходимо внести определённые изменения. Так, для первых девяти букв придётся добавить по нулю. И рассмотренный нами пример АЯЯА превращается в 01333301.

Неравномерное кодирование

Рассмотренный ранее вариант считается удобным. Но в определённых случаях более умно сделать ставку на неравномерные коды. Это имеет смысл тогда, когда разные буквы в исходном тексте встречаются с различной частотой. Поэтому более частые символы имеет смысл кодировать короткими обозначениями, а редкие - длинными. Давайте построим бинарное дерево из букв русского алфавита. А на дополнение возьмём спецсимволы. Наиболее часто используются буквы, поэтому начинать мы будем с них: А - 0, Б - 1, В - 10, Г - 11 и так далее. И только после них уже будут использоваться знаки вопроса, процентов, двоеточия и прочие. Хотя, пожалуй, на первое место всё же следует поставить запятые и точки.

Об условии Фано

Теорема гласит, что любой код (префиксный и равномерный) допускает возможность однозначного кодирования. Допустим, что мы используем рассмотренный ранее пример с 01333301. Начинаем двигаться вправо. 0 ничего нам не даёт. А вот 01 позволяет идентифицировать букву А. Немного изменим начальный код и представим его как 01 333301. Далее выделяем первую Я, вторую и ещё одну А. В результате мы имеем 01 33 33 01. Хотя первоначально код был слитным, но сейчас мы можем с легкостью его декодировать, поскольку знаем, что в нём есть. А именно - А Я Я А. При этом заметьте, что он всегда расшифровывается однозначно, и никаких толкований в рамках принятой системы нет, благодаря чему можно обеспечить высокую достоверность передаваемой информации. Но как работают компьютеры?

Функционирование электронно-вычислительных машин

Кодирование и декодирование сигналов компьютерной техники базируется на использовании так называемых низких и высоких сигналов, которым в логическом измерении соответствуют нуль и единица. Что это значит? Допустим, у нас есть микроконтроллер. Если на один его вход поступает низкое напряжение в 1,5 В, то считается, что было передано значение логического нуля. Но если будет передано 5 В, то в соответствующую ячейку памяти будет записана единица. При этом необходимо добиться согласования источника информации с каналом связи. Вообще, при создании электроники необходимо учитывать большое количество различных моментов. Это и энергетические требования, и вид передаваемой информации (дискретная или непрерывная), и многое другое. При этом данные постоянно должны преобразовываться таким образом, чтобы они могли передаваться по каналам связи. Так, в случае с двоичной техникой сигналы представлены в виде напряжения, подаваемого на вход транзисторов или иных компонентов. Во время декодирования данные переводят сообщение в понятный для получателя вид.

Минимальная избыточность

На практике оказалось, что чрезвычайно важным является, чтобы код сообщения имел минимальную длину. Первоначально может показаться, какая разница - шесть, восемь или шестнадцать бит используется для кодирования? Но различия несущественны, если используется одно слово. А если миллиарды? Благо, можно подстроить алфавитное кодирование под все выдвигаемые требования. Но если про множество ничего неизвестно, то в таком случае сформулировать задачу оптимизации довольно трудно. Но на практике, как правило, всё же можно получить дополнительную информацию. Рассмотрим небольшой пример. Допустим, у нас есть сообщение, представленное на естественном языке. Но оно закодировано, и мы не можем прочитать его. Что нам поможет в задаче расшифровки? Как один из возможных вариантов - листок бумаги, на котором распределена вероятность появления букв. Благодаря этому построение оптимального кода в плане де/кодирования становится возможным с использованием точной математической формулировки и строгого решения.

Разбираем пример

Допустим, что у нас есть определённая разделимая схема алфавитного кодирования. Тогда все производные, что представляют собой упорядоченный набор, тоже будет иметь это свойство. При этом если длина элементарных кодов равна, то их перестановка не влияет на длину всего сообщения. Но если размер передаваемой информации напрямую зависит от того, какая последовательность букв, то, значит, были использованы составляющие различной протяженности. При этом, если есть конкретное сообщение и схема его кодирования, то можно подобрать такое решение задачи, когда его длина будет минимальной. Как этого достичь? Давайте рассмотрим подход с использованием алгоритма назначения элементарных кодов, позволяющего результативно подойти к решению задачи эффективности:

  1. Следует отсортировать буквы в порядке убывания количественного вхождения.
  2. Нужно разместить элементарные коды в порядке увеличения их длины.
  3. И как завершение, необходимо разместить составляющие в оптимальном порядке, чтобы наиболее частые символы занимали меньше всего места.

В целом система несложная. Если работать с небольшими объемами данных. Но с современными компьютерами такое реализовать довольно проблематично из-за значительного количества информации.

Заключение

Вот мы и рассмотрели, что такое система кодирования и декодирования информации, какой она может быть, что сейчас существует в информатике, а также множество иных вопросов. Но всё же следует понимать, что эта тема является чрезвычайно объемной, одной статьи для этого недостаточно. Как продолжение темы можно рассмотреть шифрование данных, криптографию, изменение отображения информации в различной электронике, уровни её обработки и множество других моментов. Но отрасль компьютерных наук по праву считается одной из самых сложных, поэтому изучить всё это быстро не получится. К тому же теоретические знания здесь ой как не равны практическим умениям. А именно последние и обеспечивают качественный результат.

А9 Тема : Кодирование и декодирование информации.

Что нужно знать :

· кодирование – это перевод информации с одного языка на другой (запись в другой системе символов,
в другом алфавите)

· обычно кодированием называют перевод информации с «человеческого» языка на формальный, например, в двоичный код, а декодированием – обратный переход

· один символ исходного сообщения может заменяться одним символом нового кода или несколькими символами, а может быть и наоборот – несколько символов исходного сообщения заменяются одним символом в новом коде (китайские иероглифы обозначают целые слова и понятия)

· кодирование может быть равномерное и неравномерное ;
при равномерном кодировании все символы кодируются кодами равной длины;
при неравномерном кодировании разные символы могут кодироваться кодами разной длины, это затрудняет декодирование

· закодированное сообщение можно однозначно декодировать с начала , если выполняется условие Фано : никакое кодовое слово не является началом другого кодового слова;

· закодированное сообщение можно однозначно декодировать с конца , если выполняется обратное условие Фано : никакое кодовое слово не является окончанием другого кодового слова;

· условие Фано – это достаточное, но не необходимое условие однозначного декодирования.

Пример задания

По каналу связи передаются сообщения, содержащие только 4 буквы: Е, Н, О, Т. Для кодирования букв Е, Н, О используются 5-битовые кодовые слова: Е - 00000, Н - 00111, О - 11011. Для этого набора кодовых слов выполнено такое свойство: любые два слова из набора отличаются не менее чем в трёх позициях. Это свойство важно для расшифровки сообщений при наличии помех. Какое из перечисленных ниже кодовых слов можно использовать для буквы Т, чтобы указанное свойство выполнялось для всех
четырёх кодовых слов?

1) 1100не подходит ни одно из указанных выше слов

Решение :

1) код, рассмотренный в условии задачи, относится к помехоустойчивым кодам, которые позволяют обнаружить и исправить определенное количество ошибок, вызванных помехами при передаче данных;

1) количество позиций, в которых отличаются два кодовых слова одинаковой длины, называется расстоянием Хэмминга

2) код, в котором расстояние Хэмминга между каждой парой кодовых слов равно d , позволяет обнаружить до d -1 ошибок; для исправления r ошибок требуется выполнение условия

d ≥ 2r + 1

поэтому код с d = 3 позволяет обнаружить одну или две ошибки, и исправить одну ошибку.

3) легко проверить, что для заданного кода (Е - 00000, Н - 00111, О - 11011) расстояние Хэмминга равно 3; в таблице выделены отличающиеся биты, их по три в парах Е-Н и Н-О и четыре
в паре Е-О:

Е – 00000 Е – 00000 Н – 00111

Н – 00111 О – 11011 О – 11011

4) теперь проверяем расстояние между известными кодами и вариантами ответа; для первого ответа 11111 получаем минимальное расстояние 1 (в паре О-Т), этот вариант не подходит:

Т - 11111 Т - 11111 Т - 11111

5) для второго ответа 11100 получаем минимальное расстояние 3 (в парах Е-Т и О-Т):

Е – 00000 Н – 00111 О – 11011

Т - 11100 Т - 11100 Т - 11100

6) для третьего ответа 00011 получаем минимальное расстояние 1 (в паре Н-Т) , этот вариант не подходит:

Е – 00000 Н – 00111 О – 11011

Т - 00011 Т - 00011 Т - 00011

7) таким образом, расстояние Хэмминга, равное 3, сохраняется только для ответа 2 Ответ: 2.

Ещё пример задания:

Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, используется неравномерный двоичный код, позволяющий однозначно декодировать полученную двоичную последовательность. Вот этот код: А–00, Б–010, В–011, Г–101, Д–111. Можно ли сократить для одной из букв длину кодового слова так, чтобы код по-прежнему можно было декодировать однозначно? Коды остальных букв меняться не должны. Выберите правильный вариант ответа.

1) для буквы Б –это невозможно

3) для буквы В –для буквы Г – 01

Решение (1 способ, проверка условий Фано) :

8) для однозначного декодирования достаточно, чтобы выполнялось условие Фано или обратное условие Фано;

9) проверяем последовательно варианты 1, 3 и 4; если ни один из них не подойдет, придется выбрать вариант 2 («это невозможно»);

10) проверяем вариант 1: А–00, Б–01, В–011, Г–101, Д–111.

« (код буквы Б совпадает с началом кода буквы В);

«обратное» условие Фано не выполняется (код буквы Б совпадает с окончанием кода буквы Г); поэтому этот вариант не подходит;

11) проверяем вариант 3: А–00, Б–010, В–01, Г–101, Д–111.

«прямое» условие Фано не выполняется (код буквы В совпадает с началом кода буквы Б);

«обратное» условие Фано не выполняется (код буквы В совпадает с окончанием кода буквы Г); поэтому этот вариант не подходит;

12) проверяем вариант 4: А–00, Б–010, В–011, Г–01, Д–111.

«прямое» условие Фано не выполняется (код буквы Г совпадает с началом кодов букв Б и В);
но «обратное» условие Фано выполняется (код буквы Г не совпадает с окончанием кодов остальных буквы); поэтому этот вариант подходит; правильный ответ – 4.

Пример задания: демо_12

Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, решили использовать неравномерный двоичный код, позволяющий однозначно декодировать двоичную последовательность, появляющуюся на приёмной стороне канала связи. Использовали код: А–1, Б–000, В–001, Г–011 .
Укажите, каким кодовым словом должна быть закодирована буква Д. Длина этого кодового слова должна быть наименьшей из всех возможных. Код должен удовлетворять свойству однозначного декодирования.

Решение :

13) заметим, что для известной части кода выполняется условие Фано – никакое кодовое слово не является началом другого кодового слова

14) если Д = 00, такая кодовая цепочка совпадает с началом Б = 000 и В = 001 000000: это может быть ДДД или ББ ; поэтому первый вариант не подходит

15) если Д = 01 , такая кодовая цепочка совпадает с началом Г = 011 , невозможно однозначно раскодировать цепочку 011: это может быть ДА или Г ; поэтому второй вариант тоже не подходит

16) если Д = 11 , условие Фано тоже нарушено: кодовое слово А = 1 совпадает с началом кода буквы Д, невозможно однозначно раскодировать цепочку 111: это может быть ДА или ААА ; третий вариант
не подходит

17) для четвертого варианта, Д = 010, условие Фано не нарушено; правильный ответ 4 .

Еще пример задания:

Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный по длине код: A=0, Б=10, В=110. Как нужно закодировать
букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

Решение (вариант 1, метод подбора) :

1) рассмотрим все варианты в порядке увеличения длины кода буквы Г

2) начнем с Г=1; при этом получается, что сообщение «10» может быть раскодировано двояко:
как ГА или Б, поэтому этот вариант не подходит

3) следующий по длине вариант Г=11 ; в этом случае сообщение «110» может быть раскодировано
как ГА или В, поэтому этот вариант тоже не подходит 4)третий вариант, Г=111 , дает однозначное раскодирование во всех сочетаниях букв, поэтому… ответ – 3.

Еще пример задания:

Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные двоичные числа (от 00 до 11, соответственно). Если таким способом закодировать последовательность символов БАВГ и записать результат шестнадцатеричным кодом, то получится

Решение :

18) из условия коды букв такие: A – 00, Б –01, В – 10 и Г – 11, код равномерный

19) последовательность БАВГ кодируется так:= 1001011

20) разобьем такую запись на тетрады справа налево и каждую тетраду переведем в шестнадцатеричную систему (то есть, сначала в десятичную, а потом заменим все числа от 10 до 15 на буквы A, B, C, D, E, F); получаем 1001011 = 0 = 4B16 Правильный ответ – 1.

Еще пример задания:

Черно-белое растровое изображение кодируется построчно, начиная с левого верхнего угла и заканчивая в правом нижнем углу. При кодировании 1 обозначает черный цвет, а 0 – белый.

Для компактности результат записали в шестнадцатеричной системе счисления. Выберите правильную запись кода.

1) BD9AA5 2) BDA9B5 3) BDA9D5 4) DB9DAB

Решение :

1) «вытянем» растровое изображение в цепочку: сначала первая (верхняя) строка, потом – вторая, и т. д.:

1 строка

2 строка

3 строка

4 строка

2) в этой полоске 24 ячейки, черные заполним единицами, а белые – нулями:

1

1

1

1

1

1

1

1

1

1

1 строка

2 строка

3 строка

4 строка

3) поскольку каждая цифра в шестнадцатеричной системе раскладывается ровно в 4 двоичных цифры, разобьем полоску на тетрады – группы из четырех ячеек (в данном случае все равно, откуда начинать разбивку, поскольку в полоске целое число тетрад – 6):

1

1

1

1

1

1

1

1

1

1

4) переводя тетрады в шестнадцатеричную систему, получаем последовательно цифры B (11), D(13), A(10), 9, D(13) и 5, то есть, цепочку BDA9 D5 Правильный ответ – 3.

Еще пример задания:

Для передачи чисел по каналу с помехами используется код проверки четности. Каждая его цифра записывается в двоичном представлении, с добавлением ведущих нулей до длины 4, и к получившейся последовательности дописывается сумма её элементов по модулю 2 (например, если передаём 23 , то получим последовательность 0010 1 00110 ). Определите, какое число передавалось по каналу в виде 0100011 ?

Решение :

1) сначала разберемся, как закодированы числа в примере; очевидно, что используется код равномерной длины; поскольку 2 знака кодируются 10 двоичными разрядами (битами), на каждую цифру отводится 5 бит, то есть 2 → 00101 и 3 → 00110

2) как следует из условия, четыре первых бита в каждой последовательности – это двоичный код цифры, а пятый бит (бит четности) используется для проверки и рассчитывается как «сумма по модулю два», то есть остаток от деления суммы битов на 2; тогда

2 = 00102, бит четности (0 + 0 + 1 + 0) mod 2 = 1

3 = 00112, бит четности (0 + 0 + 1 + 1) mod 2 = 0

3) но бит четности нам совсем не нужен , важно другое: пятый бит в каждой пятерке можно отбросить !

4) разобъем заданную последовательность на группы по 5 бит в каждой:

01010, 10010, 01111, 00011.

5) отбросим пятый (последний) бит в каждой группе: 0101, 1001, 0111, 0001.
это и есть двоичные коды передаваемых чисел: 01012 = 5, 10012 = 9, 01112 = 7, 00012 = 1.

6) таким образом, были переданы числа 5, 9, 7, 1 или число 5971.

7) Ответ: 2.

А9 Задачи для тренировки.

№ 69 – 71

69) По каналу связи передаются сообщения, содержащие только 4 буквы: А, Б, В, Г. Для кодирования букв А, Б, В используются 5-битовые кодовые слова: А - 10000, Б - 00101, В - 01010. Для этого набора кодовых слов выполнено такое свойство: любые два слова из набора отличаются не менее чем в трёх позициях. Это свойство важно для расшифровки сообщений при наличии помех. Какое из перечисленных ниже кодовых слов можно использовать для буквы Г, чтобы указанное свойство выполнялось для всех четырёх кодовых слов?

1) 0110не подходит ни одно из указанных выше слов

70) (http://ege. *****) Для передачи помехоустойчивых сообщений в алфавите, который содержит 16 различных символов, используется равномерный двоичный код. Этот код удовлетворяет следующему свойству: в любом кодовом слове содержится четное количество единиц (возможно, ни одной). Какую наименьшую длину может иметь кодовое слово?

71) По каналу связи передаются сообщения, содержащие только 5 букв А, И, К, О, Т. Для кодирования букв используется неравномерный двоичный код с такими кодовыми словами:

А-0, И-00, К-10, О-110, Т-111.

Среди приведённых ниже слов укажите такое, код которого можно декодировать только одним способом. Если таких слов несколько, укажите первое по алфавиту.

1) КАА 2) ИКОТА 3) КОТ 4) ни одно из сообщений не подходит

1. Для кодирования букв А, Б, В, Г решили использовать двухразрядные последовательные двоичные числа (от 00 до 11 соответственно). Если таким способом закодировать последовательность символов ГБВА и записать результат шестнадцатеричным кодом, то получится:

1) 13DBCA16 3) D

2. Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв - из двух
бит, для некоторых - из трех). Эти коды представлены в таблице:

Определите, какой набор букв закодирован двоичной строкой

1) baade 2) badde 3) bacde 4) bacdb

3. Для кодирования сообщения, состоящего только из букв A, B, C, D и E, используется
неравномерный по длине двоичный код:

Какое (только одно!) из четырех полученных сообщений было передано без ошибок
и может быть раскодировано:

4. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный по длине код: A=0, Б=100, В=101. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

5. Черно-белое растровое изображение кодируется построчно, начиная с левого верхнего угла и заканчивая в правом нижнем углу. При кодировании 1 обозначает черный цвет, а 0 – белый.

Для компактности результат записали в восьмеричной системе счисления. Выберите правильную запись кода.1412

6. Для передачи чисел по каналу с помехами используется код проверки четности. Каждая его цифра записывается в двоичном представлении, с добавлением ведущих нулей до длины 4, и к получившейся последовательности дописывается сумма её элементов по модулю 2 (например, если передаём 23, то получим последовательность). Определите, какое число передавалось по каналу в виде?

7. Для кодирования букв О, Ч, Б, А, К используются двоичные коды чисел 0, 1, 2, 3 и 4 соответственно (с сохранением одного незначащего нуля в случае одноразрядного представления). Если таким способом закодировать последовательность символов
КАБАЧОК и записать результат в шестнадцатеричном коде, то получится:

1) 5434DA4 3) ABCD

8. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный по длине код: A=01, Б=1, В=001. Как нужно закодировать
букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

9. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный по длине код: A=0, Б=100, В=110. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

Использование электронно-вычислительной техники, предназначенной для обработки данных, является достаточно важным этапом в ходе совершенствования систем управления и планирования. Однако этот способ сбора и обработки информации имеет некоторые отличия от привычного.


Таким образом, необходимо совершить преобразования в систему символов, которые распознаются компьютером.

Что представляет собой кодирование информации?

Кодирование данных является обязательным этапом в ходе сбора и обработки данных. Обычно под кодом понимают комбинацию знаков, соответствующую передаваемой информации или некоторым их качественным характеристикам. Кодирование является процессом составления зашифрованной комбинации в форме списка сокращений или специальных символов, полностью передающих изначальный смысл послания. В некоторых случаях кодирование представляет собой шифрование, однако необходимо понимать, что последняя процедура предусматривает защиту информации от возможного взлома, а также прочтения третьими лицами.

Целью кодирования является представление данных в удобном и лаконичном формате, что предполагает упрощение их передачи и обработки на вычислительной технике. Компьютеры способны оперировать только информацией конкретной формы. Таким образом, необходимо принимать это во внимание, чтобы избежать проблем. Принципиальная схема обработки информации состоит из поиска, сортировки и упорядочивании. Что касается кодирования, в ней оно встречается в процессе ввода данных в виде кода.

Что представляет собой декодирование информации?

У пользователей персональных компьютеров могут возникнуть вопросы на счет того, что означает кодирование и декодирование. Причины этого могут быть самые различные, однако в любом случае необходимо ознакомить юзера с такой информацией, которая способна помочь с успехом продвигаться дальше в потоке информационных технологий. Как можно понять, после обработки данных образуется выходной код. В случае расшифровки фрагмента получается исходная информация. Другими словами, декодирование представляет собой процесс, который является обратным шифрованию.

В процессе кодирования информация приобретает вид символьных сигналов, полностью соответствующих передаваемому объекту, а при декодировании из кода извлекается передаваемые данные или некоторые их характеристики. Пользователей, которые получают закодированные сообщения, может быть несколько, однако важным является то, чтобы сведения попали именно к адресату и не были раскрыты третьими лицами. Таким образом, стоит ознакомиться с процессом кодирования и декодирования данных. Они позволяют обмениваться конфиденциальной информацией между группой собеседников.

Кодирование и декодирование текстовых данных

Если нажать на клавишу клавиатуры, компьютер получает сигнал, представленный двоичным числом, расшифровку которого легко отыскать в кодовой таблице. Мировым стандартом считается таблица ASCII. Правда, знать, что такое кодирование и декодирование, мало. Необходимо также понимать, как размещаются данные в компьютере. Например, для хранения одного символа двоичного кода выделен 1 байт или 8 бит. Данная ячейка способна принимать лишь два значения: 0 и 1. Таким образом, выходит, что один байт дает возможность зашифровать 256 различных символов, поскольку это число комбинаций существует возможность составить.

Данные сочетания и выступают в качестве ключевой части таблицы ASCII. Например, буква S кодируется в виде 01010011. Если совершить ее нажатие на клавиатуре, выполняется кодирование и декодирование данных, а пользователь получает требуемый результат, который отображается на экране. Половина таблицы стандартов ASCII имеет коды цифр, управляющих символов, а также латинских букв. Остальная ее часть заполняется следующим:

Национальными знаками;
псевдографическими знаками и символами, не имеющими отношения к математике.

Таким образом, становится понятным, что в разных странах данная часть таблицы будет различной. Цифры при вводе преобразовываются в двоичную систему вычисления в соответствии со стандартной сводкой.

Кодирование чисел

Компьютеры активно применяют двоичную систему счисления, где наблюдается только две цифры − 0 и 1. Изучение действий с полученными числами двоичной системы принадлежит двоичной арифметике. Многие законы основных математических действий для подобных цифр остаются актуальными.

Примеры кодирования и декодирования чисел

Стоит ознакомиться с двумя способами кодировки числа 45. Когда данная цифра встречается в текстовом фрагменте, каждая ее составляющая закодирована в соответствии с таблицей стандартов ASCII, 8 битами. Таким образом, четверка обратится в 01000011, а пятерка превратится в 01010011. Когда число 45 задействовано для вычислений, используется специальная методика преобразования в восьмиразрядный двоичный код 001011012. Для его хранения требуется всего 1 байт.

Кодирование графической информации

При увеличения монохромного изображения при помощи лупы можно увидеть, что оно включает в себя множество мелких точек, которые формируют полноценный узор. Персональные свойства каждой картинки, а также линейных координатах любой точки существует возможность отобразить в числовой форме. В этом состоит причина того, что растровое кодирование основано на двоичном коде, который приспособлен для отображения графических данных. Черно-белые изображения представлены в виде комбинации точек, имеющей различные оттенки серого цвета. Другими словами, яркость любой точки картинки определяется восьмиразрядными двоичными числами. Разложение произвольного градиента на базовые составляющие является основой кодирования графической информации.

Декодирование изображений осуществляется аналогичным способом, однако в обратном направлении. При разложении задействовано три основных цвета:

Зеленый;
красный;
синий.

Почему именно эти цвета?

Все дело в том, что существует возможность получить любой естественный оттенок путем комбинации данных градиентов. Эта система кодирования называется RGB. Если использовать двадцать четыре двоичных разрядов, чтобы зашифровать графическое изображение, режим преобразования имеет название полноцветного. Основные цвета сравниваются с оттенками, дополняющими базовую точку, преобразовывая ее в белый цвет. Дополнительным цветом является градиент, который образован суммой других основных тонов.

При этом стоит отметить желтый, пурпурный, а также голубой дополнительные цвета. Такой способ кодирования точек картинок используется и в полиграфической отрасли. Правда, в данном случае необходимо использовать четвертый цвет, который является черным. В этом и состоит причина того, что полиграфическая система преобразования обозначается аббревиатурой CMYK. Данная система для представления картинок применяет целых тридцать два двоичных разряда. Методы кодирования, а также декодирования данных предусматривают использование разных технологий.

Это зависит от типа вводимой информации. Допустим, способ шифрования графических изображений при помощи шестнадцатиразрядных двоичных кодов носит название High Color. Такая технология позволяет передавать двести пятьдесят шесть оттенков. При уменьшении числа используемых двоичных разрядов, которые применяются для шифрования точек графического изображения, автоматически уменьшается объем, требуемый для временного хранения данных. Представленный вариант кодирования информации называется индексным.

Кодирование звуковой информации

После того как стало понятно, что собой представляет кодирование и декодирование, а также то, какие способы лежат в основе данного процесса, необходимо подробнее рассмотреть кодирование звуковых данных. Такую информацию можно отобразить в виде элементарных единиц, а также пауз между каждой их парой. Таким образом, сигнал преобразовывается и хранится в этом виде в памяти компьютера. Звуки выводятся при помощи синтезатора речи, используемого зашифрованные комбинации, которые хранятся в памяти персонального компьютера. Человеческую речь намного тяжелее закодировать, поскольку она имеет отличия в многообразии оттенков, поэтому компьютеру нужно сравнивать каждое словосочетание со стандартом, занесенным в его память. Чтобы распознавание прошло успешно, сказанное слово должно присутствовать в словаре.

Кодирование данных в двоичном коде

Стоит отметить, что имеются разные способы реализации кодирования числовой, текстовой, а также графической информации. Как правило, декодирование данных осуществляется по обратной технологии. При выполнении кодирования чисел принимается во внимание цель, с которой цифра введена в систему. Она может состоять в арифметических вычислениях или простом выводе. Информация, кодируемая в двоичной системе, зашифровывается при помощи единиц и ноликов. Данные знаки называются битами.

Такой вариант кодировки считается самым известным, поскольку его легче организовать с точки зрения технологии. Итак, присутствие сигнала обозначается единицей, отсутствие − нулем. Двоичное шифрования имеет только один недостаток, который состоит в длине комбинаций из символов. Однако в технологическом плане легче орудовать множеством простых, однотипных компонентов, чем небольшим количеством сложных.

Плюсы двоичного кодирования

Эта форма является подходящей для различных видов информации. В процессе передачи данных ошибок не возникает. Персональному компьютеру существенно легче обрабатывать данные, которые закодированы при использовании данного варианта. Необходимы устройства с двумя состояниями.

Минусы двоичного кодирования

Коды имеют большую длину, что способствует замедлению их обработки. К недостаткам двоичного кодирования также стоит отнести сложность восприятия таких комбинаций пользователю, не имеющему специального образования или подготовки.

Сегодняшняя статья помогает узнать, что представляет собой кодирование и декодирование, а также предоставлена информация, для чего их используют. Предложенные способы преобразования данных целиком зависят от вида информации. В качестве нее может выступать не только текст, а также числа, картинки и звук. Кодирование разной информации дает возможность унифицировать форму ее представления. В электронно-вычислительных устройствах зачастую применяются принципы стандартного двоичного кодирования, преобразовывающие исходную форму представления данных в более удобный формат для хранения и обработки.

Программы и игры