Как сделать кодировочную таблицу

Обновлено: 05.07.2024

Кодирование текстовой информации

Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества - письменность и арифметика - есть не что иное, как система кодирования речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.

Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Начиная с конца 60-х годов, компьютеры все больше стали использоваться для обработки текстовой информации, и в настоящее время основная доля персональных компьютеров в мире (и большая часть времени) занята обработкой именно текстовой информации. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).

Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц - машинным языком.

С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "(", "&" и т.п. и даже (обратите особое внимание!) пробелы между словами.


Т радиционно для кодирования одного символа используется количество информации, равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события): К = 2 I = 2 8 = 256, т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.

Такое количество символов вполне достаточно для пред­ставления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры, знаки, графические символы и пр.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.

Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.

В процессе вывода символа на экран компьютера произ­водится обратный процесс — декодирование, то есть преоб­разование кода символа в его изображение. Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой табли­це.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу. Понятно, что это дело условное, можно придумать множество способов кодировки.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.

Виды таблиц кодировок

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки.

В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange - Американский стандартный код для информационного обмена), кодирующая первую половину символов с числовыми кодами от 0 до 127 ( коды от 0 до 32 отведены не символам, а функциональным клавишам).

Таблица кодов ASCII делится на две части.

Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).

Структура таблицы кодировки ASCII

Порядковый номер

Символы с номерами от 0 до 31 принято называть управляющими.

Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.

Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.

Символ 32 - пробел, т.е. пустая позиция в тексте.

Все остальные отражаются определенными знаками.

Альтернативная часть таблицы (русская).

Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.

Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.


Обращается внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.

Для букв русского алфавита также соблюдается принцип последовательного кодирования.



От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 ("CP" означает "Code Page", "кодовая страница").


Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.


Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.


Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251. Введена компанией Microsoft; с учетом широкого распространения операционных систем (ОС) и других программных продуктов этой компании в Российской Федерации она нашла широкое распространение.


С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode.


Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Внутреннее представление слов в памяти компьютера

с помощью таблицы ASCII

Иногда бывает так, что текст, состоящий из букв русского алфавита, полученный с другого компьютера, невозможно прочитать - на экране монитора видна какая-то "абракадабра". Это происходит оттого, что на компьютерах применяется разная кодировка символов русского языка.


Таким образом, каждая кодировка задается своей собственной кодовой таблицей. Как видно из таблицы, одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы.

К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в приложения.

Для того чтобы полученные данные можно было обработать, прежде всего следует создать кодировочную таблицу. Кодировочная таблица устанавливает соответствие между отдельными вопросам анкеты и переменными. используемыми при компьютерной обработке данных. Например, пункту анкеты "Пол" может быть поставлена в соответствие переменная sex.

Переменные — это ячейки памяти, в которые можно записывать значения, введенные с клавиатуры. Мы выбрали для переменной имя sex, так как имена переменных в SPSS для Windows могут содержать до восьми символов. Другое, более подробное имя было бы слишком длинным. Имена переменных могут состоять из букв латинского алфавита, цифр и специальных символов; причем первым символом имени должна быть буква.

Переменные могут принимать различные значения. Переменная sex может иметь два возможных значения: "женский" и "мужской". Кодировочная таблица определяет кодовые числа, соответствующие отдельным значениям переменных; например, значению "женский" может соответствовать цифра "1", а значению "мужской" — "2".

Подитожим задачи, которые решаются при составлении кодировочной таблицы:

Для нашей анкеты мы можем составить следующую кодировочную таблицу. Она приводится в самой анкете.


На уроке учащиеся знакомятся со способами кодирования текстовой информации, узнают о способах представления текстовой информации в памяти компьютера, получают навыки кодирования и декодирования текстовой информации с использованием кодировочных таблиц.

Описание разработки

Цель урока: формирование понятий о способах представления и организации текстов в компьютерной памяти.

Задачи:

- обучающие: Знакомство со способами кодирования текстовой информации

- развивающие: развитие логического мышления учащихся, познавательного интереса, формирование информационной культуры и потребности в приобретении знаний.

- воспитательные: воспитание стремления быть прилежным и добиваться успеха, ответственности, самостоятельности.

Тип урока: Введение нового материала

Формы работы учащихся фронтальная, индивидуальная

Необходимое техническое оборудование: 7 компьютеров, мультимедиа проектор, интерактивная доска, раздаточный материал – 7 шт.

Используемые технологии: ИКТ, проблемно – ориентированные

Используемые методы: словесные, наглядно - иллюстративные

Структура и ход урока

  1. Мотивация.
  1. Здравствуйте, ребята! Я рада вас видеть всех на уроке. Посмотрели друг на друга, улыбнулись и сели. Все ли присутствуют на уроке? Хорошо.
  2. Давайте вспомним правила техники безопасности в компьютерном классе и правила работы на ПК.

Какие правила техники безопасности необходимо соблюдать в компьютерном классе?

К чему может привести нарушение правил техники безопасности?

Как правильно организовать свое рабочее место за компьютером?

К чему может привести неправильная организация рабочего места? Может ли компьютер оказать негативное влияние на здоровье пользователя?

Каковы цели нашего урока?

  1. Понять, как кодируются символы в памяти компьютера.
  2. Осознать, что существуют различные кодировки русских букв.
  3. Научиться определять коды символов в разных кодировках.
  1. Введение нового материала.

- Сегодня нет ни одного предприятия, ни одного учреждения, где бы ни применялся компьютер. Одним из самых массовых приложений компьютера является работа с тестовой информацией. Но компьютеры не с самого рождения могли обрабатывать символьную информацию. Лишь с конца 60 - х годов они стали использоваться для обработки текстов и в настоящее время большинство пользователей ПК занимаются вводом, редактированием и форматированием текстовой информации. Давайте рассмотрим недостатки и преимущества бумажных и компьютерных технологий.

Способы обработки и хранения текстов

Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов. 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.

Вспомним формулу, связывающую информационный вес символа алфавита и мощность алфавита: N= 2 i

- Посчитайте, чему равен информационный вес одного символа такого алфавита? (8 бит или 1 байт)

- В каком виде представлена информация в памяти компьютера? (В двоичном виде 0 или 1)

- Текст – это информация? (Да)

- Как текст представляется в памяти компьютера?

Ресурс 2. Тексты в памяти компьютера.

А давайте рассмотрим свойства компьютерных документов.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки. (определение записать в тетрадь)

Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена). На практике можно встретиться и с другой таблицей – КОИ - 8 (Код обмена информацией), которая используется в глобальных компьютерных сетях.

Рассмотрим таблицу кодов ASCII

Ресурс №4. Кодирование текста. Таблица кодировки.

Международным стандартом является лишь первая половина таблицы, т. е. символы с номерами от 0 (00000000), до 127 (01111111). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.

Символы с номерами от 0 до 31 принято называть управляющими. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т. п.

Символ 32 - пробел, т. е. пустая позиция в тексте. Все остальные отражаются определенными знаками.

Соблюдение лексикографического порядка в расположении символов (буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений) называется принципом последовательного кодирования алфавита.

Запись определения в тетрадь.

Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.

Давайте немного отдохнём.

Упражнения для рук и плечевого пояса:

  1. Поднять плечи, опустить плечи. Повторить 6 – 8 раз. Расслабить плечи.
  2. Руки согнуть перед грудью. На счет 1 – 2 – пружинящие рывки назад согнутыми руками, на счет 3 – 4 – то же, но прямыми. Повторить 4 – 6 раз. Расслабить плечи.

Упражнения для туловища и ног:

  1. На счет 1 - 2 - шаг влево, руки к плечам, прогнуться. На счет 3 – 4 – то же, но в другую сторону. Повторить 3 - 4 раза.
  2. Ноги врозь, руки за голову. На счет 1 – резкий поворот налево, на счет 2 – направо. Повторить 3 - 4 раза.

Гимнастика для глаз:

  1. Сядьте на стул, закройте глаза, расслабьте мышцы лица, свободно, без напряжения откиньтесь на спинку стула, положите руки на бедра (10 – 15 секунд).
  2. Откройте глаза и посмотрите вдаль перед собой (2 – 3 секунды). Переведите взгляд на кончик НОСА (3 – 5 секунд). Повторите 2 раза.
  1. Закрепление изученного материала.

Работа с учебником.

№1 Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты:

  1. Password;
  2. Windows;
  3. Информация;
  4. Paint.

№2 Декодируйте с помощью кодировочной таблицы ASCII следующие тексты, заданные шестнадцатеричным кодом:

  1. 54 6F 72 6E 61 64 6F; (Tornado)
  2. 49 20 6С 6F 76 65 20 79 6F 75; (I love you)
  3. 32 2A 78 2B 79 3D 30. (2+x+y=0)
  1. Не используем кодировочные таблицы
  1. file; 2) help?
  1. А теперь выполните практическую работу на компьютере. Будь внимательны.

- Что мы с вами узнали на уроке?

- Как кодируются символы в памяти компьютера?

- Из - за чего часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую?

- Сколько существует различных кодировок русских букв?

- Как можно определять коды символов в разных кодировках?

- Достигнута ли цель урока?

- Каковы результаты деятельности класса, собственные результаты?

- Что необходимо сделать в дальнейшем?

- Выставление оценок за урок.

§ 13, карточки д/з № 10 ресурс №6.

Ознакомьтесь с домашним заданием. Все ли всем понятно? Есть вопросы? Спасибо за урок. До свидания.


-75%

Коммуникативный педагогический тренинг: способы взаимодействия с разными категориями учащихся

Сертификат и скидка на обучение каждому участнику

Афанасьева Мария

Тема урока: Представление текста в памяти компьютера. Кодировочные таблицы

Описание презентации по отдельным слайдам:

Тема урока: Представление текста в памяти компьютера. Кодировочные таблицы

Тема урока: Представление текста в памяти компьютера. Кодировочные таблицы

Цель урока: Знакомство обучающихся со способами представления и организации т.

Цель урока: Знакомство обучающихся со способами представления и организации текстов в компьютерной памяти. Задачи урока: Обучающая: Знакомство со способами кодирования текстовой информации; Знакомство с возможностями использования компьютера для работы с кодированием текста. Развивающая: развитие логического мышления учащихся, памяти и мышления; развитие познавательного интереса; формирование информационной культуры и потребности в приобретении знаний. Воспитательная: развитие умения рационально организовывать свою работу, воспитание умения строить диалог.

ОСНОВНАЯ ОБЛАСТЬ ПРИМЕНЕНИЯ КОМПЬЮТЕРОВ – РАБОТА С ТЕКСТАМИ При ручной записи.

ОСНОВНАЯ ОБЛАСТЬ ПРИМЕНЕНИЯ КОМПЬЮТЕРОВ – РАБОТА С ТЕКСТАМИ При ручной записи часто возникает необходимость исправлять ошибки или вносить какие-то изменения в текст приходится зачеркивать, стирать, заклеивать портится внешний вид текста возникает необходимость переписывать текст ведет к потере времени и лишнему расходу бумаги

С помощью компьютера, можно создавать тексты, не тратя на это лишнее время и.

С помощью компьютера, можно создавать тексты, не тратя на это лишнее время и бумагу. Носитель текста - память компьютера. Для длительного хранения необходима внешняя память. Текст на внешних носителях сохраняется в виде файла. Что такое ФАЙЛ Файл – это… поименованная область внешней памяти

ПРЕИМУЩЕСТВА СОХРАНЕНИЯ ТЕКСТОВ В КОМПЬЮТЕРНОЙ ПАМЯТИ В ФАЙЛОВОЙ ФОРМЕ: компа.

ПРЕИМУЩЕСТВА СОХРАНЕНИЯ ТЕКСТОВ В КОМПЬЮТЕРНОЙ ПАМЯТИ В ФАЙЛОВОЙ ФОРМЕ: компактное размещение (на компакт-диске объемом 700 Мбайт можно разместить тексты более сотни книг в 500 страниц каждая) если данный текст становится ненужным, то можно стереть этот файл и на его место записать новый файл всегда можно скопировать в любом количестве на другие носители - файл можно быстро переслать другому человеку по электронной почте

Главное неудобство хранения текстов в компьютерной памяти: прочитать их можно.

Главное неудобство хранения текстов в компьютерной памяти: прочитать их можно только на экране монитора или другого электронного носителя или распечатав на принтере.

Текст состоит из символов: букв – A S e v Б Д и у цифр – 0 1 2 3 знаков препи.

Текст состоит из символов: букв – A S e v Б Д и у цифр – 0 1 2 3 знаков препинания - , ! ? : спецсимволов - + = ( % * пробела Все символы компьютер различает по их двоичному коду.

Множество символов, с помощью которых записывается текст, называется алфавит.

Множество символов, с помощью которых записывается текст, называется алфавит, а число символов – мощностью алфавита. N=2i

Соответствие между изображениями символов и кодами символов устанавливается с.

Соответствие между изображениями символов и кодами символов устанавливается с помощью кодировочных таблиц. Для разных компьютеров и операционных систем используются разные таблицы кодировки.

МЕЖДУНАРОДНЫМ СТАНДАРТОМ СТАЛА ТАБЛИЦА КОДИРОВКИ ASCII American Standart Code.

МЕЖДУНАРОДНЫМ СТАНДАРТОМ СТАЛА ТАБЛИЦА КОДИРОВКИ ASCII American Standart Code for Information Interchange (Американский стандартный код для информационного обмена). ASCII – восьмибитовая или однобайтовая кодировка, 1 символ весит 8 бит или 1 байт

В таблицах кодировки указаны ……. символов. 256 N=2i, где N – количество симво.

В таблицах кодировки указаны ……. символов. 256 N=2i, где N – количество символов в алфавите, i – информационный вес символа. 256=2i 256=28 вес 1 символа – 8 бит или 8 разрядов

Таблица кодировки ASCII Стандартной в этой таблице является только первая пол.

Таблица кодировки ASCII Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (01111111). 0 – 32 - управляющие символы 33 – 127 – латинские буквы, знаки препинания, цифры, знаки арифметических операций 128 – 255 – буквы национального алфавита ASCII

Таблица стандартной части ASCII

Таблица стандартной части ASCII


Задание 1. Кодирование слова file, с помощью кодировочной таблицы ASCII (в дв.

Задание 1. Кодирование слова file, с помощью кодировочной таблицы ASCII (в двоичном коде). 01101001 01101100 01100101 01100110 f i l e file

Кодировка Unicode 1 символ – 16 бит или 2 байта 216 = 65536 символов Шестнадц.

Кодировка Unicode 1 символ – 16 бит или 2 байта 216 = 65536 символов Шестнадцатиразрядная кодировка Unicode сайт: задание 4, 5

ЗАДАНИЯ Задача 1. Сколько байт памяти компьютера занимает слово МИКРОПРОЦЕССО.

ЗАДАНИЯ Задача 1. Сколько байт памяти компьютера занимает слово МИКРОПРОЦЕССОР? Задача 2. Закодируйте с помощью кодировочной таблицы ASCII следующие тексты: Windows; Байт Задача 3. С помощью последовательности десятичных кодов: 225 232 242 зашифровано слово. Используя таблицу кодировки, расшифруйте слово. Найдите последовательность десятичных кодов этого же слова, записанного заглавными буквами.

Задача 4. С помощью последовательности десятичных кодов: 225 232 242 зашифров.

Задача 4. С помощью последовательности десятичных кодов: 225 232 242 зашифровано слово. Используя таблицу кодировки, расшифруйте слово. Найдите последовательность десятичных кодов этого же слова, записанного заглавными буквами. Задача 5. Что зашифровано последовательностью десятичных кодов: 108 105 110 107? Задача 6. Что зашифровано последовательностью десятичных кодов: 108 105 110 107?

Задача 7. Какой объём памяти займёт приведённый ниже текст, если известно, чт.

Задача 7. Какой объём памяти займёт приведённый ниже текст, если известно, что в нём используется кодировочная таблица ASCII? Happy New Year, dear friends!! Ответ: 30 знаков х 8 бит = 240 бит = 30 байт Задача 8. Сколько символов содержится в тексте, использующем таблицу ASCII, если известно, что он занимает 24 576 бит памяти? Ответ: 24 576 бит : 8 бит = 3 072 знака

Задача 9. Текст занимает 1,25 Кбайт памяти компьютер. Сколько символов содерж.

Задача 9. Текст занимает 1,25 Кбайт памяти компьютер. Сколько символов содержит этот текст? Ответ: 1,25 Кбайт = 1,25х1024 = 1 208 байт. 1 символ компьютерного алфавита равен 1 байту, следовательно текст содержит 1 208 символов Задача 10. Текст занимает 5 полных страниц. На каждой странице размещается 20 строк по 70 символов в строке. Какой объем оперативной памяти займет этот текст? Ответ: 5 страниц х 20 строк х 70 символов = 7 000 байт

ЗАКРЕПЛЕНИЕ Как кодируются символы в памяти компьютера? Зачем нужны кодировоч.

ЗАКРЕПЛЕНИЕ Как кодируются символы в памяти компьютера? Зачем нужны кодировочные таблицы? Из-за чего часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую? Сколько существует различных кодировок русских букв? Как можно определять коды символов в разных кодировках?

Читайте также: