«Оценка количественных параметров текстовых документов»
Читать

«Оценка количественных параметров текстовых документов»

Cкачать презентацию: «Оценка количественных параметров текстовых документов»

    Ничего не найдено.
Click here to cancel reply.

Презентация по слайдам:


Слайд #1

Тема урока:
«Оценка
количественных
параметров
текстовых документов»

Слайд #2

Ключевые слова
кодовая таблица
восьмиразрядный двоичный код
информационный объём текста

Слайд #3

Цели урока:
Познакомиться с кодовыми таблицами
Научиться находить информационный объем текста
Научиться оценивать количественные параметры текстовых документов

Слайд #4

Представление текстовой информации
в памяти компьютера
Текст состоит из символов - букв, цифр, знаков препинания и т. д., которые компьютер различает по их двоичному коду.

Слайд #5

N=2i
Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.
28=256

Слайд #6

Кодовая таблица
0 – 32 - управляющие символы
33 – 127 – латинские буквы, знаки препинания, цифры, знаки арифметических операций
128 – 256 – буквы национального
алфавита
ASCII

Слайд #7

Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.
Фрагмент кодовой таблицы ASCII

Слайд #8

Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.
Коды русских букв в разных кодировках

Слайд #9

Стандарт кодирования символов Unicode позволяет пользоваться более чем двумя языками.
В Unicode каждый символ кодируется шестнадцатиразрядным двоичным кодом. Такое количество разрядов позволяет закодировать 65 536 различных символов:
216 = 65 536.

Слайд #10

Информационный объём фрагмента текста
I = K x i
I - информационный объём сообщения
K – количество символов
i – информационный вес символа
В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:
8 битов (1 байт) - восьмиразрядная кодировка;
16 битов (2 байта) - шестнадцатиразрядная кодировка.
Информационный объём фрагмента текста - это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.

Слайд #11

8 битов
16 битов
Опорный конспект
Компьютер различает вводимые символы по их двоичному коду. Соответствие между изображениями и кодами символов устанавливается с помощью кодовых таблиц.
I = K x i
Информационный вес символа
Windows
Unicode
N – мощность алфавита
I - информационный объём сообщения
K – количество символов
i – информационный вес символа
ASCII
КОИ-8
N = 2 i

Слайд #12

Задача 1.
Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объём следующего высказывания Уинстона Черчилля
Кто владеет информацией, тот владеет миром.
Решение.
В данном тексте 42 символа (с учётом знаков препинания и пробелов). Каждый символ кодируется одним байтом. Следовательно, информационный объём всего текста - 42 байта.
Ответ: 42 байта.
Информационный объём фрагмента текста

Слайд #13

Информационный объём фрагмента текста
Задача 2. В кодировке Unicode на каждый символ отводится два байта. Определите информационный объём слова из 24 символов в этой кодировке.
Решение.
I = 24  2 = 48 (байтов).
Ответ: 48 байтов.

Слайд #14

Информационный объём фрагмента текста
Задача 3.
Выразите в мегабайтах объём текстовой информации в «Современном словаре иностранных слов» из 740 страниц, если на одной странице размещается в среднем 60 строк по 80 символов (включая пробелы). Считайте, что при записи использовался алфавит мощностью 256 символов.
Ответ: 3,39 Мбайт.
K = 740 х 80 х 60
N = 256

I - ?
256 = 2i = 28, i = 8
К = 740 х 80 х 60 x 8 = 28 416 000 бит = 3 552 000 байтов = = 3 468,75 Кбайт 3,39 Мбайт.
I = K x i
N = 2i

Слайд #15

2. В кодировке ASCII каждый символ кодируется 8 битами.
Определите информационный объем сообщения в этой кодировке:
Длина данного текста 32 символа.

А) 32 бита
Б) 320 битов
В) 32 байта
Г)256 байтов

Слайд #16

3. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объем следующей пословицы:

Речь вести – не лапти плести.

Слайд #17

4. В кодировке Uniccode на каждый символ отводится 2 байта.
Определите в этой кодировке информационный объем следующей
пословицы:

Где родился, там и сгодился.

Слайд #18

Сообщение, информационный объём которого равен 5 Кбайт, занимает 4 страницы по 32 строки, в каждой из которых записано по 40 символов. Сколько символов в алфавите языка, на котором записано это сообщение?

Слайд #19

Сообщение занимает 6 страниц по 40 строк, в каждой строке записано по 60 символов. Информационный объём всего сообщения равен 28800 байтам. Сколько двоичных разрядов было использовано на кодирование одного символа?

Слайд #20

В текстовом режиме экран монитора компьютера обычно разбивается на 25 строк по 80 символов в строке. Определите объём текста, занимающего весь экран монитора, в кодировке Unicode.

Слайд #21

Домашнее задание:
§ 4.6 - учить
Подготовить материалы для реферата
«История развития компьютерной техники»
по пунктам 8-13 на стр. 197 - 198.

Слайд #22

Спасибо за урок