第二讲信息的数字化

一、教学目标：

1）知识与技能：知道ASCII 码

知道汉字在计算机里是如何表示的

理解声音和图象的数字化

理解信息是如何压缩的

2）过程与方法：通过自学微视频完成任务单，在教师引导下通过自学掌握知识。

3）情感与价值观：通过讨论, 探索解决问题的方法，增加学生合作交流，培养学生自主

学习的积极性, 体验到微视频教学中带来的好处。

二、教学重点与难点：

重点：字符、汉字在计算机里的表示

声音和图象的数字化

难点：图象的数字化

三、教学过程：

复习引入：

讨论课堂作业单：选择题第15、19、44题

直观地说，信息的数字化就是以二进制数的形式来表达信息。由于计算机内部处理的信息都是以二进制形式表示的，所以数字化是计算机处理信息的基础。

信息可识别的符号形式称为数据。是描述信息的数字、字母、和各种符号的集合。数据是信息的载体，数据所荷载的内容是信息。

师生交流：请学生讨论信息和数据的区别，举例说明。

数据分成两类：数值型数据和非数值型数据，如文字、图像、声音等都是非数值型数据。由此，当各种数据与二进制代码存在一定的对应关系后，人类才能有效的与计算机交换各种信息。而建立数据与代码之间的对应关系，需要统一的规则，这种规则就称为“编码”。

一、字符的数字化

字符包括英文字母、阿拉伯数字、常用符号以及我们的汉字。

1.ASCII 码

ASCII 码是美国信息交换标准代码的简称，是目前应用最广泛的一种编码规则，已为世界各国所采用，成为了国际通用标准。

ASCII 码用7位二进制代码表示，可表示27=128个不同的字符。包括94个字符（10个阿拉伯数字，大、小写英文字母各26个，常用符号32个）和34个控制符。

在计算机内实际使用时，是用8位二进制数表示一个字符，最高位是“0”。存储时占用一个字节。

ASCII 编码表参阅教材P108。

由于这些字符在ASCII 码表中占据了一个位置，有了先后顺序，就可以比较大小。观察ASCII 表，（解释高位和低位概念），比较以下内容：

(1)同类字母的编码大小关系；（比如”A ”和”B ”）(按字母顺序排列)

(2)大写字母和小写字母的编码大小关系；（比如”A ”和”a ”）(所有小写字母大于大写字母)

(3)字母和数字字符的关系；（所有字母大于数字字符）

我们也可以根据一个字母的位置推算出其他字母的ASCII 码或者相反。

例1：已知字符A 的十进制编码是65，那么字符E 的十进制编码是什么？

请思考：已知二进制编码1100111B 是字符g 的ASCII 编码，则二进制编码1100100B 是哪个字符的ASCII 编码？

2．汉字编码

汉字在计算机内部也是以二进制方式存放的。

（1）汉字信息交换码（国标码，GB2312-80）：

1980年颁布。包括6763个汉字（分为一级常用汉字3755个和二级常用汉字3008个）和682个非汉字常用符号。2个字节表示, 各字节的最高位为0。

2000年，我国又颁布了国标GB18030，包括27484个汉字。

（2）汉字的机内码（内码）：

计算机内部进行汉字的存储、处理、传输的汉字编码。2个字节表示, 各字节的最高位为1。是将国标码的两个字节的最高位分别置为1而得。所以它与国标码之间具有明显的对应关系，同时也解决了中西文字符机内码的二义性问题。

（3）汉字输入码（外码）：

用于将汉字通过键盘输入计算机而设计。同一个汉字的输入码可能不同，它与汉字的输入法有关。

（4）汉字的字形码：

为显示和打印输出而形成的汉字编码。目前汉字字形的产生主要有点阵、矢量和曲线轮廓三种方式。汉字字形点阵有16×16、24×24、32×32等，每一个点用一个二进制位保存。保存汉字字形码的文件，就称为汉字字库。

课堂讨论：作业单选择题第16、25 题

二、模拟量和数字量

模拟量：用连续的物理变量表示的数量。如电流、电压、声音的变化。

从宏观的角度看，人类在日常生活中所体验的几乎都是模拟量，如声音的大小、音调的高低、电视图像的色彩明暗的变化。

而从微观角度看，则完全不同。最典型的例子是电视图像。经仔细观察可以发现，一幅图像实际上是由色彩和明暗不同的足够多的小方格（称为象素）组成。只要每个象素足够小，屏幕上的色彩和明暗变化看上去就是连续的。就象用描点法作函数图像一样。

从信息的收集、储存、复制、处理的角度看，使用模拟量不是最佳选择。因为，模拟信息（即模拟量的某一个状态）的收集、储存、复制、处理具有不精确的倾向，并且，模拟信息每传递一次，就有更加不精确的可能。

那么，能否用离散量来表示模拟量呢？可以。

事实上，任何一种信息都可以用0和1这两个数字组成的二进制数来表示，用二进制数来表示模拟量，将模拟量转化为数字量的过程就是数字化。

模拟量和数字量都是对某一种物理状态的表达，区别在于模拟量是连续的，而数字量是间断的。模拟量可以独立存在，而数字量必须与某种计量方式关联。

将模拟量转化成数字量称为模数转换（A/D）。

经过计算机处理的数字量要让人能够接受，必须转换成模拟量，这一过程称为数模转换（D/A）。

模数转换的关键是：以很小的时间间隔不断测得模拟量在这些瞬间的幅度值（采样），并以某种数值（量化）形式加以保存。

而数模转换则相反，以相同的时间为间隔，产生以电压等幅度形式表示的数值，并使之平滑过渡，还原出原来的模拟量。

三、声音信息的数字化：

声音是振动产生的波，是一种模拟信号。通常，声音的数字化需要通过采样和量化两个步骤来实现。声波数字化过程：

1、首先将声波变化转化为电压的连续变化。如使用话筒。

2、定时采样：每隔一定的时间，读取一次声波模拟电压的数值。时间间隔越短，数据精度越高。每秒钟采样样本的数量称为采样频率。

3、量化：将读取到的模拟量数值转化为二进制数序列。目前常用的有单字节和双字节量化，即8位或16位二进制数记录一次采样获得的数据。

在计算机内部我们使用声卡完成以上工作（A/D转换）的。

声音处理软件可以将我们采集的数据保存为声音文件，如Windows 中的录音机软件。目前常见的各种格式的声音文件中，音质最好的是CD 音频格式和W A V 格式，MP3格式和WMA 格式的音质次之，RA 格式适合于在线播放。

声音文件播放时，声卡起的作用正好与录音时的作用相反（D/A转换）。

声音存储的数据量与采样频率、量化级数成正比。

例如：为了将一段音乐保存为声音文件，我们使用的采样频率为44.1KHz ，量化值使用16位二进制数，双声道。则保存1秒钟音乐的数据量为44100×16×2÷8=176400字节。

想一想：按要求22.1KNz 、8位、单声道录制一段2分钟的音乐，其W A V 格式的声音文件的大小是多少字节？

课堂讨论：作业单选择题第26、37、45 题

四、图像信息的数字化：

图像数字化的基本思想：

将一幅图像分割成许多按行列排列的“图像元素”（简称为像素），然后对每一个像素进行采样和量化。

相同面积的图像，分割越细，像素越多，图像就越清晰。像素的数量就是图像的分辨率，表示的形式是X ×Y 。如1024×768，表示该图像水平方向的像素有1024个，垂直方向的像素有768个。

每个像素可以用1、8、24位等二进制数来表示颜色的信息，位数越多，图像的色彩就越丰富。如果使用1位二进制数，这将是一幅只有黑白两色的图像；如使用8位二进制数，可以表示一幅只有某一种颜色层次（灰度等级）的单色图像；如使用24位二进制数，则可以表示一幅由红、绿、蓝三种颜色层次组合的彩色图像。

以这种思想建立的图像文件称为位图格式。目前我们主要使用微软推出的BMP 格式。例如：一幅分辨率为800×600，24位的彩色图像，其存储数据量为800×600×24÷8=1440000字节

课堂讨论：作业单选择题第17、21 题

五、压缩技术

为什么采用压缩技术？

按照一般信息数字化所获得的编码数据量太大，计算机难以存储。

数据压缩就是采用特殊的编码方式来保存数据，使数据占用的存储空间相对减少。不同的数据有不同的压缩方法。

常用的压缩软件有WinRAR ，WinZip 等。

常用的压缩方法分为无损压缩和有损压缩两种。

无损压缩：在压缩过程中，所有信息都被保留，能够完全恢复原始数据。

解压缩：将压缩包还原为正常编码形式以便于使用。

有损压缩：在压缩过程中，允许损失一些信息，而且损失的信息也不能再完全复原。一般而言，有损压缩以不影响人的使用要求为准。一般使用于声音文件、图像文件和视频文件等。

图像文件中，BMP 格式的位图文件没有压缩，JPG 、GIF 格式是有损压缩，TIF 可以有损也可以无损。

音频文件中W A V 格式没有压缩，MP3、WMA 、RM 、RA 等都是有损压缩。

各种视频文件都是有损压缩的。

程序文件和文档文件不能进行有损压缩。

课堂讨论：作业单选择题第20、23、31、46 题

第二讲信息的数字化

一、教学目标：

1）知识与技能：知道ASCII 码

知道汉字在计算机里是如何表示的

理解声音和图象的数字化

理解信息是如何压缩的

2）过程与方法：通过自学微视频完成任务单，在教师引导下通过自学掌握知识。

3）情感与价值观：通过讨论, 探索解决问题的方法，增加学生合作交流，培养学生自主

学习的积极性, 体验到微视频教学中带来的好处。

二、教学重点与难点：

重点：字符、汉字在计算机里的表示

声音和图象的数字化

难点：图象的数字化

三、教学过程：

复习引入：

讨论课堂作业单：选择题第15、19、44题

信息可识别的符号形式称为数据。是描述信息的数字、字母、和各种符号的集合。数据是信息的载体，数据所荷载的内容是信息。

师生交流：请学生讨论信息和数据的区别，举例说明。

一、字符的数字化

字符包括英文字母、阿拉伯数字、常用符号以及我们的汉字。

1.ASCII 码

ASCII 码是美国信息交换标准代码的简称，是目前应用最广泛的一种编码规则，已为世界各国所采用，成为了国际通用标准。

ASCII 码用7位二进制代码表示，可表示27=128个不同的字符。包括94个字符（10个阿拉伯数字，大、小写英文字母各26个，常用符号32个）和34个控制符。

在计算机内实际使用时，是用8位二进制数表示一个字符，最高位是“0”。存储时占用一个字节。

ASCII 编码表参阅教材P108。

由于这些字符在ASCII 码表中占据了一个位置，有了先后顺序，就可以比较大小。观察ASCII 表，（解释高位和低位概念），比较以下内容：

(1)同类字母的编码大小关系；（比如”A ”和”B ”）(按字母顺序排列)

(2)大写字母和小写字母的编码大小关系；（比如”A ”和”a ”）(所有小写字母大于大写字母)

(3)字母和数字字符的关系；（所有字母大于数字字符）

我们也可以根据一个字母的位置推算出其他字母的ASCII 码或者相反。

例1：已知字符A 的十进制编码是65，那么字符E 的十进制编码是什么？

请思考：已知二进制编码1100111B 是字符g 的ASCII 编码，则二进制编码1100100B 是哪个字符的ASCII 编码？

2．汉字编码

汉字在计算机内部也是以二进制方式存放的。

（1）汉字信息交换码（国标码，GB2312-80）：

1980年颁布。包括6763个汉字（分为一级常用汉字3755个和二级常用汉字3008个）和682个非汉字常用符号。2个字节表示, 各字节的最高位为0。

2000年，我国又颁布了国标GB18030，包括27484个汉字。

（2）汉字的机内码（内码）：

（3）汉字输入码（外码）：

用于将汉字通过键盘输入计算机而设计。同一个汉字的输入码可能不同，它与汉字的输入法有关。

（4）汉字的字形码：

课堂讨论：作业单选择题第16、25 题

二、模拟量和数字量

模拟量：用连续的物理变量表示的数量。如电流、电压、声音的变化。

从宏观的角度看，人类在日常生活中所体验的几乎都是模拟量，如声音的大小、音调的高低、电视图像的色彩明暗的变化。

那么，能否用离散量来表示模拟量呢？可以。

事实上，任何一种信息都可以用0和1这两个数字组成的二进制数来表示，用二进制数来表示模拟量，将模拟量转化为数字量的过程就是数字化。

将模拟量转化成数字量称为模数转换（A/D）。

经过计算机处理的数字量要让人能够接受，必须转换成模拟量，这一过程称为数模转换（D/A）。

模数转换的关键是：以很小的时间间隔不断测得模拟量在这些瞬间的幅度值（采样），并以某种数值（量化）形式加以保存。

而数模转换则相反，以相同的时间为间隔，产生以电压等幅度形式表示的数值，并使之平滑过渡，还原出原来的模拟量。

三、声音信息的数字化：

声音是振动产生的波，是一种模拟信号。通常，声音的数字化需要通过采样和量化两个步骤来实现。声波数字化过程：

1、首先将声波变化转化为电压的连续变化。如使用话筒。

2、定时采样：每隔一定的时间，读取一次声波模拟电压的数值。时间间隔越短，数据精度越高。每秒钟采样样本的数量称为采样频率。

3、量化：将读取到的模拟量数值转化为二进制数序列。目前常用的有单字节和双字节量化，即8位或16位二进制数记录一次采样获得的数据。

在计算机内部我们使用声卡完成以上工作（A/D转换）的。

声音文件播放时，声卡起的作用正好与录音时的作用相反（D/A转换）。

声音存储的数据量与采样频率、量化级数成正比。

想一想：按要求22.1KNz 、8位、单声道录制一段2分钟的音乐，其W A V 格式的声音文件的大小是多少字节？

课堂讨论：作业单选择题第26、37、45 题

四、图像信息的数字化：

图像数字化的基本思想：

将一幅图像分割成许多按行列排列的“图像元素”（简称为像素），然后对每一个像素进行采样和量化。

课堂讨论：作业单选择题第17、21 题

五、压缩技术

为什么采用压缩技术？

按照一般信息数字化所获得的编码数据量太大，计算机难以存储。

数据压缩就是采用特殊的编码方式来保存数据，使数据占用的存储空间相对减少。不同的数据有不同的压缩方法。

常用的压缩软件有WinRAR ，WinZip 等。

常用的压缩方法分为无损压缩和有损压缩两种。

无损压缩：在压缩过程中，所有信息都被保留，能够完全恢复原始数据。

解压缩：将压缩包还原为正常编码形式以便于使用。

图像文件中，BMP 格式的位图文件没有压缩，JPG 、GIF 格式是有损压缩，TIF 可以有损也可以无损。

音频文件中W A V 格式没有压缩，MP3、WMA 、RM 、RA 等都是有损压缩。

各种视频文件都是有损压缩的。

程序文件和文档文件不能进行有损压缩。

课堂讨论：作业单选择题第20、23、31、46 题

第二讲 信息的数字化

相关文章

第二讲信息的数字化