第二讲 信息的数字化
一、 教学目标:
1) 知识与技能: 知道ASCII 码
知道汉字在计算机里是如何表示的
理解声音和图象的数字化
理解信息是如何压缩的
2)过程与方法:通过自学微视频完成任务单,在教师引导下通过自学掌握知识。
3)情感与价值观:通过讨论, 探索解决问题的方法,增加学生合作交流,培养学生自主
学习的积极性, 体验到微视频教学中带来的好处。
二、 教学重点与难点:
重点:字符、汉字在计算机里的表示
声音和图象的数字化
难点:图象的数字化
三、 教学过程:
复习引入:
讨论课堂作业单:选择题第15、19、44题
直观地说,信息的数字化就是以二进制数的形式来表达信息。由于计算机内部处理的信息都是以二进制形式表示的,所以数字化是计算机处理信息的基础。
信息可识别的符号形式称为数据。是描述信息的数字、字母、和各种符号的集合。 数据是信息的载体,数据所荷载的内容是信息。
师生交流:请学生讨论信息和数据的区别,举例说明。
数据分成两类:数值型数据和非数值型数据,如文字、图像、声音等都是非数值型数据。 由此,当各种数据与二进制代码存在一定的对应关系后,人类才能有效的与计算机交换各种信息。而建立数据与代码之间的对应关系,需要统一的规则,这种规则就称为“编码”。
一、字符的数字化
字符包括英文字母、阿拉伯数字、常用符号以及我们的汉字。
1.ASCII 码
ASCII 码是美国信息交换标准代码的简称,是目前应用最广泛的一种编码规则,已为世界各国所采用,成为了国际通用标准。
ASCII 码用7位二进制代码表示,可表示27=128个不同的字符。包括94个字符(10个阿拉伯数字,大、小写英文字母各26个,常用符号32个)和34个控制符。
在计算机内实际使用时,是用8位二进制数表示一个字符,最高位是“0”。存储时占用一个字节。
ASCII 编码表参阅教材P108。
由于这些字符在ASCII 码表中占据了一个位置,有了先后顺序,就可以比较大小。 观察ASCII 表,(解释高位和低位概念),比较以下内容:
(1)同类字母的编码大小关系;(比如”A ”和”B ”)(按字母顺序排列)
(2)大写字母和小写字母的编码大小关系;(比如”A ”和”a ”)(所有小写字母大于大写字母)
(3)字母和数字字符的关系;(所有字母大于数字字符)
我们也可以根据一个字母的位置推算出其他字母的ASCII 码或者相反。
例1:已知字符A 的十进制编码是65,那么字符E 的十进制编码是什么?
请思考:已知二进制编码1100111B 是字符g 的ASCII 编码,则二进制编码1100100B 是哪个字符的ASCII 编码?
2.汉字编码
汉字在计算机内部也是以二进制方式存放的。
(1)汉字信息交换码(国标码,GB2312-80):
1980年颁布。包括6763个汉字(分为一级常用汉字3755个和二级常用汉字3008个)和682个非汉字常用符号。2个字节表示, 各字节的最高位为0。
2000年,我国又颁布了国标GB18030,包括27484个汉字。
(2)汉字的机内码(内码):
计算机内部进行汉字的存储、处理、传输的汉字编码。2个字节表示, 各字节的最高位为1。是将国标码的两个字节的最高位分别置为1而得。 所以它与国标码之间具有明显的对应关系,同时也解决了中西文字符机内码的二义性问题。
(3)汉字输入码(外码):
用于将汉字通过键盘输入计算机而设计。同一个汉字的输入码可能不同,它与汉字的输入法有关。
(4)汉字的字形码:
为显示和打印输出而形成的汉字编码。目前汉字字形的产生主要有点阵、矢量和曲线轮廓三种方式。汉字字形点阵有16×16、24×24、32×32等,每一个点用一个二进制位保存。保存汉字字形码的文件,就称为汉字字库。
课堂讨论:作业单选择题第16、25 题
二、模拟量和数字量
模拟量:用连续的物理变量表示的数量。如电流、电压、声音的变化。
从宏观的角度看,人类在日常生活中所体验的几乎都是模拟量,如声音的大小、音调的高低、电视图像的色彩明暗的变化。
而从微观角度看,则完全不同。最典型的例子是电视图像。经仔细观察可以发现,一幅图像实际上是由色彩和明暗不同的足够多的小方格(称为象素)组成。只要每个象素足够小,屏幕上的色彩和明暗变化看上去就是连续的。就象用描点法作函数图像一样。
从信息的收集、储存、复制、处理的角度看,使用模拟量不是最佳选择。因为,模拟信息(即模拟量的某一个状态)的收集、储存、复制、处理具有不精确的倾向,并且,模拟信息每传递一次,就有更加不精确的可能。
那么,能否用离散量来表示模拟量呢?可以。
事实上,任何一种信息都可以用0和1这两个数字组成的二进制数来表示,用二进制数来表示模拟量,将模拟量转化为数字量的过程就是数字化。
模拟量和数字量都是对某一种物理状态的表达,区别在于模拟量是连续的,而数字量是间断的。模拟量可以独立存在,而数字量必须与某种计量方式关联。
将模拟量转化成数字量称为模数转换(A/D)。
经过计算机处理的数字量要让人能够接受,必须转换成模拟量,这一过程称为数模转换(D/A)。
模数转换的关键是:以很小的时间间隔不断测得模拟量在这些瞬间的幅度值(采样),并以某种数值(量化)形式加以保存。
而数模转换则相反,以相同的时间为间隔,产生以电压等幅度形式表示的数值,并使之平滑过渡,还原出原来的模拟量。
三、声音信息的数字化:
声音是振动产生的波,是一种模拟信号。通常,声音的数字化需要通过采样和量化两个步骤来实现。声波数字化过程:
1、首先将声波变化转化为电压的连续变化。如使用话筒。
2、定时采样:每隔一定的时间,读取一次声波模拟电压的数值。时间间隔越短,数据精度越高。每秒钟采样样本的数量称为采样频率。
3、量化:将读取到的模拟量数值转化为二进制数序列。目前常用的有单字节和双字节量化,即8位或16位二进制数记录一次采样获得的数据。
在计算机内部我们使用声卡完成以上工作(A/D转换)的。
声音处理软件可以将我们采集的数据保存为声音文件,如Windows 中的录音机软件。 目前常见的各种格式的声音文件中,音质最好的是CD 音频格式和W A V 格式,MP3格式和WMA 格式的音质次之,RA 格式适合于在线播放。
声音文件播放时,声卡起的作用正好与录音时的作用相反(D/A转换)。
声音存储的数据量与采样频率、量化级数成正比。
例如:为了将一段音乐保存为声音文件,我们使用的采样频率为44.1KHz ,量化值使用16位二进制数,双声道。则保存1秒钟音乐的数据量为44100×16×2÷8=176400字节。
想一想:按要求22.1KNz 、8位、单声道录制一段2分钟的音乐,其W A V 格式的声音文件的大小是多少字节?
课堂讨论:作业单选择题第26、37、45 题
四、图像信息的数字化:
图像数字化的基本思想:
将一幅图像分割成许多按行列排列的“图像元素”(简称为像素),然后对每一个像素进行采样和量化。
相同面积的图像,分割越细,像素越多,图像就越清晰。像素的数量就是图像的分辨率,表示的形式是X ×Y 。如1024×768,表示该图像水平方向的像素有1024个,垂直方向的像素有768个。
每个像素可以用1、8、24位等二进制数来表示颜色的信息,位数越多,图像的色彩就越丰富。如果使用1位二进制数,这将是一幅只有黑白两色的图像;如使用8位二进制数,可以表示一幅只有某一种颜色层次(灰度等级)的单色图像;如使用24位二进制数,则可以表示一幅由红、绿、蓝三种颜色层次组合的彩色图像。
以这种思想建立的图像文件称为位图格式。目前我们主要使用微软推出的BMP 格式。 例如:一幅分辨率为800×600,24位的彩色图像,其存储数据量为800×600×24÷8=1440000字节
课堂讨论:作业单选择题第17、21 题
五、压缩技术
为什么采用压缩技术?
按照一般信息数字化所获得的编码数据量太大,计算机难以存储。
数据压缩就是采用特殊的编码方式来保存数据,使数据占用的存储空间相对减少。不同的数据有不同的压缩方法。
常用的压缩软件有WinRAR ,WinZip 等。
常用的压缩方法分为无损压缩和有损压缩两种。
无损压缩:在压缩过程中,所有信息都被保留,能够完全恢复原始数据。
解压缩:将压缩包还原为正常编码形式以便于使用。
有损压缩:在压缩过程中,允许损失一些信息,而且损失的信息也不能再完全复原。一般而言,有损压缩以不影响人的使用要求为准。一般使用于声音文件、图像文件和视频文件等。
图像文件中,BMP 格式的位图文件没有压缩,JPG 、GIF 格式是有损压缩,TIF 可以有损也可以无损。
音频文件中W A V 格式没有压缩,MP3、WMA 、RM 、RA 等都是有损压缩。
各种视频文件都是有损压缩的。
程序文件和文档文件不能进行有损压缩。
课堂讨论:作业单选择题第20、23、31、46 题
第二讲 信息的数字化
一、 教学目标:
1) 知识与技能: 知道ASCII 码
知道汉字在计算机里是如何表示的
理解声音和图象的数字化
理解信息是如何压缩的
2)过程与方法:通过自学微视频完成任务单,在教师引导下通过自学掌握知识。
3)情感与价值观:通过讨论, 探索解决问题的方法,增加学生合作交流,培养学生自主
学习的积极性, 体验到微视频教学中带来的好处。
二、 教学重点与难点:
重点:字符、汉字在计算机里的表示
声音和图象的数字化
难点:图象的数字化
三、 教学过程:
复习引入:
讨论课堂作业单:选择题第15、19、44题
直观地说,信息的数字化就是以二进制数的形式来表达信息。由于计算机内部处理的信息都是以二进制形式表示的,所以数字化是计算机处理信息的基础。
信息可识别的符号形式称为数据。是描述信息的数字、字母、和各种符号的集合。 数据是信息的载体,数据所荷载的内容是信息。
师生交流:请学生讨论信息和数据的区别,举例说明。
数据分成两类:数值型数据和非数值型数据,如文字、图像、声音等都是非数值型数据。 由此,当各种数据与二进制代码存在一定的对应关系后,人类才能有效的与计算机交换各种信息。而建立数据与代码之间的对应关系,需要统一的规则,这种规则就称为“编码”。
一、字符的数字化
字符包括英文字母、阿拉伯数字、常用符号以及我们的汉字。
1.ASCII 码
ASCII 码是美国信息交换标准代码的简称,是目前应用最广泛的一种编码规则,已为世界各国所采用,成为了国际通用标准。
ASCII 码用7位二进制代码表示,可表示27=128个不同的字符。包括94个字符(10个阿拉伯数字,大、小写英文字母各26个,常用符号32个)和34个控制符。
在计算机内实际使用时,是用8位二进制数表示一个字符,最高位是“0”。存储时占用一个字节。
ASCII 编码表参阅教材P108。
由于这些字符在ASCII 码表中占据了一个位置,有了先后顺序,就可以比较大小。 观察ASCII 表,(解释高位和低位概念),比较以下内容:
(1)同类字母的编码大小关系;(比如”A ”和”B ”)(按字母顺序排列)
(2)大写字母和小写字母的编码大小关系;(比如”A ”和”a ”)(所有小写字母大于大写字母)
(3)字母和数字字符的关系;(所有字母大于数字字符)
我们也可以根据一个字母的位置推算出其他字母的ASCII 码或者相反。
例1:已知字符A 的十进制编码是65,那么字符E 的十进制编码是什么?
请思考:已知二进制编码1100111B 是字符g 的ASCII 编码,则二进制编码1100100B 是哪个字符的ASCII 编码?
2.汉字编码
汉字在计算机内部也是以二进制方式存放的。
(1)汉字信息交换码(国标码,GB2312-80):
1980年颁布。包括6763个汉字(分为一级常用汉字3755个和二级常用汉字3008个)和682个非汉字常用符号。2个字节表示, 各字节的最高位为0。
2000年,我国又颁布了国标GB18030,包括27484个汉字。
(2)汉字的机内码(内码):
计算机内部进行汉字的存储、处理、传输的汉字编码。2个字节表示, 各字节的最高位为1。是将国标码的两个字节的最高位分别置为1而得。 所以它与国标码之间具有明显的对应关系,同时也解决了中西文字符机内码的二义性问题。
(3)汉字输入码(外码):
用于将汉字通过键盘输入计算机而设计。同一个汉字的输入码可能不同,它与汉字的输入法有关。
(4)汉字的字形码:
为显示和打印输出而形成的汉字编码。目前汉字字形的产生主要有点阵、矢量和曲线轮廓三种方式。汉字字形点阵有16×16、24×24、32×32等,每一个点用一个二进制位保存。保存汉字字形码的文件,就称为汉字字库。
课堂讨论:作业单选择题第16、25 题
二、模拟量和数字量
模拟量:用连续的物理变量表示的数量。如电流、电压、声音的变化。
从宏观的角度看,人类在日常生活中所体验的几乎都是模拟量,如声音的大小、音调的高低、电视图像的色彩明暗的变化。
而从微观角度看,则完全不同。最典型的例子是电视图像。经仔细观察可以发现,一幅图像实际上是由色彩和明暗不同的足够多的小方格(称为象素)组成。只要每个象素足够小,屏幕上的色彩和明暗变化看上去就是连续的。就象用描点法作函数图像一样。
从信息的收集、储存、复制、处理的角度看,使用模拟量不是最佳选择。因为,模拟信息(即模拟量的某一个状态)的收集、储存、复制、处理具有不精确的倾向,并且,模拟信息每传递一次,就有更加不精确的可能。
那么,能否用离散量来表示模拟量呢?可以。
事实上,任何一种信息都可以用0和1这两个数字组成的二进制数来表示,用二进制数来表示模拟量,将模拟量转化为数字量的过程就是数字化。
模拟量和数字量都是对某一种物理状态的表达,区别在于模拟量是连续的,而数字量是间断的。模拟量可以独立存在,而数字量必须与某种计量方式关联。
将模拟量转化成数字量称为模数转换(A/D)。
经过计算机处理的数字量要让人能够接受,必须转换成模拟量,这一过程称为数模转换(D/A)。
模数转换的关键是:以很小的时间间隔不断测得模拟量在这些瞬间的幅度值(采样),并以某种数值(量化)形式加以保存。
而数模转换则相反,以相同的时间为间隔,产生以电压等幅度形式表示的数值,并使之平滑过渡,还原出原来的模拟量。
三、声音信息的数字化:
声音是振动产生的波,是一种模拟信号。通常,声音的数字化需要通过采样和量化两个步骤来实现。声波数字化过程:
1、首先将声波变化转化为电压的连续变化。如使用话筒。
2、定时采样:每隔一定的时间,读取一次声波模拟电压的数值。时间间隔越短,数据精度越高。每秒钟采样样本的数量称为采样频率。
3、量化:将读取到的模拟量数值转化为二进制数序列。目前常用的有单字节和双字节量化,即8位或16位二进制数记录一次采样获得的数据。
在计算机内部我们使用声卡完成以上工作(A/D转换)的。
声音处理软件可以将我们采集的数据保存为声音文件,如Windows 中的录音机软件。 目前常见的各种格式的声音文件中,音质最好的是CD 音频格式和W A V 格式,MP3格式和WMA 格式的音质次之,RA 格式适合于在线播放。
声音文件播放时,声卡起的作用正好与录音时的作用相反(D/A转换)。
声音存储的数据量与采样频率、量化级数成正比。
例如:为了将一段音乐保存为声音文件,我们使用的采样频率为44.1KHz ,量化值使用16位二进制数,双声道。则保存1秒钟音乐的数据量为44100×16×2÷8=176400字节。
想一想:按要求22.1KNz 、8位、单声道录制一段2分钟的音乐,其W A V 格式的声音文件的大小是多少字节?
课堂讨论:作业单选择题第26、37、45 题
四、图像信息的数字化:
图像数字化的基本思想:
将一幅图像分割成许多按行列排列的“图像元素”(简称为像素),然后对每一个像素进行采样和量化。
相同面积的图像,分割越细,像素越多,图像就越清晰。像素的数量就是图像的分辨率,表示的形式是X ×Y 。如1024×768,表示该图像水平方向的像素有1024个,垂直方向的像素有768个。
每个像素可以用1、8、24位等二进制数来表示颜色的信息,位数越多,图像的色彩就越丰富。如果使用1位二进制数,这将是一幅只有黑白两色的图像;如使用8位二进制数,可以表示一幅只有某一种颜色层次(灰度等级)的单色图像;如使用24位二进制数,则可以表示一幅由红、绿、蓝三种颜色层次组合的彩色图像。
以这种思想建立的图像文件称为位图格式。目前我们主要使用微软推出的BMP 格式。 例如:一幅分辨率为800×600,24位的彩色图像,其存储数据量为800×600×24÷8=1440000字节
课堂讨论:作业单选择题第17、21 题
五、压缩技术
为什么采用压缩技术?
按照一般信息数字化所获得的编码数据量太大,计算机难以存储。
数据压缩就是采用特殊的编码方式来保存数据,使数据占用的存储空间相对减少。不同的数据有不同的压缩方法。
常用的压缩软件有WinRAR ,WinZip 等。
常用的压缩方法分为无损压缩和有损压缩两种。
无损压缩:在压缩过程中,所有信息都被保留,能够完全恢复原始数据。
解压缩:将压缩包还原为正常编码形式以便于使用。
有损压缩:在压缩过程中,允许损失一些信息,而且损失的信息也不能再完全复原。一般而言,有损压缩以不影响人的使用要求为准。一般使用于声音文件、图像文件和视频文件等。
图像文件中,BMP 格式的位图文件没有压缩,JPG 、GIF 格式是有损压缩,TIF 可以有损也可以无损。
音频文件中W A V 格式没有压缩,MP3、WMA 、RM 、RA 等都是有损压缩。
各种视频文件都是有损压缩的。
程序文件和文档文件不能进行有损压缩。
课堂讨论:作业单选择题第20、23、31、46 题