第二讲 信息的数字化

第二讲 信息的数字化

一、 教学目标:

1) 知识与技能: 知道ASCII 码

知道汉字在计算机里是如何表示的

理解声音和图象的数字化

理解信息是如何压缩的

2)过程与方法:通过自学微视频完成任务单,在教师引导下通过自学掌握知识。

3)情感与价值观:通过讨论, 探索解决问题的方法,增加学生合作交流,培养学生自主

学习的积极性, 体验到微视频教学中带来的好处。

二、 教学重点与难点:

重点:字符、汉字在计算机里的表示

声音和图象的数字化

难点:图象的数字化

三、 教学过程:

复习引入:

讨论课堂作业单:选择题第15、19、44题

直观地说,信息的数字化就是以二进制数的形式来表达信息。由于计算机内部处理的信息都是以二进制形式表示的,所以数字化是计算机处理信息的基础。

信息可识别的符号形式称为数据。是描述信息的数字、字母、和各种符号的集合。 数据是信息的载体,数据所荷载的内容是信息。

师生交流:请学生讨论信息和数据的区别,举例说明。

数据分成两类:数值型数据和非数值型数据,如文字、图像、声音等都是非数值型数据。 由此,当各种数据与二进制代码存在一定的对应关系后,人类才能有效的与计算机交换各种信息。而建立数据与代码之间的对应关系,需要统一的规则,这种规则就称为“编码”。

一、字符的数字化

字符包括英文字母、阿拉伯数字、常用符号以及我们的汉字。

1.ASCII 码

ASCII 码是美国信息交换标准代码的简称,是目前应用最广泛的一种编码规则,已为世界各国所采用,成为了国际通用标准。

ASCII 码用7位二进制代码表示,可表示27=128个不同的字符。包括94个字符(10个阿拉伯数字,大、小写英文字母各26个,常用符号32个)和34个控制符。

在计算机内实际使用时,是用8位二进制数表示一个字符,最高位是“0”。存储时占用一个字节。

ASCII 编码表参阅教材P108。

由于这些字符在ASCII 码表中占据了一个位置,有了先后顺序,就可以比较大小。 观察ASCII 表,(解释高位和低位概念),比较以下内容:

(1)同类字母的编码大小关系;(比如”A ”和”B ”)(按字母顺序排列)

(2)大写字母和小写字母的编码大小关系;(比如”A ”和”a ”)(所有小写字母大于大写字母)

(3)字母和数字字符的关系;(所有字母大于数字字符)

我们也可以根据一个字母的位置推算出其他字母的ASCII 码或者相反。

例1:已知字符A 的十进制编码是65,那么字符E 的十进制编码是什么?

请思考:已知二进制编码1100111B 是字符g 的ASCII 编码,则二进制编码1100100B 是哪个字符的ASCII 编码?

2.汉字编码

汉字在计算机内部也是以二进制方式存放的。

(1)汉字信息交换码(国标码,GB2312-80):

1980年颁布。包括6763个汉字(分为一级常用汉字3755个和二级常用汉字3008个)和682个非汉字常用符号。2个字节表示, 各字节的最高位为0。

2000年,我国又颁布了国标GB18030,包括27484个汉字。

(2)汉字的机内码(内码):

计算机内部进行汉字的存储、处理、传输的汉字编码。2个字节表示, 各字节的最高位为1。是将国标码的两个字节的最高位分别置为1而得。 所以它与国标码之间具有明显的对应关系,同时也解决了中西文字符机内码的二义性问题。

(3)汉字输入码(外码):

用于将汉字通过键盘输入计算机而设计。同一个汉字的输入码可能不同,它与汉字的输入法有关。

(4)汉字的字形码:

为显示和打印输出而形成的汉字编码。目前汉字字形的产生主要有点阵、矢量和曲线轮廓三种方式。汉字字形点阵有16×16、24×24、32×32等,每一个点用一个二进制位保存。保存汉字字形码的文件,就称为汉字字库。

课堂讨论:作业单选择题第16、25 题

二、模拟量和数字量

模拟量:用连续的物理变量表示的数量。如电流、电压、声音的变化。

从宏观的角度看,人类在日常生活中所体验的几乎都是模拟量,如声音的大小、音调的高低、电视图像的色彩明暗的变化。

而从微观角度看,则完全不同。最典型的例子是电视图像。经仔细观察可以发现,一幅图像实际上是由色彩和明暗不同的足够多的小方格(称为象素)组成。只要每个象素足够小,屏幕上的色彩和明暗变化看上去就是连续的。就象用描点法作函数图像一样。

从信息的收集、储存、复制、处理的角度看,使用模拟量不是最佳选择。因为,模拟信息(即模拟量的某一个状态)的收集、储存、复制、处理具有不精确的倾向,并且,模拟信息每传递一次,就有更加不精确的可能。

那么,能否用离散量来表示模拟量呢?可以。

事实上,任何一种信息都可以用0和1这两个数字组成的二进制数来表示,用二进制数来表示模拟量,将模拟量转化为数字量的过程就是数字化。

模拟量和数字量都是对某一种物理状态的表达,区别在于模拟量是连续的,而数字量是间断的。模拟量可以独立存在,而数字量必须与某种计量方式关联。

将模拟量转化成数字量称为模数转换(A/D)。

经过计算机处理的数字量要让人能够接受,必须转换成模拟量,这一过程称为数模转换(D/A)。

模数转换的关键是:以很小的时间间隔不断测得模拟量在这些瞬间的幅度值(采样),并以某种数值(量化)形式加以保存。

而数模转换则相反,以相同的时间为间隔,产生以电压等幅度形式表示的数值,并使之平滑过渡,还原出原来的模拟量。

三、声音信息的数字化:

声音是振动产生的波,是一种模拟信号。通常,声音的数字化需要通过采样和量化两个步骤来实现。声波数字化过程:

1、首先将声波变化转化为电压的连续变化。如使用话筒。

2、定时采样:每隔一定的时间,读取一次声波模拟电压的数值。时间间隔越短,数据精度越高。每秒钟采样样本的数量称为采样频率。

3、量化:将读取到的模拟量数值转化为二进制数序列。目前常用的有单字节和双字节量化,即8位或16位二进制数记录一次采样获得的数据。

在计算机内部我们使用声卡完成以上工作(A/D转换)的。

声音处理软件可以将我们采集的数据保存为声音文件,如Windows 中的录音机软件。 目前常见的各种格式的声音文件中,音质最好的是CD 音频格式和W A V 格式,MP3格式和WMA 格式的音质次之,RA 格式适合于在线播放。

声音文件播放时,声卡起的作用正好与录音时的作用相反(D/A转换)。

声音存储的数据量与采样频率、量化级数成正比。

例如:为了将一段音乐保存为声音文件,我们使用的采样频率为44.1KHz ,量化值使用16位二进制数,双声道。则保存1秒钟音乐的数据量为44100×16×2÷8=176400字节。

想一想:按要求22.1KNz 、8位、单声道录制一段2分钟的音乐,其W A V 格式的声音文件的大小是多少字节?

课堂讨论:作业单选择题第26、37、45 题

四、图像信息的数字化:

图像数字化的基本思想:

将一幅图像分割成许多按行列排列的“图像元素”(简称为像素),然后对每一个像素进行采样和量化。

相同面积的图像,分割越细,像素越多,图像就越清晰。像素的数量就是图像的分辨率,表示的形式是X ×Y 。如1024×768,表示该图像水平方向的像素有1024个,垂直方向的像素有768个。

每个像素可以用1、8、24位等二进制数来表示颜色的信息,位数越多,图像的色彩就越丰富。如果使用1位二进制数,这将是一幅只有黑白两色的图像;如使用8位二进制数,可以表示一幅只有某一种颜色层次(灰度等级)的单色图像;如使用24位二进制数,则可以表示一幅由红、绿、蓝三种颜色层次组合的彩色图像。

以这种思想建立的图像文件称为位图格式。目前我们主要使用微软推出的BMP 格式。 例如:一幅分辨率为800×600,24位的彩色图像,其存储数据量为800×600×24÷8=1440000字节

课堂讨论:作业单选择题第17、21 题

五、压缩技术

为什么采用压缩技术?

按照一般信息数字化所获得的编码数据量太大,计算机难以存储。

数据压缩就是采用特殊的编码方式来保存数据,使数据占用的存储空间相对减少。不同的数据有不同的压缩方法。

常用的压缩软件有WinRAR ,WinZip 等。

常用的压缩方法分为无损压缩和有损压缩两种。

无损压缩:在压缩过程中,所有信息都被保留,能够完全恢复原始数据。

解压缩:将压缩包还原为正常编码形式以便于使用。

有损压缩:在压缩过程中,允许损失一些信息,而且损失的信息也不能再完全复原。一般而言,有损压缩以不影响人的使用要求为准。一般使用于声音文件、图像文件和视频文件等。

图像文件中,BMP 格式的位图文件没有压缩,JPG 、GIF 格式是有损压缩,TIF 可以有损也可以无损。

音频文件中W A V 格式没有压缩,MP3、WMA 、RM 、RA 等都是有损压缩。

各种视频文件都是有损压缩的。

程序文件和文档文件不能进行有损压缩。

课堂讨论:作业单选择题第20、23、31、46 题

第二讲 信息的数字化

一、 教学目标:

1) 知识与技能: 知道ASCII 码

知道汉字在计算机里是如何表示的

理解声音和图象的数字化

理解信息是如何压缩的

2)过程与方法:通过自学微视频完成任务单,在教师引导下通过自学掌握知识。

3)情感与价值观:通过讨论, 探索解决问题的方法,增加学生合作交流,培养学生自主

学习的积极性, 体验到微视频教学中带来的好处。

二、 教学重点与难点:

重点:字符、汉字在计算机里的表示

声音和图象的数字化

难点:图象的数字化

三、 教学过程:

复习引入:

讨论课堂作业单:选择题第15、19、44题

直观地说,信息的数字化就是以二进制数的形式来表达信息。由于计算机内部处理的信息都是以二进制形式表示的,所以数字化是计算机处理信息的基础。

信息可识别的符号形式称为数据。是描述信息的数字、字母、和各种符号的集合。 数据是信息的载体,数据所荷载的内容是信息。

师生交流:请学生讨论信息和数据的区别,举例说明。

数据分成两类:数值型数据和非数值型数据,如文字、图像、声音等都是非数值型数据。 由此,当各种数据与二进制代码存在一定的对应关系后,人类才能有效的与计算机交换各种信息。而建立数据与代码之间的对应关系,需要统一的规则,这种规则就称为“编码”。

一、字符的数字化

字符包括英文字母、阿拉伯数字、常用符号以及我们的汉字。

1.ASCII 码

ASCII 码是美国信息交换标准代码的简称,是目前应用最广泛的一种编码规则,已为世界各国所采用,成为了国际通用标准。

ASCII 码用7位二进制代码表示,可表示27=128个不同的字符。包括94个字符(10个阿拉伯数字,大、小写英文字母各26个,常用符号32个)和34个控制符。

在计算机内实际使用时,是用8位二进制数表示一个字符,最高位是“0”。存储时占用一个字节。

ASCII 编码表参阅教材P108。

由于这些字符在ASCII 码表中占据了一个位置,有了先后顺序,就可以比较大小。 观察ASCII 表,(解释高位和低位概念),比较以下内容:

(1)同类字母的编码大小关系;(比如”A ”和”B ”)(按字母顺序排列)

(2)大写字母和小写字母的编码大小关系;(比如”A ”和”a ”)(所有小写字母大于大写字母)

(3)字母和数字字符的关系;(所有字母大于数字字符)

我们也可以根据一个字母的位置推算出其他字母的ASCII 码或者相反。

例1:已知字符A 的十进制编码是65,那么字符E 的十进制编码是什么?

请思考:已知二进制编码1100111B 是字符g 的ASCII 编码,则二进制编码1100100B 是哪个字符的ASCII 编码?

2.汉字编码

汉字在计算机内部也是以二进制方式存放的。

(1)汉字信息交换码(国标码,GB2312-80):

1980年颁布。包括6763个汉字(分为一级常用汉字3755个和二级常用汉字3008个)和682个非汉字常用符号。2个字节表示, 各字节的最高位为0。

2000年,我国又颁布了国标GB18030,包括27484个汉字。

(2)汉字的机内码(内码):

计算机内部进行汉字的存储、处理、传输的汉字编码。2个字节表示, 各字节的最高位为1。是将国标码的两个字节的最高位分别置为1而得。 所以它与国标码之间具有明显的对应关系,同时也解决了中西文字符机内码的二义性问题。

(3)汉字输入码(外码):

用于将汉字通过键盘输入计算机而设计。同一个汉字的输入码可能不同,它与汉字的输入法有关。

(4)汉字的字形码:

为显示和打印输出而形成的汉字编码。目前汉字字形的产生主要有点阵、矢量和曲线轮廓三种方式。汉字字形点阵有16×16、24×24、32×32等,每一个点用一个二进制位保存。保存汉字字形码的文件,就称为汉字字库。

课堂讨论:作业单选择题第16、25 题

二、模拟量和数字量

模拟量:用连续的物理变量表示的数量。如电流、电压、声音的变化。

从宏观的角度看,人类在日常生活中所体验的几乎都是模拟量,如声音的大小、音调的高低、电视图像的色彩明暗的变化。

而从微观角度看,则完全不同。最典型的例子是电视图像。经仔细观察可以发现,一幅图像实际上是由色彩和明暗不同的足够多的小方格(称为象素)组成。只要每个象素足够小,屏幕上的色彩和明暗变化看上去就是连续的。就象用描点法作函数图像一样。

从信息的收集、储存、复制、处理的角度看,使用模拟量不是最佳选择。因为,模拟信息(即模拟量的某一个状态)的收集、储存、复制、处理具有不精确的倾向,并且,模拟信息每传递一次,就有更加不精确的可能。

那么,能否用离散量来表示模拟量呢?可以。

事实上,任何一种信息都可以用0和1这两个数字组成的二进制数来表示,用二进制数来表示模拟量,将模拟量转化为数字量的过程就是数字化。

模拟量和数字量都是对某一种物理状态的表达,区别在于模拟量是连续的,而数字量是间断的。模拟量可以独立存在,而数字量必须与某种计量方式关联。

将模拟量转化成数字量称为模数转换(A/D)。

经过计算机处理的数字量要让人能够接受,必须转换成模拟量,这一过程称为数模转换(D/A)。

模数转换的关键是:以很小的时间间隔不断测得模拟量在这些瞬间的幅度值(采样),并以某种数值(量化)形式加以保存。

而数模转换则相反,以相同的时间为间隔,产生以电压等幅度形式表示的数值,并使之平滑过渡,还原出原来的模拟量。

三、声音信息的数字化:

声音是振动产生的波,是一种模拟信号。通常,声音的数字化需要通过采样和量化两个步骤来实现。声波数字化过程:

1、首先将声波变化转化为电压的连续变化。如使用话筒。

2、定时采样:每隔一定的时间,读取一次声波模拟电压的数值。时间间隔越短,数据精度越高。每秒钟采样样本的数量称为采样频率。

3、量化:将读取到的模拟量数值转化为二进制数序列。目前常用的有单字节和双字节量化,即8位或16位二进制数记录一次采样获得的数据。

在计算机内部我们使用声卡完成以上工作(A/D转换)的。

声音处理软件可以将我们采集的数据保存为声音文件,如Windows 中的录音机软件。 目前常见的各种格式的声音文件中,音质最好的是CD 音频格式和W A V 格式,MP3格式和WMA 格式的音质次之,RA 格式适合于在线播放。

声音文件播放时,声卡起的作用正好与录音时的作用相反(D/A转换)。

声音存储的数据量与采样频率、量化级数成正比。

例如:为了将一段音乐保存为声音文件,我们使用的采样频率为44.1KHz ,量化值使用16位二进制数,双声道。则保存1秒钟音乐的数据量为44100×16×2÷8=176400字节。

想一想:按要求22.1KNz 、8位、单声道录制一段2分钟的音乐,其W A V 格式的声音文件的大小是多少字节?

课堂讨论:作业单选择题第26、37、45 题

四、图像信息的数字化:

图像数字化的基本思想:

将一幅图像分割成许多按行列排列的“图像元素”(简称为像素),然后对每一个像素进行采样和量化。

相同面积的图像,分割越细,像素越多,图像就越清晰。像素的数量就是图像的分辨率,表示的形式是X ×Y 。如1024×768,表示该图像水平方向的像素有1024个,垂直方向的像素有768个。

每个像素可以用1、8、24位等二进制数来表示颜色的信息,位数越多,图像的色彩就越丰富。如果使用1位二进制数,这将是一幅只有黑白两色的图像;如使用8位二进制数,可以表示一幅只有某一种颜色层次(灰度等级)的单色图像;如使用24位二进制数,则可以表示一幅由红、绿、蓝三种颜色层次组合的彩色图像。

以这种思想建立的图像文件称为位图格式。目前我们主要使用微软推出的BMP 格式。 例如:一幅分辨率为800×600,24位的彩色图像,其存储数据量为800×600×24÷8=1440000字节

课堂讨论:作业单选择题第17、21 题

五、压缩技术

为什么采用压缩技术?

按照一般信息数字化所获得的编码数据量太大,计算机难以存储。

数据压缩就是采用特殊的编码方式来保存数据,使数据占用的存储空间相对减少。不同的数据有不同的压缩方法。

常用的压缩软件有WinRAR ,WinZip 等。

常用的压缩方法分为无损压缩和有损压缩两种。

无损压缩:在压缩过程中,所有信息都被保留,能够完全恢复原始数据。

解压缩:将压缩包还原为正常编码形式以便于使用。

有损压缩:在压缩过程中,允许损失一些信息,而且损失的信息也不能再完全复原。一般而言,有损压缩以不影响人的使用要求为准。一般使用于声音文件、图像文件和视频文件等。

图像文件中,BMP 格式的位图文件没有压缩,JPG 、GIF 格式是有损压缩,TIF 可以有损也可以无损。

音频文件中W A V 格式没有压缩,MP3、WMA 、RM 、RA 等都是有损压缩。

各种视频文件都是有损压缩的。

程序文件和文档文件不能进行有损压缩。

课堂讨论:作业单选择题第20、23、31、46 题


相关文章

  • 数字图书馆信息资源宏观管理问题
  • 作者:田国良 2007年01期 随着社会经济和技术的发展,人们对于信息的关注点不断发生变化.早期,人们侧重于信息源的收集与管理:后来,随着计算机的应用,人们希望提高信息处理和传递效率,更多地注意信息流的控制:当代,人们为了追求信息效益最大化 ...查看


  • 论档案信息化.数字化.网络化及三者的关系
  • --------------..!"■r 信息化建设小-= 论档案信息化.数字化.网络化及三者的关系 周玉玲卢 旭 中国石油吐哈油田勘探开发研究院 [摘要]随着时代的发展,档案的地位正在发生变化,信息技术的发展,更是为档案的发展提 ...查看


  • 信息技术与课程整合的核心
  • 信息技术与课程整合的核心 信息化是当今世界经济和社会发展的大趋势,以多媒体和网络技术为核心的信息技术已成为拓展人类能力的创造性工具."信息技术的发展, 使人们的学习和交流打破了过去的时空界限, 为人类能力的提高和发挥作用带来了新的 ...查看


  • 数字档案馆信息服务
  • 数字档案馆信息服务 摘要:本文通过对数字档案馆信息服务的概念.特点.以及数字档案馆信息服务的模式和应采取的措施进行了阐述. 关键词:数字档案馆 信息服务 服务措施 一.引言 信息服务是数字档案馆建设的重要组成部分,其服务质量的好坏直接影响到 ...查看


  • 医疗信息系统发展现状及趋势_段会龙
  • 文章编号:1006-6586(2004)02-0001-07 中图分类号:TN911.73 文献标识码:A 1. 概述和通讯系统PACS(Picture Archiving and CommunicationSystem)的发展,以及麻醉监 ...查看


  • 我国数字城市建设成就.问题与发展建议
  • 我国数字城市建设成就.问题与发展建议 王丹 (建设综合勘察研究设计院) [摘要]数字城市为城市信息化建设提供了亮点和热点,极大地推动了城市信息化的进程. "十五"数字城市的核心是信息资源的有效整合和广泛利用,灵魂是跨部门 ...查看


  • 数字化档案馆的建设
  • 摘 要:对数字化档案馆建设的紧迫性和数字化档案馆的特征进行了阐述,并提出了数字化档案馆建设的途径. 关键词:数字化:档案馆:建设 随着计算机.网络技术应用的不断深入,办公自动化.电子商务等的应用越来越广泛,大量电子文件也随之应运而生,档案管 ...查看


  • 信息的渠道
  • 一.课题名称:获取信息的渠道 二.教学目标 1. 知识技能目标: ( 1 )理解信息获取的途径和方法,能够根据不同的问题,不同的对象选择最佳的渠道和方 式.从而培养学生的分析.比较.规划和归纳能力. ( 2 )了解信息数字化的常用方法,体验 ...查看


  • 太原市数字化城市管理实施方案
  • 太原市人民政府关于印发推进 城市数字化管理实施方案的通知 各县(市.区) 人民政府,各有关单位: <推进城市数字化管理实施方案>已经市政府领导同意,现印发给你们,请按照执行. 二○○七年十二月十四日 推进城市数字化管理实施方案 ...查看


  • 数字化校园建设方案
  • 数字化校园建设方案 项目建设领导小组 组 长:陈登斌 副组长:姜佐澧 李伟舵 孔东阳 成 员:瞿佳木 张继伟 孙 瑜 陈登贵 曹端阳 一.建设背景 在信息化浪潮席卷全球.日益渗透到社会生活各个领域的今天,数字化校园建设如火如荼.特别是欧美. ...查看


热门内容