530 likes | 624 Views
第二章 数据通信的基础知识. 第二章 数据通信基础知识. 信息、数据与信号 信号的分类及特性 数据通信系统分析 编码与码型. 信息的概念. 信息是消息中包含的有意义的内容。. 信息论的主要奠基人香农认为:信息是不确定性的减少或消除。 消息是由符号、文字、数字、语音或图像组成的数据序列; 收到一则消息后,所得的信息量,在数量上等于获得消息前后“不确定性”的消除量。. 通信就是在信源和信宿之间传递消息。 消息中可以包含信息,但消息不等于信息。 消息所包含信息的多少,与在收到消息前对某事件存在的不确定性有关。
E N D
第二章 数据通信基础知识 • 信息、数据与信号 • 信号的分类及特性 • 数据通信系统分析 • 编码与码型
信息的概念 • 信息是消息中包含的有意义的内容。 • 信息论的主要奠基人香农认为:信息是不确定性的减少或消除。 • 消息是由符号、文字、数字、语音或图像组成的数据序列; • 收到一则消息后,所得的信息量,在数量上等于获得消息前后“不确定性”的消除量。 • 通信就是在信源和信宿之间传递消息。 • 消息中可以包含信息,但消息不等于信息。 • 消息所包含信息的多少,与在收到消息前对某事件存在的不确定性有关。 • 消息的传递过程,对接收者来说,是一个从不知到知的过程,或者说是一个从不确定到确定的过程。
信息熵 • “熵”的概念起源于物理学中的热力学,用来表示任何一种能量在空间中分布的均匀程度。它描述了某一种状态自发变化的方向。 • “熵”是无序性的定量量度:把有规则排列的状态称为“低熵”,而混乱的状态对应于“高熵”。 • 信息熵的定义与熵的定义相似,它描述的是信息源的不确定性。 • 信息熵大表示信息源的不确定程度较大,同样是一种无序性 。
信息的度量 • 把传输信息的多少用“信息量”进行衡量。则信息量是对消息中事件不确定性的度量。 • 事件的不确定性可用事件出现的概率来描述。因此,信息量是概率的函数。 • 假设P(x)是一个消息发生的概率,I是从该消息获悉的信息量。 • 则 I = I[P(x)]
信息的度量 • 消息描述的事件出现的概率越小,消息中包含的信息量就越大。且: • 概率P(x)→0时(不可能事件),信息量I→∞ ; • 概率P(x)→1时(必然事件),信息量I→0。 • 若干个互相独立事件构成的消息, 所含信息量等于各独立事件信息量之和, 即I[P(x1)P(x2)…]=I[P(x1)]+I[P(x2)]+…
信息的度量 • 根据香农理论:I = loga(1/P(x))= -loga P(x) • 信息量的单位 • 如果对数以2为底,单位为比特(bit) • 如果对数以e为底,单位为奈特(nat) • 如果对数以10为底,单位为哈特莱(Hartley) • 目前广泛使用的单位为比特。
平均信息量 • 设离散信源是一个由n个符号Si(i=1, 2, 3, …, n)组成的符号集,其中每个符号出现的概率为P(Si), • 当符号数目n的值很大时,Si将出现nP(Si)次,Si的信息量为-nP(Si) loga P(Si) • 于是,每个符号的平均信息量为H=-P(S1) logaP(S1)+[-P(S2) logaP(S2)] +…+[-P(Sn) logaP(Si)] • 对于二进制信息有: H= -∑(P(Si) log2P(Si) ) 信息源的熵, 单位为bit/符号
【例2-1】 • 一信息源由4个符号a、b、c、d组成,他们出现的概率为3/8、1/4、1/4、1/8,且每个符号的出现都是独立的。 • 试求信息源输出为cabacabdacbdaabcadcbabaadcbabaacdbacaacabadbcadcbaabcacba的信息量。
【例2-1】解1 • 信源输出的信息序列中,a:23次,b:14次,c:13次,d:7次,共有57个字符。 • 则根据频度计算: • 出现a的信息量为 23log2(57/23)≈30.11( bit ) • 出现b的信息量为 14log2(57/14)≈28.35( bit ) • 出现c的信息量为 13log2(57/13)≈27.72( bit ) • 出现d的信息量为 7log2(57/7) ≈21.28( bit ) • 平均信息量为 • (30.11+ 28.35+ 27.72+ 21.28)/ 57 = 107.36/57≈1.86
【例2-1】解2 • 信源输出的信息序列中Pa=3/8, Pb=1/4, Pc=1/4,Pd=1/8。 • 则根据公式计算: • 出现a的信息量为 0.375 log2(8/3) • 出现b的信息量为0.25 log2(4) • 出现c的信息量为0.25log2(4) • 出现d的信息量为0.125log2(8) • 平均信息量为H≈1.906
【例2-2】 • 设二进制离散信源,以相等的概率发送数字0或1,则信源每个输出的信息含量为: • P=1/4的信息量为2比特 • P=1/8的信息量为3比特 • P=1/M的信息量为log2 M(bit) • 若M是2的整幂次,M=2K • 则I =-log2P(x)= - log2M=K
数据与信号 • 数据是信息的载体,用来表示信息。 • 数据可以在物理介质上记录或传输并通过外围设备被计算机接受,经过处理而得到结果。 • 实际上,数据是事实或观测的结果,是数字、字母和符号。 • 信息交换就是访问数据及传输数据。 • 信号是数据的具体物理表现形式。数据是借助信号来传输的,是通信中传输的主体。
第二章 数据通信基础知识 • 信息、数据与信号 • 信号的分类及特性 • 数据通信系统分析 • 编码与码型
(1)信号分类 • 连续信号: • 如果在某一时间间隔内,对一切的时间值,除若干不连续的点外,该函数都给出确定的函数值,这种信号就称为连续信号。 • 连续信号的时间函数s(t),对于所有的a,满足: • 离散信号: • 若s(t)不满足该式,且只在某些不连续的瞬间给出函数值,则该信号是离散的。 • 离散信号只取有限个离散值时,称为数字信号。
连续信号和离散信号 • 连续信号和离散信号
模拟信号与数字信号 t t • 模拟信号的特点: • 波动性; • 持续变化; • 反映事物的本质; • 在电信业已经被广泛使用超过100年。 • 数字信号的特点: • 离散性; • 跃变性; • 设备性能先进,较为便宜。
随机信号和确定信号 • 随机信号是指在它出现以前,总有某种程度的不确定性的一种信号。 • 随机信号具有不规则性,但存在规律 • 随机信号不能用单一时间函数表达,应采用概率统计方法分析。 • 确定信号是一种没有不确定值的信号。 • 确定信号可用单一时间函数表达。 • 确定信号可用来分析实际系统,简化问题。
周期信号和非周期信号 • 不管是连续信号还是离散信号,若相同的信号形式能周期性地重复则称为周期信号。 • 用时间函数表示的周期信号满足: • s(t+T)=s(t),T 为信号的周期。 • 非周期信号 • 如不满足s(t+T)=s(t)则该信号为非周期信号。
周期信号 • 周期信号
(2)信号的特性 • 时间特性是指信号随时间变化快慢的特性:周期的长短、信号变化速率及相应的幅值。 • 信号的幅值是信号各个时刻的瞬时值 • 信号的频率是周期的倒数,用赫兹来表示 • 信号的相位是描述周期信号在时间轴上的相对位置,用弧度表示。 • 频率特性表示了组成信号的各频率成分的特性,可以用频谱函数来表示。
信号的频率和振幅 信号的频率和振幅
信号的时域分析方法 • 从时域概念分析,信号是时间的函数。用时域法表示信号时可以清楚地看出信号随时间变化的规律。 • 时域分析的基本手段是把外加的复杂激励信号,在时域中分解成一系列单元激励信号,然后分别计算各个单元信号通过通信系统的响应,最后在输出端叠加而得到总的响应。
信号的频域分析方法 t t • 信号也可以看成是频率的函数。从频域角度分析,信号可以由多个频率成分组成,如: • 它包含三个频率成分,即f1、3f1 和5f1 ,因此,每个信号既是一个时域函数s(t),又是一个频域函数s(f),表示信号的频率组成。
信号及其频谱图 t s(t) F(ω) ω ω1 3ω1 5ω1 • 设: • 信号的角频率为ω,则ω=2πf, • 上述周期信号s(t)的频谱函数为F(ω) • 则下列右图中的每一条谱线代表信号的一个正弦分量,谱线的高度代表了该正弦分量的振幅,谱线的位置代表这一正弦分量的角频率。
频谱与带宽 • 信号的频谱就是它所包含的频率范围。 • 信号的带宽就是它的频谱的宽度,即信号所包含的频率区间。前述信号s(f)的带宽为 5f1-f1=4f1。 • 现实中的许多信号具有无限带宽,但信号的大部分能量都集中在某一段频带之中,这个频带就称为该信号的有效频带。 • 频谱的宽度通常指包含信号大部分能量(功率)的那部分频谱的宽度。因此,通用的带宽定义是半功率带宽。 • 半功率带宽是一个频率区间,在此区间上的频率分量对信号的功率的贡献是整个信号功率的一半。
第二章 数据通信基础知识 • 信息、数据与信号 • 信号的分类及特性 • 数据通信系统分析 • 编码与码型
富里叶分析理论 • 根据富里叶分析理论可知,任何周期函数都可以由(无限个)正弦函数和余弦函数合成。 • 任何持续时间有限的数据信号可以看作周期信号的一段,从而可进行富里叶分析。
富里叶展开的充分条件 • 设时间函数g(t)的周期为T,对g(t)进行富里叶展开的充分条件是: • 函数g(t)在区间T内单值; • 函数g(t)在区间T内的间断点有限; • 函数g(t)在区间T内的最大值和最小值有限; • 函数g(t)在区间T内绝对可积: • 通信系统中常见的周期信号均能满足上述条件。
周期信号的富里叶展开式 • 其中f=1/T是基波频率,C是直流分量; • 谐波的次数越高,则频率越高; • an和bn分别为第n次谐波的正弦及余弦函数的振幅值。 • 振幅的均方根和n次谐波的能量成正比。
富里叶级数合成的方波 • 矩形方波的带宽是无限大的,但信号的大多数能量只是集中在相当窄的频带内。 • 信号的形状越接近正弦波,信号的带宽就越小; • 越接近矩形方波,信号的带宽就越宽。
信号的频谱 • 周期信号频谱:由离散的频率成分,即基波和谐波构成。 • 非周期信号频谱:信号的频率范围为无穷大。根据信号能量衰减的程度来确定其频谱。 • 当频率上升或下降到某一极限频率而使信号能量降低为信号能量最大值一半时,该频率就是频谱的边界。
功率谱密度 • 频域分析的方法必须用信号的时域表达式g(t)来求得傅立叶变换。 • 由于随机信号没有明确的时域表达式,故采用功率谱密度的频域描述法来进行频域分析。 • 功率谱密度是角频率ω的函数,其物理意义是在以ω为中心的单位频谱宽度内,信号的频率分量对信号功率的贡献。
信道的带宽 • 实际上,任何传输介质只能适应有限的频带。 • 信道的带宽指信道能传送的频率范围。信道带宽必须大于被传送的信号的带宽,否则就会出现失真。 • 信号的数据率越高,信号的带宽也就越宽。 • 如果信号的传输率为X比特/秒(即X bps),传输信道的带宽应大于2XHz。 对数字信道,通常以信道每秒能传送的二进制位数(bps)来表示带宽。
信道带宽与数字信号失真的关系 0 1 1 0 0 0 1 0 • 脉冲信号 • 直流分量加基波分量 • 加二次谐波 • 加四次谐波 • 加八次谐波
衰耗和增益 • 在通信系统中,当信号沿着介质传输时,其能量会受到损失而衰减,称为衰耗。 • 衰耗导致系统输出端的电功率小于输入端的电功率。因此,应在信道上设置信号放大装置,以增强信号。 • 若通信系统输出端的电功率大于输入端的电功率,则表明信号在系统中得到了增益。
分贝 • 通常用分贝来表示衰耗和增益。 • 分贝是两个功率电平p1和p2差别的度量,是无量纲的量: D=10lg(p1/p2)(dB)
衰减和增益的计算 • 例:如果10mW功率的信号加到传输线上,而在某距离上测得的功率是5mW则在这段线路上的衰减为 Loss=10lg(5/10)=10×(-0.3)= -3 (dB) • 分贝有时也用来度量电压或电流的差别: • 因为 P=V2/R 或P=I2R • 所以 D=10lg(P2/P1) = 20lg(V2/V1) = 20lg(I2/I1)(dB) • 使用分贝可方便计算整个系统的衰耗或增益。 • 整个传输线路上的衰减或增益等于各分段线路上的衰减与增益的代数和。
失真 • 信号通过传输系统时,其波形可能发生畸变,波形的畸变称为失真。 • 如果构成信号的不同分量通过传输系统后,分别受到不同的衰减和不同的时延,就会造成输出信号的频谱与输入信号的频谱的差异,从而在系统的输出端导致信号的失真。 • 由各频率分量随频率的变化引起的失真叫或振幅失真。这种失真主要来源于设备和线路造成的衰减失真。 • 由不同频率分量的传播速度不一致所引起的失真,称为相位失真或群时延失真。
第二章 数据通信基础知识 • 信息、数据与信号 • 信号的分类及特性 • 数据通信系统分析 • 编码与码型
(1)编码 • 在计算机通信系统中,所有内部信息都是采用二进制表示的。编码是根据一定的规则把外部信息转换成二进制比特流的过程。 • 用编码的方法提高通信的传输效率称为信源编码。 • 为了解决误码问题而采用了检错和纠错码称为信道编码。 • 常用的信息编码有ASCII码、EBCD码、GB码、GBK码等。
ASCII码 • ASCII是美国标准信息交换码的英文缩写。 ASCII码是国际标准,在全世界通用 。 • 常用的7位ASCII码的每个字符都由7个二进制位b6~b0 表示,有128个编码,最多可表示128种字符;其中包括: • 10个数字‘0’~‘9’:30H~39H,顺序排列 • 26个小写字母‘a’~‘z’:61H~7AH ,顺序排列 • 26个大写字母‘A’~‘Z’:41H~5AH ,顺序排列 • 各种运算符号和标点符号等。
ASCII码分类 • 95个可打印或显示的字符:称为图形字符,有确定的结构形状,可在打印机和显示器等输出设备上输出,可通过计算机键盘上找到相应的键。 • 33个控制字符:不可打印或显示,分成5类: • ① 10个传输类控制字符:用于数据传输控制; • ② 6个格式类控制字符,用于控制数据的位置; • ③ 4个设备类控制字符,用于控制辅助设备; • ④ 4个信息分隔类控制字符,用于分隔或限定数据 • ⑤ 9个其他控制字符、空格字符和删除字符。
(2)码型 • 在数据通信系统中,要采用直流信号来表示二进制数据。不同的信号编码方案,产生了不同的码型结构。 • 数字信号编码方案分为单极性编码、极化编码和双极性编码。 • 单极性编码只使用0电平和一个正(或负)电平。由于其直流分量和同步问题,目前在数据通信中基本已经不使用了。
(2)码型 • 双极性编码使用正、零和负三个电平值。它有多种变体,在通信行业广泛使用的是双极性传号交替反转码AMI、双极性8连0替换码B8ZS和3阶高密度双极性码HDB3。 • 极化编码使用正、负两个电平值。它有三个子类:非归零编码、归零编码和双相位编码。在计算机网络通信系统中主要使用的是非归零编码和双相位编码的各种变体。
常用的数字信号编码的码型 二进制数据 0 1 0 0 1 0 1 1 + - ①非归零码 + - ②非归零交替反转码 + - ③曼彻斯特编码 + - ④差分曼彻斯特编码
曼彻斯特与差分曼彻斯特码 • 曼彻斯特编码 • 每个周期有一次电平跳变 • 1:从高跳到低, 0:从低跳到高 • 差分曼彻斯特编码 • 每个周期有一次电平跳变 • 1:周期开始处电平不跳变 • 0:周期开始处电平有跳变 • 应用于IEEE802.3
4B/5B编码 • 在光纤通信种常用的编码为mB/nB码,如4B/5B码: • 这种编码的特点是把要传输的数据每4位分成一组,加上一个冗余位,转换为5位编码。 • 5位编码共有32种组合,但只采用其中的24种,16种对应4位码的16种,8种用作控制码,以表示帧的开始和结束、光纤线路的状态(静止、空闲、暂停)等。 • 标准4B/5B编码用于100Mbps的FDDI PMD和快速以太网100 Base-FX 。