PCI和PCI-E总线介绍 2.1 PCI总线 2.1.1 概述 90年代,随着图形处理技术和多媒体技术的广泛应用,在以Windows为代表的图形用户接口(GUI)进入PC机之后,要求有高速的图形描绘能力和I/O处理能力。这不仅要求图形适配卡要改善其性能,也对总线的速度提出了挑战。实际上当时外设的速度已有了很大的提高,如硬磁盘与控制器之间的数据传输率已达10MB/s以上,图形控制器和显示器之间的数据传输率也达到69MB/s。通常认为I/O总线的速度应为外设速度的3-5倍。因此原有的ISA、EISA已远远不能适应要求,而成为整个系统的主要瓶颈。因此对总线提出了更高的性能要求,从而促使了总线技术进一步发展。 1991年下半年,Intel公司首先提出了PCI的概念,并联合IBM、Compaq、AST、HP、DEC等100多家公司成立了PCI集团,其英文全称为:Peripheral Component Interconnect Special Interest Group(外围部件互连专业组),简称PCISIG。PCI是一种先进的局部总线,已成为局部总线的新标准。 2.1.2 PCI总线的主要性能和特点 PCI总线是一种不依附于某个具体处理器的局部总线。从结构上看,PCI是在CPU和原来的系统总线之间插入的一级总线,具体由一个桥接电路实现对这一层的管理,并实现上下之间的接口以协调数据的传送。管理器提供了信号缓冲,使之能支持10种外设,并能在高时钟频率下保持高性能。PCI总线也支持总线主控技术,允许智能设备在需要时取得总线控制权,以加速数据传送。 a. PCI总线的主要性能 ·支持10台外设 ·总线时钟频率33.3MHz/66MHz ·最大数据传输速率133MB/s ·时钟同步方式 ·与CPU及时钟频率无关 ·总线宽度 32位(5V)/64位(3.3V) ·能自动识别外设 ·特别适合与Intel的CPU协同工作 b.其它特点 ·具有与处理器和存储器子系统完全并行操作的能力 ·具有隐含的中央仲裁系统 ·采用多路复用方式(地址线和数据线)减少了引脚数 ·支持64位寻址 ·完全的多总线主控能力 ·提供地址和数据的奇偶校验 ·可以转换5V和3.3V的信号环境 2.1.3 PCI总线信号定义 ·必要引脚控设备49条 ·目标设备47条 ·可选引脚51条(主要用于64位扩展、中 断请求、高速缓存支持等) ·总引脚数120条(包含电源、地、保留 引脚等) 2.2 PCI Express总线 2.2.1 PCI总线危机 利用PCI总线技术的显示卡,第一次真正地实现了多媒体效果,并且可以支持增强色和真彩色等色彩模式,这与当时只能支持256色的VESA VLB显示卡相比,简直是不可思义。 如果计算机只需要进行上网浏览和软件下载等简单的应用,PCI技术也就足够了。然而时光飞逝,转眼就到了2004年,新的技术和设备层出不穷,特别是游戏和多媒体应用越来越广泛,PCI的工作频率和带宽都已经无法满足需求。此外,PCI还存在IRQ共享冲突,只能支持有限数量设备等问题。 PCI现在已经接近了其性能的极限,工作频率很难提高,工作电压无法轻易降低,同步时钟数据传输受到信号失真的限制,而且其信号路由原则对经济有效的FR4技术是一种限制。虽然也有很多旨在跨越这些限制,以创造更高带宽的通用I/O总线方法,无奈它们在导致了成本急剧升高之外,对性能的增益却是少之又少。 现今的软件应用对硬件平台提出了更多的要求,特别是I/O子系统。用台式机和笔记本电脑等设备,来处理不同来源的视频和音频数据流已经司空见惯了,而在PCI 2.2或者PCI-X规范里对这种与时间有关的数据却缺乏相关的支持。比如视频点播和音频再分配等应用都使服务器受到实时限制。此外,如今的平台需要越来越高的带宽来处理多种同时传输的数据,不能再以同样方式对等处理所有的数据了,因为延迟的实时数据与没有数据一样都毫无意义。 2.2.2 PCI Express 应运而生 对于整个电脑架构来说,PCI总线只有可怜的133MB/s,带宽早已是不堪负荷,处处堵塞。在经历了长达10年的修修补补,PCI总线已经无法满足电脑性能提升的要求,必须由带宽更大、适应性更广、发展潜力更深的新一带总线取而代之,这就是PCI Express总线,由于是第三代输入/输出总线,所以简称3GIO(Third-Generation Input/Output),另外它的开发代号是Arapahoe,所以又称为Arapahoe 总线。 处理器总线随着频率和电压一直都在稳定增长,而内存的带宽为了保持与处理器的速度,也在提高着。但就像上图所示,芯片组充当的是memory hub和I/O hub的作用,内存总线一直在随着处理器的更新换代而改变着。由于总线的带宽是有限的,因此在内存带宽提升的同时,I/O总线也被逐渐减少。 Intel 在2001年春季的IDF上,正式公布了旨在取代PCI总线的第三代I/O 技术,该规范由Intel支持的AWG(Arapahoe Working Group)负责制定。在2002 年4月17日,AWG 正式宣布3GIO 1.0规范草稿制定完毕,并移交PCI-SIG进行审核。开始的时候大家都以为它会被命名为Serial PCI(受到串行ATA的影响),但最后却被正式命名为PCI Express,Express意思是高速、特别快的意思。 2002年7月23日,PCI-SIG正式公布了PCI Express 1.0规范,并且根据开发蓝图,2006年的时候正式推出了Spec2.0(2.0规范)。现在,市场上已经出现了大量的支持PCI Express规范的产品。 2.2.3 PCI Express概述 目前大部分台式PC上的32位、33MHz的PCI总线提供133MB/s的带宽。虽然这对于许多测量应用来说还是足够的,但是存在一些设备,例如1G比特网卡,将会独占总线。而PCI总线体系结构要求总线上的所有设备共享133MB/s的带宽,因此像网卡之类的高带宽的设备会抑制同一系统中的其他设备。PCI Express解决了这些问题,并且已经开始成为新PC上一种标准选择。PCI Express保持了与PCI的软件兼容性,但是使用高速(2.5GB/s)的串行总线替代原物理总线。该总线通过信道上信号的发送和接收来传输数据包,达到每信道单向200MB/s的带宽。您可以将多个信道组合在一起从而得到x1(\单一的\、x2、x4、x8、x12、x16和x32的信道带宽,并且不同于PCI在总线所有设备间共享带宽的是,每个PCI Express设备将得到专用的带宽。 2.2.4 PCI Express主要应用领域 PCI Express总线架构的适用途径非常广,比如桌面电脑、笔记本电脑、企业级别的应用、通讯和工作自动化等。 在桌面电脑来说,它不仅带来了带宽的增加,还同时带来了巨大的性能增益。前面我们说到了,现时的PCI总线无法适应流媒体和即时通讯的需要,而PCI Express则能够很好地解决这个问题。此外,它还能够支持更多的I/O设备,并且完全不需要担心不同的设备会占用中断的问题,因此它没有这个缺陷。更为重要的是,PCI Express的引入,更是令游戏和多媒体爱好者欣喜若狂。由于它海量的带宽,基本上可以满足图形处理器在很长一段时间内的需要,带来了更好的显示效果,真正的采用电影化引擎的游戏,将在很短的时间内出现。 在移动计算平台来说,PCI Express还支持更好的电源管理功能,在便携式计算平台可以说是受益菲浅。再加上Intel引入了全新的主板和电源规范,系统设计商们也能够更加灵活,设计出革新的产品。移动更加简便、性能更加强大、计算更加巧妙。 在企业级别的应用,性能和带宽将比台式电脑得到进一步的提升。随之而来的是,可靠性、适用性、灵活性也同时得到了很大的改善。而且,PCI Express就像USB一样,支持热插拔和热交换,因此它能够保持服务器和工作站无间断地运作,避免由于升级或者更换硬件停机而带来的损失。 在通讯领域来说,PCI Express可以带来商业&集中化的计算处理,建立标准化的节段环境,提高服务质量和使配置更加灵活。总的来说,PCI Express为未来10年内的计算和通讯平台,提供了先进的功能。 作为下一代插入式总线标准的PCI Express正迅速的崛起。然而,在下一个十年它将可能与传统的PCI共存,从而保障现有的基于PCI的测试和控制系统的投资。因为PCI Express软件层完全后向兼容PCI,可以使用在系统中同时使用两个总线并且将之前的PCI设备升级至PCI Express类型而无需作任何的软件改动。而且随着新的PC已经提供PCI Express插槽连同现在已有使用新总线的测量设备,虚拟仪器技术已展现出对应测试和控制系统速度极大提高所带来的好处。 三、H.264压缩算法介绍 ITU-T和ISO/IEC JTC1是目前国际上制定视频编码标准的正式组织,ITU-T的标准称之为建议,并命名为H.26x系列,比如H.261、H.263等。ISO/IEC的标准称为MPEG-x,比如MPEG-1、MPEG-2、MPEG-4等。H.26x系列标准主要用于实时视频通信,比如视频会议、可视电话等;MPEG系列标准主要用于视频存储(DVD) 、视频广播和视频流媒体(如基于Internet、 DSL的视频,无线视频等等)。除了联合开发H.262/MPEG-2标准外,大多数情况下,这两个组织独立制定相关标准。自1997年,ITU-T VCEG与ISO/IEC MPEG再次合作,成立了Joint Video Team (JVT),致力于开发新一代的视频编码标准H.264。1998年1月,开始草案征集;1999年9月,完成了第一个草案;2001年5月,制定了其测试模式TML-8;2002年6月,JVT第5次会议通过了H.264的FCD板;2002年12月,ITU-T在日本的会议上正式通过了H.264标准,并于2003年5月正式公布了该标准。国际电信联盟将该系统命名为H.264/AVC,国际标准化组织和国际电工委员会将其称为14496-10/MPEG-4 AVC。 H.264标准可分为三档: ·基本档次(其简单版本,应用面广); ·主要档次(采用了多项提高图像质量和增加压缩比的技术措施,可用于SDTV、HDTV和DVD等); ·扩展档次(可用于各种网络的视频流传输)。 H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输,网络亲和性好。 3.1 H.264视频压缩系统 H.264标准压缩系统由视频编码层(VCL)和网络提取层(Network Abstraction Layer,NAL)两部分组成。VCL中包括 VCL编码器与VCL解码器,主要功能是视频数据压缩编码和解码,它包括运动补偿、变换编码、熵编码等压缩单元。NAL则用于为VCL提供一个与网络无关的统一接口,它负责对视频数据进行封装打包后使其在网络中传送,它采用统一的数据格式,包括单个字节的包头信息、多个字节的视频数据与组帧、逻辑信道信令、定时信息、序列结束信号等。包头中包含存储标志和类型标志。存储标志用于指示当前数据不属于被参考的帧。类型标志用于指示图像数据的类型。VCL可以传输按当前的网络情况调整的编码参数。 3.2 H.264的特点 H.264和H.261、H.263一样,也是采用DCT变换编码加DPCM的差分编码,即混合编码结构。同时,H.264在混合编码的框架下引入了新的编码方式,提高了编码效率,更贴近实际应用。H.264没有繁琐的选项,而是力求简洁的\回归基本\,它具有比H.263++更好的压缩性能,又具有适应多种信道的能力。H.264的应用目标广泛,可满足各种不同速率、不同场合的视频应用,具有较好的抗误码和抗丢包的处理能力。H.264的基本系统无需使用版权,具有开放的性质,能很好地适应IP和无线网络的使用,这对目前因特网传输多媒体信息、移动网中传输宽带信息等都具有重要意义。 尽管H.264编码基本结构与H.261、H.263是类似的,但它在很多环节做了改进,现列举如下。 3.2.1 多种更好的运动估计 a. 高精度估计 在H.263中采用了半像素估计,在H.264中则进一步采用1/4像素甚至1/8像素的运动估计。即真正的运动矢量的位移可能是以1/4甚至1/8像素为基本单位的。显然,运动矢量位移的精度越高,则帧间剩余误差越小,传输码率越低,即压缩比越高。 在H.264中采用了6阶FIR滤波器的内插获得1/2像素位置的值。当1/2像素值获得后,1/4像素值可通过线性内插获得,对于4:1:1的视频格式,亮度信号的1/4 像素精度对应于色度部分的1/8像素的运动矢量,因此需要对色度信号进行1/8像素的内插运算。 理论上,如果将运动补偿的精度增加一倍(例如从整像素精度提高到1/2像素精度),可有0.5bit/Sample的编码增益,但实际验证发现在运动矢量精度超过1/8像素后,系统基本上就没有明显增益了,因此,在H.264中,只采用了1/4像素精度的运动矢量模式,而不是采用1/8像素的精度。 b. 多宏块划分模式估计 在H.264的预测模式中,一个宏块(MB)可划分成7种不同模式的尺寸,这种多模式的灵活、细微的宏块划分,更切合图像中的实际运动物体的形状,于是,在每个宏块中可包含有1、2、4、8或16个运动矢量。 c. 多参数帧估计 在H.264中,可采用多个参数帧的运动估计,即在编码器的缓存中存有多个刚刚编码好的参数帧,编码器从其中选择一个给出更好的编码效果的作为参数帧,并指出是哪个帧被用于预测,这样就可获得比只用上一个刚编码好的帧作为预测帧的更好的编码效果。 3.2.2 小尺寸4x4的整数变换 视频压缩编码中以往的常用单位为8x8块。在H.264中却采用小尺寸的4?4块,由于变换块的尺寸变小了,运动物体的划分就更为精确。这种情况下,图像变换过程中的计算量小了,而且在运动物体边缘的衔接误差也大为减少。 当图像中有较大面积的平滑区域时,为了不产生因小尺寸变换带来的块间灰度差异,H.264可对帧内宏块亮度数据的16个4x4块的DCT系数进行第二次4x4块的变换,对色度数据的4个4x4块的DC系数(每个小块一个,共4个DC系数)进行2x2块的变换。 H.263不仅使图像变换块尺寸变小,而且这个变换是整数操作,而不是实数运算,即编码器和解码器的变换和反变换的精度相同,没有\反变换误差\。 3.2.3 更精确的帧内预测 在H.264中,每个4?4块中的每个像素都可用17个最接近先前已编码的像素的不同加权和来进行帧内预测。 3.2.4 统一的VLC H.264中关于熵编码有两种方法。 ·统一的VLC(即UVLC:Universal VLC)。UVLC使用一个相同的码表进行编码,而解码器很容易识别码字的前缀,UVLC在发生比特错误时能快速获得重同步。 ·内容自适应二进制算术编码(CABAC:Context Adaptive Binary Arithmetic Coding)。其编码性能比UVLC稍好,但复杂度较高。 3.3 性能优势 H.264与MPEG-4、H.263++编码性能对比采用了以下6个测试速率:32kbit/s、10F/s和QCIF;64kbit/s、15F/s和QCIF;128kbit/s、15F/s和CIF;256kbit/s、15F/s和QCIF;512kbit/s、30F/s和CIF;1024kbit/s、30F/s和CIF。测试结果标明,H.264具有比MPEG和H.263++更优秀的PSNR性能。H.264的 PSNR比 MPEG-4平均要高2dB,比H.263++平均要高3dB。 3.4 新的快速运动估值算法 新的快速运动估值算法UMHexagonS(中国专利)是一种运算量相对于H.264中原有的快速全搜索算法可节约90%以上的新算法,全名叫\非对称十字型多层次六边形格点搜索算法\(Unsymmetrical-Cross Muti-Hexagon Search)\,这是一种整像素运动估值算法。由于它在高码率大运动图像序列编码时,在保持较好率失真性能的条件下,运算量十分低,已被H.264标准正式采纳。 ITU和 ISO合作发展的 H.264(MPEG-4 Part 10)有可能被广播、通信和存储媒体(CD DVD)接受成为统一的标准,最有可能成为宽带交互新媒体的标准。我国的信源编码标准尚未制定,密切关注H.264的发展,制定我国的信源编码标准的工作正在加紧进行。 H.264标准使运动图像压缩技术上升到了一个更高的阶段,在较低带宽上提供高质量的图像传输是H.264的应用亮点。H.264的推广应用对视频终端、网守、网关、MCU等系统的要求较高,将有力地推动视频会议软、硬件设备在各个方面的不断完善。 四、运动检测(移动侦测)技术介绍 4.1 运动检测定义 运动检测是指在指定区域能识别图像的变化,检测运动物体的存在并避免由光线变化带来的干扰。但是如何从实时的序列图像中将变化区域从背景图像中提取出来,还要考虑运动区域的有效分割对于目标分类、跟踪等后期处理是非常重要的,因为以后的处理过程仅仅考虑图像中对应于运动区域的像素。然而,由于背景图像的动态变化,如天气、光照、影子及混乱干扰等的影响,使得运动检测成为一项相当困难的工作。 4.2 运动检测原理 早期的运动检测如MPEG1是对编码后产生的I帧进行比较分析,通过视频帧的比较来检测图像变化是一种可行的途径。原理如下: MPEG1视频流由三类编码帧组成,它们分别是:关键帧(I帧),预测帧(P帧)和内插双向帧(B帧)。I帧按JPEG标准编码,独立于其他编码帧,它是MPEG1视频流中唯一可存取的帧, 每12帧出现一次。截取连续的I帧,经过解码运算,以帧为单位连续存放在内存的缓冲区中,再利用函数在缓冲区中将连续的两帧转化为位图形式,存放在另外的内存空间以作比较之用,至于比较的方法有多种。此方法是对编码后的数据进行处理,而目前的MPEG1/MPEG4编码都是有损压缩,对比原有的图象肯定存在误报和不准确的现象。 下面介绍目前几种常用的方法: a. 背景减除(Background Subtraction) 背景减除方法是目前运动检测中最常用的一种方法,它是利用当前图像与背景图像的差分来检测出运动区域的一种技术。它一般能够提供最完全的特征数据,但对于动态场景的变化,如光照和外来无关事件的干扰等特别敏感。最简单的背景模型是时间平均图像,大部分的研究人员目前都致力于开发不同的背景模型,以期减少动态场景变化对于运动分割的影响。 b. 时间差分(Temporal Difference) 时间差分(又称相邻帧差)方法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分并且阈值化来提取出图像中的运动区域。时间差分运动检测方法对于动态环境具有较强的自适应性,但一般不能完全提取出所有相关的特征像素点,在运动实体内部容易产生空洞现象。 c. 光流(Optical Flow) 基于光流方法的运动检测采用了运动目标随时间变化的光流特性,如Meyer[2]等通过计算位移向量光流场来初始化基于轮廓的跟踪算法,从而有效地提取和跟踪运动目标。该方法的优点是在摄像机运动存在的前提下也能检测出独立的运动目标。然而,大多数的光流计算方法相当复杂,且抗噪性能差,如果没有特别的硬件装置则不能被应用于全帧视频流的实时处理。 当然,在运动检测中还有一些其它的方法,例如运动向量检测法,适合于多维变化的环境,能消除背景中的振动像素,使某一方向的运动对象更加突出的显示出来,但运动向量检测法也不能精确地分割出对象。
好文档 - 专业文书写作范文服务资料分享网站