生物特征识别技术概述
生物特征识别技术是为了进行身份验证而采用自动技术测量其身体特征或是个人行为特点,并将这些特征或特点与数据库的模板数据进行比较,完成认证的一种解决方案。
人的生物特征是惟一的,生物特征识别技术的基本工作就是对这些基本的、可测量或可自动识别和验证的生理特征进行统计分析。过程大多包括四个步骤:图像获取、抽取特征、比较和匹配。生物特征识别系统捕捉到生物特征的样品,惟一的特征将会被提取并且被转化成数字的符号,这些符号被存成个人的特征模板,模板可能会在识别系统中,也可能在各种各样的存储器中,如计算机的数据库、智能卡或条码卡中,人们同识别系统进行交互,认证其身份,以确定匹配或不匹配。
生物特征识别技术是一门利用人的生理上的特征来识别人的科学。和传统方法的不同在于,生物特征识别方法依据的是我们所拥有的东西,是我们的个体特性。生物特征分为身体特征和行为特点两类。身体特征包括:指纹、掌形、眼睛(视网膜和虹膜)、人体气味、脸型、皮肤毛孔、手腕/手的血管纹理和DNA等;行为特点包括:签名、语音、行走的步态、击打键盘的力度等。
下面简要介绍指纹识别、人脸识别、虹膜识别、视网膜识别、掌形识别、语音识别、签名识别等几种比较成熟且应用广泛的生物特征识别技术。
指纹识别
指纹是指手指末端正面皮肤上凸凹不平的纹路。这些纹路的存在增加了皮肤表面的摩擦力,使得我们能够用手抓起重物。尽管指纹只是人体皮肤的一小部分,却蕴含大量的信息。这些皮肤的纹路在图案、断点和交叉点上是各不相同的,在信息处理中将它们称作“特征”。这些特征在每个手指上的表现都是不同的。依靠特征惟一性,可以把一个人与他的指纹对应起来,通过比较他的指纹特征和预先保存的指纹特征,就可以验证其真实身份。
指纹识别技术主要涉及指纹图像采集、指纹图像处理、特征提取、保存数据、特征值的比对与匹配等过程。
首先,通过指纹读取设备读取到人体指纹的图像,并对原始指纹图像进行初步的处理,使之更清晰。然后,指纹识别算法建立指纹的数字表示——特征数据,这是一种单方向的转换,可以从指纹转换成特征数据,但不能从特征数据转换成为指纹,而且两枚不同的指纹不会产生相同的特征数据。特征文件的存储是从指纹图像上找到被称为“细节点”(Minutiae)的数据点(指纹纹路的分叉点或末梢点)。有些算法把细节点和方向信息组合产生了更多的数据,这些方向信息表明了各个节点之间的关系,有些算法也处理整幅指纹图像。总之,这些数据通常称为模板,保存为1KB大小的记录。最后,通过计算机模糊比较的方法,把两个指纹的模板进行比较,计算出它们的相似程度,最终得到两个指纹的匹配结果。目前国际上在数据存储上仍然没有一种模板的标准,也没有一种标准公布的抽象算法,各个厂商自行开发。
相对于其它身份识别技术,指纹识别是一种更为理想的身份确认技术,不仅具有许多独到的信息安全角度的优点,更重要的是还具有很高的实用性和可行性。因为每个人的指纹独一无二,两人之间不存在相同的指纹;每个人的指纹是相当固定的,很难发生变化,指纹不会随着人年龄的增长或身体健康程度的变化而变化;指纹样本便于获取,易于开发识别系统,实用性强,目前已有标准的指纹样本库,方便了识别系统的软件开发,识别系统中完成指纹采样功能的硬件部分也较易实现;一个人的十指指纹皆不相同,因此可以方便地利用多个指纹构成多重口令,提高系统的安全性,并不增加系统设计的负担;指纹识别中使用的模板并非最初的指纹图像,而是由指纹图像中提取的关键特征,因此存储量较小,对输入的指纹图像提取关键特征后,可以大大减少网络传输的负担,支持计算机的网络功能,便于实现异地确认。
人脸识别
人脸识别可以说是人们日常生活中最常用的身份确认手段,也是当前最热门的模式识别研究课题之一。人脸识别就是通过与计算机相连的摄像头动态捕捉人的面部,同时把捕捉到的人脸与预先录入的人员库存人脸进行比较识别。因为人们对这种技术没有任何的排斥心理,所以从理论上讲,人脸识别可以成为一种最友好的生物特征身份认证技术。
人脸识别的优点在于:不需要被动配合,可以用在某些隐蔽的场合,而其他生物特征识别方法都需要一些人的行为配合;这种识别方式可远距离采集人脸;利用已有的人脸数据库资源,可更直观、更方便地核查该人的身份,因此可以降低成本。
但人脸识别的缺点也是显而易见的。人脸的差异性并不是很明显,误识率可能较高;对于双胞胎,人脸识别技术不能区分;人脸的持久性差,例如长胖、变瘦、长出胡须等;人的表情也是丰富多彩的,这也增加了识别的难度;人脸识别受周围环境的影响较大。由于这些困难,人脸识别的准确率不如其它技术。
虹膜识别
虹膜是瞳孔与巩膜之间的环形可视部分,具有终生不变性和差异性。人眼中的虹膜是由随瞳孔直径变化而拉伸的复杂纤维状组织构成。人在出生前的随机生长过程,造成了各自虹膜组织结构的差异。虹膜总体上呈现一种由里到外的放射状结构,包含许多相互交错的类似斑点、细丝、冠状、条纹、隐窝等形状的细微特征。这些特征信息对每个人来说都是惟一的,其惟一性主要是由胚胎发育环境的差异所决定的。通常人们将这些细微特征信息称为虹膜的纹理信息。
与其他生物特征相比,虹膜是一种更稳定、更可靠的生理特征。而且,由于虹膜是眼睛的外在组成部分,因此基于虹膜的身份鉴别系统对使用者来说可以是非接触的。惟一性、稳定性和非侵犯性,使得虹膜识别技术具有广泛的应用前景。
在红外光照射下,反映其图像特征的模拟信号被高分辨率的摄像机接收采样,经数字化后存入计算机,每个虹膜数据长度为256字节,整个过程在系统中瞬间完成。虹膜识别技术的优点是:精确度高;建库和识别的速度快;无需人工干预;用者无需与设备直接接触。而缺点是:虹膜技术对于盲人和眼疾患者无能为力而且系统成本过高,需要比较好的光源,对黑眼睛识别比较困难。
视网膜识别
虽然视网膜识别的技术含量较高,但视网膜识别技术可能是最古老的生物特征识别技术,在20世纪30年代,通过研究就得出了人类眼球后部血管分布惟一性的理论。目前在很多需要极其严格安全保障的场合都安装了视网膜识别系统。
视网膜是一些位于眼球后部十分细小的神经(1/50英寸),它是人眼感受光线并将信息通过视神经传给大脑的重要器官,它同胶片的功能有些类似,用于生物特征识别的血管分布在神经视网膜周围,即视网膜四层细胞的最远处。
在采集视网膜的数据时,扫描器发出一束光射入使用者的眼睛,并反射回扫描器,系统会迅速描绘出眼睛的血管图案并录入到数据库中。眼睛对光的自然反射和吸收被用来描绘一部分特殊的视网膜血管结构。
视网膜识别技术的优点是:这种识别具有相当高的可靠性。视网膜血管分布是具有惟一性的,即使是双胞胎,这种血管分布也是有区别的。除了患有眼疾或者严重的脑外伤外,视网膜的结构形式在人的一生当中都相当稳定。视网膜识别系统误识率低。录入设备从视网膜上可以获得700个特征点,这使得视网膜扫描技术录入设备的误识率低于一百万分之一。视网膜是不可见的,因此也不可能被伪造。
视网膜识别技术的缺点是:首先,采集设备成本较高,采集过程较为烦琐。视网膜扫描设备要获得视网膜图像,使用者的眼睛与录入设备的距离应在半英寸之内,并且在录入设备读取图像时,眼睛必须处于静止状态,因此导致使用不方便,使用者的接受程度较低。其次,视网膜静脉图像的不变性不够好,使得视网膜识别系统的拒识率相对较高。最后,视网膜识别技术可能会对使用者的健康造成损害。
掌形识别
掌形识别也是很早就使用的生物特征识别技术之一,目前很多研究人员也在研究将掌形特征用于个人身份识别系统或作为附加的生物特征融合到已有的识别系统中,这能极大地提高识别系统的可靠性。目前全世界已有超过8000个场所使用了掌形识别技术,包括美国迪斯尼游乐园以及美加边境过境处。
掌形识别技术的优点明显:比对速度快;掌形识别的不能录入率很低;需要的计算机存储空间很小。而缺点主要在于:由于手掌的相似性不是很容易区分,掌形识别技术不能像指纹、人脸和虹膜识别技术那样容易获得内容丰富的数据,不能完成一对多的识别;掌形识别技术的易用性不如其它生物特征识别技术,因为使用者需要知道自己的手掌怎样摆放,要花一定的时间来学习;由于使用者必须与识别设备直接接触,可能会带来卫生方面的问题。
语音识别
语音识别又称声纹识别技术。语音识别可以采用两种方式:第一种是依赖原文。系统将一句话与访问者相联系,对每个访问的人,系统会给出不同的句子提示。应对说话者不断变化的主要方法是动态的变化,这包括一系列的声音向量描述的说话方式,然后计算访问者和允许进入者说话方式的差距。另一种是不依赖原文的。访问者不必说同样的句子,因此系统应用的惟一信息就是访问者的语音特征。
语音识别技术的优点是:系统的成本非常低廉;对使用者来说不需要与硬件直接接触,而且说话是一件很自然的事情,所以语音识别可能是最自然的手段,使用者很容易接受;最适于通过电话来进行身份识别。
语音识别技术的缺点是:准确性太差,同一个人由于音量、语速、语气、音质的变化或其它很多原因容易造成系统的误识;语音可能是所有生物特征中最容易被伪造的,至少现在可以用录在磁带上的语音来进行欺骗;高保真的录音设备是非常昂贵的。
语音特征同样是每个人均不相同。但当模板数量大到一定程度之后,语音特征就不足以惟一区分开每个人,而且它容易受到背景噪音、被检查者的身体状况的影响。因此基于语音特征的识别系统很难达到基于指纹或者视网膜识别系统的准确率。
签名识别
签名识别这项技术已经有很长的历史,在文档证明和交易授权时有广泛的应用。签名识别也被称为签名力学辨识(DSV,Dynamic Signature Verification),它建立在签名时的力度上,分析的是笔的移动,如加速度、压力、方向以及笔划的长度,而不仅仅是签名的图像本身。每个人都有自己独特的书写风格。签名识别有两种形式:静态签名和动态签名。静态签名只使用签名的几何特征;动态签名除了使用签名的几何特征外,还使用书写时的笔顺、速度、力度等特征。
签名识别技术的关键在于区分出不同的签名部分,有些是习惯性的,而另一些在每次签名时都不同。签名识别和语音识别一样,是一种行为测定学。
签名识别技术的优点在于:人类在很久以前就开始使用签名来鉴别身份,因此签名识别对于使用者来说有着良好的心理基础,容易被使用者接受。缺点是签名识别的速度比较慢、所用的硬件设备价格昂贵并且签名很容易被伪造。
多模态识别
随着对社会安全和身份鉴别的准确性和可靠性要求的日益提高,单一的生物特征识别已远远不能满足社会的需要,进而阻碍了该领域更广泛的应用。由于没有任何一个单一的生物特征识别系统足够精确和可靠,因此多特征识别系统的出现是一个可选的策略。比如声音和人脸可以结合在一起组成一个多特征识别系统。随着需求的增加,多模态生物特征识别(Multi-modal biometrics)的研究和应用逐渐兴起和深入。基于多生物特征融合来进行身份鉴别的优点主要有三个方面:准确性,多个生物特征的运用可以提高整个身份鉴别的准确性;可靠性,伪造多个生物特征显然比伪造单个生物特征更为困难;适用性,每种生物特征都存在应用的局限性。
多生物特征与信息的融合密切相关。有许多将信息融入多生物特征之中的方法,下面介绍几种融合信息的方法。
传感器数据级的融合。把从传感器中传出的未经加工的信息直接融合在一起。有两种主要的融合方法:加权求和(综合各种数据消除噪声)和拼凑结构(用几个相机对不同部分拍照,然后拼接)。
特征级融合。从不同传感器中传来数据的描述融合在一起(或者从相同传感器,用不同特征提取技术)。融合时也是采用加权求和(如果特征是对称的)或者简单向量的串连(如果特征是不对称的)。
决策级融合。在这种方式中,可以将不同的识别系统看成相互独立的单元,每一个都作出一个鉴定结果。然后用一个汇总程序综合各个结果得出最终的结论。
意见融合。如果信息交换不是问题的话,各个系统可能不会提供一个确定的结论,但是可以给出一个意见,无论是以数字形式还是以语言的形式,然后控制器将各个意见融合。这样,由于收集到的信息是海量的,因此要求描述也应当详尽。意见给出的形式可能是相似或相异的分数,将他们映射到[0,1]区间。然后经典的方法就是权值求和或求积。
根据生物特征识别技术采用不同的生物特征的不同,以上这些广泛应用的生物特征识别技术可以被分成三类:高级生物特征识别技术,如视网膜识别、虹膜识别和指纹识别等;次级生物特征识别技术,如掌形识别、人脸识别、语音识别、签名识别等;深奥的生物特征识别技术,如血管纹理识别、人体气味识别等。
比尔"盖茨曾做过这样的断言:“生物特征识别技术,利用人的生理特征,例如指纹等来识别个人的身份,将成为今后几年IT产业的重要革新”。因为有越来越多的消费者、公司和政府机关都承认,现有的基于智能卡、身份证或密码的身份识别系统是远远不够的。目前,从最基本的到最尖端的,存在着多种不同级别的安全技术,生物特征识别技术将是最安全的。采用“您本身所具有的”(例如指纹、虹膜、声音等)方式验证身份远比采用“您所拥有的”(例如带照片的身份证件)和“您所知道的”(例如用户号和密码)方式验证身份更可靠、更安全。专家们一致认为身份确认采用生物特征识别技术将彻底改变人们现有的生活方式和商业模式。