生物识别 - 快速指南
生物识别概述
生物识别一词由两个词组成:Bio(希腊语“生命”)和Metrics(测量)。生物识别技术是信息技术的一个分支,旨在根据个人特征确定一个人的身份。
生物识别技术目前是信息安全领域的流行词,因为它可以高度准确地识别个人。
什么是生物识别技术?
生物识别技术是一种用于识别、分析和测量个人的身体和Behave特征的技术。
每个人都有独特的特征,这使他或她与其他人不同。指纹、虹膜颜色、头发颜色、手部几何形状等物理属性,以及说话的语气和口音、签名或电脑键盘按键方式等Behave特征,使一个人与其他人分开。其余的部分。
然后,生物识别系统利用人的这种独特性来:
- 识别并验证一个人。
- 对人员进行身份验证,授予适当的系统操作权限。
- 确保系统安全,避免不道德的操作。
什么是生物识别系统?
生物识别系统是一种将个人的生理、Behave或两者特征作为输入、对其进行分析并识别个人是真实用户还是恶意用户的技术。
生物识别技术的演变
生物识别技术的想法在几年后就出现了。14世纪,中国实行采集商人及其子女的指纹,以将他们与其他人区分开来。指纹识别至今仍在使用。
19 世纪,一位名叫Alphonse Bertillion的人类学家开发了一种通过对人进行身体测量来识别身份的方法(称为Bertillionage )。他意识到,即使人体的某些特征发生了变化,例如头发的长度、体重等,但身体的某些物理特征仍然保持不变,例如手指的长度。这种方法很快就消失了,因为人们发现,仅具有相同身体尺寸的人就可以被误认为是一个人。随后,苏格兰场的理查德·爱德华·亨利开发了一种指纹识别方法。
视网膜识别的想法是由 Carleton Simon 博士和 Isadore Goldstein 博士于 1935 年提出的。1976 年,EyeDentify Inc 投入了研发工作。第一个商用视网膜扫描系统于 1981 年推出。
虹膜识别是由约翰·道格曼 (John Daugman) 于 1993 年在剑桥大学发明的。
2001年,科索沃推出了生物识别自动化工具集(BAT),提供了具体的识别手段。
如今,生物识别技术已成为一个独立的研究领域,拥有建立个人身份的精确技术。
为什么需要生物识别技术?
随着信息技术在银行、科学、医药等领域的使用不断增加,非常需要保护系统和数据免受未经授权的用户的侵害。
生物识别技术用于对个人进行身份验证和授权。尽管这些术语经常结合在一起;他们的意思不同。
身份验证(身份验证)
这个过程试图找出问题的答案,“你是你所声称的那个人吗?”,或者“我认识你吗?” 这是一个人的生物特征与整个数据库的一对多匹配和比较。
确认
这是一对一的匹配过程,将候选人输入的实时样本与数据库中先前存储的模板进行比较。如果两者匹配的相似度超过 70%,则验证成功。
授权
这是向经过身份验证或验证的用户分配访问权限的过程。它试图找出问题的答案:“您是否有资格拥有访问此资源的某些权利?”
传统安全辅助工具的缺点
传统的信息系统安全方法使用身份证、密码、个人识别码(PIN)等。它们具有以下缺点 -
它们都意味着识别与该人相关的某些代码,而不是识别实际生成该代码的人。
- 它们可能会被遗忘、丢失或被盗。
- 它们可以被绕过或很容易受到损害。
- 它们并不精确。
在这种情况下,系统的安全就会受到威胁。当系统需要高水平的可靠保护时,生物识别技术可以通过将身份更贴近个人来提供帮助。
生物识别系统的基本组成部分
一般来说,生物识别系统可分为四个基本组成部分。让我们简单地看看它们 -
输入接口(传感器)
它是生物识别系统的传感组件,可将人类生物数据转换为数字形式。
例如,
金属氧化物半导体 (CMOS) 成像器或电荷耦合器件 (CCD)(用于面部识别、手纹识别或虹膜/视网膜识别系统)。
- 指纹系统中的光学传感器。
- 语音识别系统中的麦克风。
处理单元
处理组件是微处理器、数字信号处理器 (DSP) 或处理从传感器捕获的数据的计算机。
生物特征样本的处理包括 -
- 图像增强示例
- 样本图像标准化
- 特征提取
- 将生物特征样本与数据库中所有存储的样本进行比较。
数据库存储
数据库存储登记的样本,在认证时调用该样本来执行匹配。为了进行识别,可以使用随机存取存储器 (RAM)、闪存 EPROM 或数据服务器中的任何存储器。为了进行验证,使用可移动存储元件,例如接触式或非接触式智能卡。
输出接口
输出接口传达生物识别系统的决定以允许用户访问。这可以是简单的串行通信协议 RS232,也可以是更高带宽的 USB 协议。它还可以是 TCP/IP 协议、射频识别 (RFID)、蓝牙或众多蜂窝协议之一。
生物识别系统的一般工作原理
生物识别系统执行识别和验证有四个一般步骤 -
- 从候选人那里获取实时样本。(使用传感器)
- 从样本中提取突出特征。(使用处理单元)
- 将实时样本与数据库中存储的样本进行比较。(使用算法)
- 提出决定。(接受或拒绝候选人。)
生物特征样本是从候选用户处获取的。从样本中提取突出特征,然后将其与数据库中存储的所有样本进行比较。当输入样本与数据库中的样本之一匹配时,生物识别系统允许该人访问资源;否则禁止。
生物识别术语
生物识别模板- 它是从生物识别样本中提取的独特特征的数字参考。
候选人/受试者- 输入生物特征样本的人。
闭集识别- 已知该人存在于数据库中。
注册- 当候选人第一次使用生物识别系统时,它会记录姓名、地址等基本信息,然后记录候选人的生物特征。
错误接受率 (FAR) - 这是生物识别系统将未经授权的用户错误识别为有效用户的可能性的度量。
提供低 FAR 的生物识别系统可确保高安全性。
错误拒绝率 (FRR) - 这是生物识别系统将授权用户错误地拒绝为无效用户的可能性的度量。
开集识别- 不保证该人存在于数据库中。
任务- 这是生物识别系统在数据库中搜索匹配样本的时间。
生物识别技术的应用领域
生物识别系统在许多应用中都很有用。下面给出了其中的一些 -
- 控制工作场所的访问。
建立真正的公民身份和移民系统的人员身份。
- 对敏感信息和系统应用访问控制。
- 通过法医鉴定犯罪分子。
- 执行在线电子商务交易。
- 减少欺诈和盗窃。
- 执法。
生物识别方式
生物识别模态只不过是生物识别系统的一个类别,具体取决于它作为输入的人类特征的类型。
生物识别技术主要是统计性的。样本中可用的数据越多,系统就越可能是唯一且可靠的。它可以用于与个人身体和特征以及Behave模式的测量有关的各种模式。这些模式根据人的生物特征进行分类。
生物识别方式的类型
人类存在多种特征,可以用作生物识别模式。生物识别方式分为三种类型 -
- 生理
- Behave的
- 生理和Behave方式的结合
下表收集了这三种模式的区别点 -
生理形态 | Behave形态 | 两种方式的结合 |
---|---|---|
这种形态与身体的形状和大小有关。 | 这种模式与人类Behave随时间的变化有关。 | 这种模式包括这两种特征,其中特征取决于身体和Behave的变化。 |
例如 -
|
例如 -
|
例如 - 语音识别 它取决于人的健康状况、声带、鼻腔、口腔、嘴唇形状等的大小和形状,以及人的情绪状态、年龄、疾病(Behave)。 |
在后续章节中,我们将更详细地讨论每种模式。
生理方式
如前所述,生理模态基于对人体部位的直接测量,例如虹膜、指纹、形状和手指的位置等。
有一些身体特征在人的一生中保持不变。它们可以成为识别个人身份的极好资源。
指纹识别系统
它是最知名和最常用的生物识别解决方案,用于在生物识别系统上对人员进行身份验证。它如此受欢迎的原因是有十种可用的生物识别来源并且易于获取。
每个人都有一个独特的指纹,由脊线、凹槽和线条方向组成。脊的基本形态有拱形、环形和螺纹三种。指纹的唯一性是由这些特征以及分叉和斑点(脊线末端)等细节特征决定的。
指纹是最古老、最流行的识别技术之一。指纹匹配技术分为三种类型 -
基于细节的技术- 在这些细节中找到点,然后映射到它们在手指上的相对位置。存在一些困难,例如如果图像质量低,则很难正确找到细节点。另一个难点是,它考虑了脊和沟的局部位置;不是全球性的。
基于相关的方法- 它使用更丰富的灰度信息。它能够处理质量较差的数据,从而克服了基于细节的方法的问题。但它也有一些自己的问题,比如点的本地化。
基于模式(基于图像)匹配- 基于模式的算法比较存储模板和候选指纹之间的基本指纹模式(拱形、螺纹和环形)。
手指识别系统的优点
- 这是最现代的方法。
- 这是最经济的方法。
- 它高度可靠且安全。
- 它适用于较小的模板尺寸,从而加快了验证过程。
- 它消耗更少的内存空间。
手指识别系统的缺点
- 疤痕、割伤或手指缺失都会阻碍识别过程。
- 该系统可以通过使用蜡制成的人造手指来欺骗。
- 它涉及与系统的物理接触。
- 他们在进入样本时留下了手指的图案。
手指识别系统的应用
- 验证驾驶执照的真实性。
- 检查驾驶执照的有效性。
- 边境管制/签证签发。
- 组织中的访问控制。
人脸识别系统
面部识别基于确定下巴、下巴的形状和大小,以及眼睛、眉毛、鼻子、嘴唇和颧骨的形状和位置。2D 面部扫描仪开始读取面部几何形状并将其记录在网格上。面部几何形状以点的形式传输到数据库中。比较算法执行面部匹配并得出结果。面部识别通过以下方式进行 -
面部指标- 在这种类型中,测量瞳孔之间或从鼻子到嘴唇或下巴的距离。
特征脸- 这是将整个面部图像分析为多个面部的加权组合的过程。
皮肤纹理分析- 定位人皮肤上明显的独特线条、图案和斑点。
人脸识别系统的优点
- 它提供了在数据库中轻松存储模板的功能。
- 它降低了识别人脸图像的统计复杂度。
- 它不涉及与系统的物理接触。
人脸识别系统的缺点
- 面部特征随着时间的推移而变化。
- 例如,在同卵双胞胎的情况下,无法保证唯一性。
如果候选人的脸部表现出不同的表情,例如浅笑,那么就会影响结果。
- 它需要足够的照明才能获得正确的输入。
人脸识别系统的应用
- 一般身份验证。
- 访问控制验证。
- 人机交互。
- 犯罪分子鉴定。
- 监视。
虹膜识别系统
虹膜识别基于人眼的虹膜图案进行工作。虹膜是有色素的弹性组织,中心有可调节的圆形开口。它控制瞳孔的直径。在成年人中,虹膜的质地在其一生中都是稳定的。左眼和右眼的虹膜图案不同。虹膜的图案和颜色因人而异。
它涉及使用功能强大的相机拍摄虹膜照片,将其存储,并使用数学算法将其与候选眼睛进行比较。
虹膜识别系统的优点
它非常准确,因为两个虹膜匹配的几率是百亿分之一。
它具有高度可扩展性,因为虹膜图案在人的一生中保持不变。
考生无需摘除眼镜或隐形眼镜;它们不会影响系统的准确性。
它不涉及与系统的物理接触。
由于模板尺寸较小,它可以提供即时验证(2 至 5 秒)。
虹膜识别系统的缺点
- 虹膜扫描仪价格昂贵。
- 高质量图像可以欺骗扫描仪。
- 人需要保持头部静止才能进行准确扫描。
虹膜识别系统的应用
国家安全和身份证,例如印度的Adhaar 卡。
谷歌使用虹膜识别来访问其数据中心。
手形识别系统
它包括测量手掌的长度和宽度、表面积、手指的长度和位置以及手的整体骨骼结构。一个人的手是独一无二的,可以用来识别一个人与其他人。有两个手部几何系统 -
基于接触- 将手放在扫描仪的表面上。该位置由五个销钉定位,引导候选手针对相机正确定位。
少接触- 在这种方法中,手部图像采集不需要引脚或平台。
手形识别系统的优点
- 它坚固且用户友好。
- 皮肤水分或质地的变化不会影响结果。
手形识别系统的缺点
- 由于手的几何形状不是唯一的,因此它不是很可靠。
- 它对成年人有效,但对成长中的儿童无效。
如果考生的手上有珠宝、石膏或关节炎,则可能会带来问题。
手形识别系统的应用
核电站和军事使用手部几何识别进行访问控制。
视网膜扫描系统
视网膜是眼球后部的衬层,覆盖眼球内表面的 65%。它含有感光细胞。由于供应血液的血管网络复杂,每个人的视网膜都是独一无二的。
它是一种可靠的生物识别技术,因为视网膜图案在人的一生中保持不变,除非患有糖尿病、青光眼或某些退行性疾病的人的图案除外。
在视网膜扫描过程中,要求一个人摘下镜片或眼镜。将低强度红外光束投射到人眼中 10 到 15 秒。在扫描过程中,该红外光被血管吸收,形成血管图案。然后该模式被数字化并存储在数据库中。
视网膜扫描系统的优点
- 它无法被伪造。
它非常可靠,因为错误率为千万分之一(几乎为 0%)。
视网膜扫描系统的缺点
它不是很用户友好,因为用户需要保持稳定,这可能会导致不适。
它往往会暴露一些不良的健康状况,例如高血压或糖尿病,从而导致隐私问题。
结果不准确容易引发白内障、青光眼、糖尿病等疾病。
视网膜扫描系统的应用
- 一些政府机构(例如 CID、FBI 等)实行这种做法。
除了安全应用之外,它还用于眼科诊断。
DNA识别系统
脱氧核糖核酸( DNA ) 是在人类中发现的遗传物质。除同卵双胞胎外,每个人都可以通过位于细胞核中的 DNA 中的特征进行唯一识别。DNA 模式的收集来源有很多,例如血液、唾液、指甲、头发等。
在细胞内,DNA 被组织成称为染色体的长双螺旋结构。人类有23对染色体。在总共 46 条染色体中,后代从亲生父母那里继承了 23 条染色体。后代 99.7% 的 DNA 与其父母相同。剩余的 0.3% DNA 包含个体独有的重复编码。
DNA 分析的基本步骤是 -
从血液、唾液、头发、精液或组织采集的样本中分离 DNA。
将 DNA 样本分成较短的片段。
根据大小组织 DNA 片段。
比较不同样本的 DNA 片段。
样本越详细,比较就越精确,进而识别个体就越精确。
DNA 生物识别技术与其他生物识别技术的不同之处如下:
它需要有形的物理样本而不是图像。
DNA 匹配是在物理样本上进行的。没有特征提取或模板保存。
DNA识别系统的优点
它提供最高的准确度。
DNA识别系统的缺点
- 从样品采集到结果的过程时间较长。
- 提供更多信息,会带来隐私问题。
- 它需要更多的存储空间。
- 采样污染或样品降解可能会影响结果。
DNA识别系统的应用
- 主要用于证明有罪或无罪。
- 它用于物理和网络安全。
Behave方式
Behave生物识别技术涉及人们表现出的Behave或人们执行诸如行走、签名和敲键盘等任务的方式。
Behave生物识别模式具有更大的变化,因为它们主要取决于疲劳、情绪等外部因素。与基于生理生物识别的解决方案相比,这会导致更高的 FAR 和 FRR。
步态识别
步态是一个人行走的方式。人们在行走时表现出不同的特征,例如身体姿势、行走时两脚之间的距离、摇摆等,这有助于独特地识别他们。
基于分析候选人行走视频图像的步态识别。通过视频记录候选人步行周期的样本。然后分析样本的膝盖和脚踝等关节的位置,以及行走时它们之间形成的角度。
为每个候选人创建相应的数学模型并将其存储在数据库中。在验证时,将该模型与候选行走的实时样本进行比较以确定其身份。
步态识别系统的优点
它是非侵入性的。
它不需要候选人的配合,因为它可以远距离使用。
它可用于通过发现帕金森病患者步行模式的变化来确定医疗疾病。
步态识别系统的缺点
对于这种生物识别技术,到目前为止还没有开发出完全准确的模型。
它可能不如其他已建立的生物识别技术可靠。
步态识别系统的应用
它非常适合识别犯罪场景中的罪犯。
签名识别系统
在这种情况下,更多地强调签名的Behave模式,而不是签名在图形方面的外观。
Behave模式包括书写过程中书写时机、停顿、压力、笔画方向和速度的变化。复制签名的图形外观可能很容易,但用签名时表现出的相同Behave来模仿签名并不容易。
该技术由一支笔和一个专门的书写板组成,两者都连接到计算机以进行模板比较和验证。高质量的平板电脑可以捕捉手语时的Behave特征,例如速度、压力和时机。
在登记阶段,考生必须在书写板上多次签名以获取数据。然后,签名识别算法提取独特的特征,例如时间、压力、速度、笔画方向、签名路径上的重要点以及签名的大小。该算法为这些点分配不同的权重值。
识别时,候选人输入签名的实时样本,并将其与数据库中的签名进行比较。
签名识别系统的约束
为了获取足够的数据量,签名应该足够小以适合平板电脑并且足够大以能够处理。
手写板的质量决定了签名识别登记模板的鲁棒性。
候选人必须在与注册时相同的环境和条件下执行验证过程。如果有更改,则注册模板和实时样本模板可能会有所不同。
签名识别系统的优点
签名识别过程对冒名顶替者具有很高的抵抗力,因为模仿与签名相关的Behave模式非常困难。
它在大额商业交易中非常有效。例如,在打开和签署任何机密文件之前,可以使用签名识别来积极验证参与交易的业务代表。
- 它是一种非侵入性工具。
我们都在某种商业活动中使用我们的签名,因此实际上不涉及隐私权问题。
即使系统被黑客攻击,模板被盗,也可以轻松恢复模板。
签名识别系统的缺点
实时示例模板很容易随着签名时Behave的变化而发生变化。例如,用石膏手签名。
用户需要习惯使用签名平板电脑。在发生之前,错误率很高。
签名识别系统的应用
- 它用于文件验证和授权。
芝加哥大通曼哈顿银行被称为第一家采用签名识别技术的银行。
按键识别系统
第二次世界大战期间,军事情报部门使用一种称为“发送者之拳”的技术,根据打字的节奏来确定莫尔斯电码是由敌人还是盟友发送的。如今,按键动态是在硬件方面最容易实现的生物识别解决方案。
该生物识别分析候选人的打字模式、节奏和键盘打字速度。停留时间和飞行时间测量用于击键识别。
停留时间- 按下按键的持续时间。
飞行时间- 释放一个键和按下下一个键之间经过的时间。
候选人在键盘上打字的方式不同,包括找到正确键所需的时间、飞行时间和停留时间。他们的打字速度和节奏也根据他们对键盘的舒适程度而变化。击键识别系统每秒监控数千次键盘输入,尝试根据用户的打字习惯来识别用户。
有两种类型的击键识别 -
静态- 这是交互开始时的一次性识别。
连续的-贯穿整个交互过程。
击键动力学的应用
击键识别用于识别/验证。它与用户 ID/密码一起使用作为多因素身份验证的一种形式。
它用于监视。某些软件解决方案会在最终用户不知情的情况下跟踪每个用户帐户的击键Behave。此跟踪用于分析该帐户是否被真实帐户所有者以外的其他人共享或使用。它用于验证某些软件许可证是否正在共享。
按键识别系统的优点
- 它不需要特殊的硬件来跟踪这种生物特征。
- 这是一种快速、安全的识别方式。
- 打字的人不必担心被监视。
- 用户无需进行注册或输入实时样本的培训。
击键识别系统的缺点
由于疲劳、疾病、药物或酒精的影响、键盘的更换等,考生的打字节奏可能会在几天内或一天内发生变化。
不存在专门用于执行区分信息的已知特征。
语音识别
语音识别生物识别模式是生理模式和Behave模式的结合。语音识别只不过是声音识别。它依赖于受以下因素影响的功能 -
生理成分- 人的声带、嘴唇、牙齿、舌头和口腔的物理形状、大小和健康状况。
Behave成分- 说话时人的情绪状态、口音、语气、音高、说话速度、咕哝等。
语音识别系统
语音识别也称为说话人识别。注册时,用户需要对着麦克风说出单词或短语。这是获取候选人的语音样本所必需的。
来自麦克风的电信号由模数 (ADC) 转换器转换为数字信号。它作为数字化样本记录到计算机内存中。然后,计算机将候选人的输入语音与存储的数字化语音样本进行比较并尝试匹配,并识别该候选人。
语音识别方式
语音识别有两种变体——说话者相关和说话者无关。
与说话人相关的语音识别依赖于对候选人特定语音特征的了解。该系统通过语音训练(或注册)来学习这些特征。
在使用该系统来识别所说内容之前,需要对用户进行培训,使其适应特定的口音和语气。
如果只有一个用户要使用该系统,这是一个不错的选择。
与说话人无关的系统能够通过限制语音的上下文(例如单词和短语)来识别来自不同用户的语音。这些系统用于自动电话接口。
他们不需要对每个用户进行系统培训。
如果不需要识别每个候选人的语音特征,那么它们是供不同个人使用的不错选择。
语音和语音识别之间的区别
误认为说话人识别与语音识别相同;但它们是不同的技术。让我们看看如何 -
说话人识别(语音识别) | 语音识别 |
---|---|
语音识别的目标是识别谁在说话。 | 语音识别旨在理解和理解所说的内容。 |
它用于通过分析语气、音调和口音来识别一个人。 | 它用于免提计算、地图或菜单导航。 |
语音识别的优点
- 它很容易实现。
语音识别的缺点
- 它容易受到麦克风质量和噪音的影响。
无法控制影响输入系统的因素会显着降低性能。
一些说话人验证系统还容易受到录制语音的欺骗攻击。
语音识别的应用
- 进行电话和互联网交易。
使用基于交互式语音应答 (IRV) 的银行和医疗系统。
- 对数字文档应用音频签名。
- 娱乐和紧急服务。
- 在在线教育系统中。
多模态生物识别系统
到目前为止我们讨论的所有生物识别系统都是单模态的,采用单一信息源进行身份验证。顾名思义,多模式生物识别系统的工作原理是从两个或多个生物识别输入接受信息。
多模式生物识别系统增加了系统从用户处获取的用于身份验证的输入信息的范围和种类。
为什么需要多模态生物识别技术?
单模态系统必须应对各种挑战,例如缺乏保密性、样本的非通用性、用户在处理系统时的舒适度和自由度、对存储数据的欺骗攻击等。
其中一些挑战可以通过采用多模式生物识别系统来解决。
其要求还有几个原因,例如 -
多种特征的可用性使得多式联运系统更加可靠。
多模式生物识别系统提高了用户数据的安全性和保密性。
多模态生物识别系统采用融合策略来结合每个子系统的决策,然后得出结论。这使得多模式系统更加准确。
如果任何标识符由于已知或未知的原因而无法工作,系统仍然可以通过使用其他标识符来提供安全性。
多模态系统可以通过应用活性检测技术来提供有关输入样品“活性”的知识。这使他们能够检测和处理欺骗Behave。
多模态生物识别系统的工作原理
多模态生物识别系统具有单模态系统所具有的所有常规模块 -
- 采集模块
- 特征提取模块
- 比较模块
- 决策模块
此外,它还具有融合技术,可以集成来自两个不同身份验证系统的信息。融合可以在以下任何级别进行 -
- 在特征提取过程中。
- 将活体样本与存储的生物识别模板进行比较。
- 在决策过程中。
在初始阶段集成或融合信息的多模态生物识别系统被认为比在后期阶段集成信息的系统更有效。明显的原因是,早期阶段包含比比较模块的匹配分数更准确的信息。
多模态生物识别系统中的融合场景
在多模式生物识别系统中,特征和组件的数量可能多种多样。它们可以如下 -
- 单一生物特征,多个传感器。
单一生物特征,多个分类器(例如,基于细节的匹配器和基于纹理的匹配器)。
单个生物识别特征,多个单位(例如,多个手指)。
个体的多种生物特征(例如虹膜、指纹等)
然后对这些特征进行操作以确认用户的身份。
多模式生物识别系统的设计问题
在设计多模式生物识别系统时,您需要考虑许多因素 -
- 您需要引入的安全级别。
- 将使用该系统的用户数量。
- 您需要获取的生物特征类型。
- 用户生物识别特征的数量。
- 多个生物特征需要整合的级别。
- 整合信息所采用的技术。
- 开发成本与系统性能之间的权衡。
生物识别方式选择
为了能够选择合适的生物识别系统,您需要对它们进行各个方面的比较。您需要评估系统在便利性、系统规格和性能以及预算方面是否适合您的要求。
您可以通过研究各种有效性标准来选择最合适的生物识别系统。
有效生物识别系统的标准
衡量生物识别系统有效性的七个基本标准 -
唯一性- 它决定生物识别系统从一组用户中识别用户的唯一性。这是一个主要标准。
普遍性- 它表示对世界上每个人的独特特征的要求,这是无法复制的。这是次要标准。
持久性- 表示记录的个人特征需要在数据库中在一定时间内保持不变。
可收藏性- 一个人的特征可以被获取、测量或进一步处理的难易程度。
性能- 它是系统在准确性、速度、故障处理和鲁棒性方面的效率。
可接受性- 这是用户友好性,或者用户接受技术的程度,以便他们合作让他们的生物特征被捕获和评估。
规避- 这是使用人工制品或替代品模仿特征的难易程度。
各种生物识别方式的比较
让我们用以下术语比较所有生物识别系统 -
生物特征 | 普遍性 | 独特性 | 持久性 | 收集能力 | 表现 | 可接受性 | 规避 |
---|---|---|---|---|---|---|---|
指纹识别 | 中等的 | 高的 | 高的 | 中等的 | 高的 | 中等的 | 高的 |
人脸识别 | 高的 | 低的 | 中等的 | 高的 | 低的 | 高的 | 低的 |
手的几何形状 | 中等的 | 中等的 | 中等的 | 高的 | 中等的 | 中等的 | 中等的 |
虹膜识别 | 高的 | 高的 | 高的 | 中等的 | 高的 | 低的 | 高的 |
视网膜扫描 | 高的 | 高的 | 中等的 | 低的 | 高的 | 低的 | 高的 |
脱氧核糖核酸 | 高的 | 高的 | 中等的 | 高的 | 高的 | 低的 | 低的 |
按键 | 高的 | 低的 | 低的 | 高的 | 中等的 | 高的 | 高的 |
签名 | 低的 | 低的 | 低的 | 高的 | 低的 | 高的 | 低的 |
嗓音 | 中等的 | 低的 | 低的 | 中等的 | 低的 | 高的 | 低的 |
您可以根据需要处理的标准选择合适的生物识别系统,如下表所示。
生物识别系统性能
生物识别系统制造商声称系统性能很高,但在实际操作环境中实际上很难实现。可能的原因是,在受控环境设置中进行的测试、硬件限制等。
例如,语音识别系统只能在安静的环境中有效工作,面部识别系统在控制照明条件的情况下可以正常工作,并且可以训练考生清洁并将手指正确地放在指纹扫描仪上。
然而,在实践中,这样的理想条件在目标操作环境中可能并不存在。
性能测量
生物识别系统的性能测量与错误拒绝率 (FRR) 和错误接受率 (FAR) 密切相关。
FRR也称为I 类错误或错误不匹配率 (FNMR),它表示合法用户被系统拒绝的可能性。
FAR称为II 类错误或错误匹配率 (FMR),它表示系统接受虚假身份声明的可能性。
理想的生物识别系统预计 FAR 和 FRR 的值均为零。意味着它应该接受所有真实用户并拒绝所有虚假身份声明,这实际上是不可能实现的。
FAR和FRR彼此成反比。如果 FAR 提高,那么 FRR 就会下降。提供高 FRR 的生物识别系统可确保高安全性。如果 FRR 太高,则系统需要多次输入实时样本,这会降低效率。
当前生物识别技术的性能还远未达到理想状态。因此,系统开发人员需要根据安全要求在这两个因素之间保持良好的平衡。
模式识别与生物识别
模式识别涉及识别模式并再次确认它。一般来说,图案可以是指纹图像、手写草书、人脸、语音信号、条形码或互联网上的网页。
各个模式通常根据其属性分为不同的类别。当具有相同属性的模式组合在一起时,得到的组也是一个模式,通常称为模式类。
模式识别是观察、区分感兴趣的模式以及对模式或模式类别做出正确决策的科学。因此,生物识别系统通过将模式识别与存储的模板进行比较来应用模式识别来对个体进行识别和分类。
生物识别中的模式识别
模式识别技术执行以下任务 -
分类- 识别手写字符、验证码,区分人类和计算机。
分割- 检测图像中的文本区域或面部区域。
句法模式识别- 确定一组数学符号或运算符如何相关,以及它们如何形成有意义的表达式。
下表强调了模式识别在生物识别中的作用 -
模式识别任务 | 输入 | 输出 |
---|---|---|
字符识别(签名识别) | 光信号或笔画 | 角色名称 |
说话人识别 | 嗓音 | 说话人身份 |
指纹、面部图像、手部几何图像 | 图像 | 用户身份 |
模式识别的组成部分
模式识别技术将人类特征的随机模式提取为紧凑的数字签名,可以作为生物标识符。生物识别系统使用模式识别技术对用户进行分类并单独识别他们。
模式识别的组成部分如下 -
模式识别中的流行算法
最流行的模式生成算法是 -
最近邻算法
您需要获取未知个体的向量并计算其与数据库中所有模式的距离。最小距离给出最佳匹配。
反向传播(Backprop)算法
这是一个有点复杂但非常有用的算法,涉及大量数学计算。
信号处理和生物识别
现实世界中我们可以获得各种各样的信号,如声音、光、无线电信号、人体的生物医学信号等。所有这些信号都以连续的信息流的形式存在,称为模拟信号。人声是我们从现实世界获得并用作生物识别输入的一种信号。
什么是信号?
信号是包含一些信息的可测量的物理量,可以传送、显示、记录或修改。
生物识别中的信号处理
处理信号有多种原因。由于各种原因,生物识别系统需要语音处理 -
- 从候选人的样本中提取有意义的信息。
- 去除样本中的噪音。
- 使样品可传输。
- 消除样品的变形。
模拟信号处理模块将声波等现实世界信息转换为0和1的形式,使其能够被生物识别系统等当代数字系统理解和使用。击键、手形、签名和语音属于信号处理和模式识别领域。
数字信号处理系统 (DSP)
有两种类型的信号:模拟信号和数字信号。模拟信号是不间断的、连续的信息流,而数字信号是由 0 和 1 组成的流。
DSP 系统是生物识别系统的重要组成部分之一,它通过使用模数转换器 (ADC) 进行采样和数字化,将模拟信号转换为离散数字值流。
DSP 是单芯片数字微型计算机,可处理摄像头、指纹传感器、麦克风等电子传感器产生的电信号。
生物识别中的 DSP
DSP 使生物识别系统变得更小、更容易携带、更高效地运行并且整体成本更低。
DSP 架构旨在支持涉及大量乘法和加法的复杂数学算法。借助算术逻辑单元 (ALU) 内的乘法/累加 (MAC) 硬件,DSP 可以在单个周期内执行乘法/加法。
它还可以通过使用二维快速傅里叶变换 (FFT) 和有限红外滤波器来增强捕获图像的分辨率。
生物识别与图像处理
图像在这个信息时代占有巨大的份额。在生物识别中,需要进行图像处理来识别其生物识别图像先前存储在数据库中的个人。人脸、指纹、虹膜等都是基于图像的生物识别技术,需要图像处理和模式识别技术。
为了使基于图像的生物识别系统准确工作,它需要以非常清晰且不掺假的形式提供用户生物识别的样本图像。
生物识别中图像处理的要求
用户生物识别图像被输入生物识别系统。该系统被编程为使用方程来操纵图像,然后存储每个像素的计算结果。
为了有选择地增强数据中的某些精细特征并消除某些噪声,数字数据要经过各种图像处理操作。
图像处理方法可以分为三个功能类别 -
图像修复
图像修复主要包括 -
- 减少采集样本时图像中引入的噪声。
- 消除生物识别登记过程中出现的扭曲。
图像平滑可减少图像中的噪声。通过用相邻像素的平均值替换每个像素来进行平滑。生物识别系统使用各种滤波算法和降噪技术,例如中值滤波、自适应滤波、统计直方图、小波变换等。
图像增强
图像增强技术提高图像任何部分或特征的可见性,并抑制其他部分的信息。仅在恢复完成后才进行。它包括增亮、锐化、调整对比度等,以便图像可用于进一步处理。
特征提取
从图像中提取两种类型的特征,即 -
一般特征- 用于描述图像内容的特征,例如形状、纹理、颜色等。
特定于领域的特征- 它们是依赖于应用程序的特征,例如面部、虹膜、指纹等。Gabor 滤波器用于提取特征。
当从图像中提取特征时,需要选择合适的分类器。广泛使用的分类器最近邻分类器,它将候选图像的特征向量与数据库中存储的图像的向量进行比较。
B 样条曲线是用于描述指纹生物识别系统中的曲线模式的近似值。B 样条的系数用作特征。在虹膜识别系统中,使用离散小波变换(DWT)对虹膜图像进行分解,然后将DWT系数用作特征。
生物识别系统安全
生物识别系统的操作在很大程度上取决于受到操作限制的输入设备。有时,设备本身可能无法捕获必要的输入样本。他们可能无法充分捕获样本。这使得系统不可靠且容易受到攻击。
生物识别系统越脆弱,就越不安全。
生物识别系统漏洞
生物识别系统脆弱性有两个主要原因 -
系统故障
生物识别系统可能无法工作的方式有两种 -
内在故障- 它们是诸如传感器不工作、特征提取、匹配或决策模块故障等故障。
由于攻击而失败- 这是由于生物识别系统设计中的漏洞、攻击者无法进行任何计算、不道德的系统管理员的内部攻击等造成的。
非安全基础设施
如果生物识别系统的硬件、软件和用户数据得不到保护,恶意用户就可以访问该系统。
生物识别系统安全风险
生物识别系统的安全性非常重要,因为生物识别数据不容易撤销或替换。生物识别系统的安全性存在以下突出风险 -
用户数据被盗的风险
如果生物识别系统存在漏洞,黑客就可以破坏其安全性并收集数据库中记录的用户数据。它对隐私造成更多危害。
用户数据泄露的风险
获取生物特征样本后,黑客可以向系统提供虚假样本。如果用户数据受到损害,它将永远受到损害。显而易见的原因是,与密码或身份证不同,用户拥有的生物识别信息数量有限,并且难以更换。
尽管生物特征数据被加密和存储,但为了匹配目的需要对其进行解密。在匹配时,黑客可能会破坏安全性。
生物识别系统安全
提出了许多解决方案来解决生物识别系统的安全问题。生物识别模板永远不会以原始形式存储。它们是加密的;有时甚至两次。
就生物识别而言,涉及各种资源,例如人类(受试者或候选人)、实体(系统组件或流程)和生物识别数据(信息)。机密性、完整性、真实性、不可否认性和可用性的安全要求在生物识别中至关重要。让我们简单地回顾一下它们 -
真实性
它是纯粹、真实或原创的品质或状态,而不是被复制的。当信息与创建、存储或传输时的状态和质量相同时,信息就是真实的。
生物识别系统中有两种真实性:实体真实性和数据来源真实性。实体真实性确认参与整个处理的所有实体都是它们声称的实体。数据来源真实性保证数据的真实性和原创性。例如,生物识别数据是用传感器设备捕获的。来自真实传感器的捕获数据并非来自之前的记录。
保密
它限制授权用户的信息访问和披露,并防止未经授权的人员访问或披露信息。就生物识别系统而言,它主要指捕获和存储时的生物识别和相关认证信息,需要对未经授权的实体保密。
生物识别信息只能由其所属人员完全访问。在识别和变异过程中,需要通过适当的安全措施来限制访问候选者。
正直
完整和不变的条件是指其一致性、准确性和正确性。对于生物识别系统来说,完整性应该很高。操作和存储过程中的任何恶意操作都应通过通知和纠正来避免或尽早发现。
不可否认性
它是对所涉及资源(例如实体和组件)的标识。它也被视为问责制。例如,它禁止生物特征信息的发送者或接收者否认已发送或接收生物特征信息。
可用性
如果一组实体的所有成员都可以访问该资源,则该资源具有相对于该组实体的可用性的属性。称为可达性的一个方面确保可以或不能联系人类或系统进程,具体取决于用户的兴趣。
攻击者可以使系统无法供真正用户使用,从而阻止他们使用经过身份验证的应用程序。这些攻击者的目标是信息的可用性。
生成生物识别模板的标准
以下是生成生物识别模板的标准 -
确保模板来自人类候选者并由真正的传感器和软件捕获。
通过具有不可逆属性的加密来保护生物识别模板。这使得黑客很难从安全模板计算原始生物识别信息。
创建一个不讨人喜欢(独特)的生物识别模板。生物识别系统不应能够访问记录到另一个生物识别系统中的同一候选人的模板。如果黑客设法从一个生物识别系统检索生物识别模板,他应该无法使用该模板通过另一个生物识别系统获得访问权限,即使两种验证可能基于候选人的相同生物识别模板。此外,不可链接的生物识别系统应该无法根据两个模板之间的关系得出任何信息。
创建可取消和可更新的模板。它强调取消或停用受损模板并复制另一个模板的能力,类似于复制丢失或被盗的智能卡的方式。
“可再生”和“不可链接”的特性是通过盐腌技术实现的。加盐将随机生成的独特数据(称为“盐”)添加到原始信息中,以使其与其他信息区分开来。
设计生物识别系统的 FAR 和 FRR 准确性。
仔细选择合适的加密算法。某些算法甚至可能会放大个人生物识别数据中固有的微小变化,这可能会导致更高的 FRR。
使用重要的加密技术,例如散列法,当每个模板生成应用不同的排列时,该技术是有效的。尽管使用相同的输入生物识别数据,但不同的排列确保了每个模板的唯一性。
采用有效的保护方案来提高系统的性能。
针对生物识别数据的安全性和隐私性,正在进行大量研究和开发。