大学课堂 -模式识别

大学课堂 -模式识别,学习,发展,理解,竞争,模板,第1张

大学课堂 清华大学模式识别 内容简介:模式识别(Pattern Recognition)它是人类的一种基本智能,人们在日常生活中经常进行“模式识别”。随着20世纪40年代计算机的出现和20世纪50年代人工智能的兴起,人们当然希望用计算机代替或扩大人类的一些脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展,成为一门新学科。
模式识别(Pattern Recognition)它是信息科学和人工智能的重要组成部分,用于处理和分析表征事物或现象的各种形式(数值、文本和逻辑关系)的信息,以描述、识别、分类和解释事物或现象。模式识别又称模式分类,从处理问题的性质和解决问题的方法来看,模式识别分为监督分类(Supervised Classification)以及无监督的分类(Unsupervised Classification)两种。两者的主要区别在于实验样本的类别是否提前知道。一般来说,监督分类通常需要提供大量已知类别的样本,但在实际问题中存在一些困难,因此非常有必要研究非监督分类。
模式也可以分为抽象形式和特定形式。前者,如意识、思想和讨论,属于概念识别研究的范畴,是人工智能的另一个研究分支。我们所说的模式识别主要是识别和分类对象的特定模式,如语音波形、地震波、心电图、脑电图、图片、照片、文本、符号、生物传感器等。
模式识别研究主要集中在两个方面:一是研究生物体(包括人)是如何感知对象的,属于理解科学的范畴,二是如何在给定的任务下使用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容。近几十年来,通过数学家、信息学专家和计算机科学家的努力,后者取得了系统的研究成果。
应用计算机识别和分类一组事件或过程,识别的事件或过程可以是文本、声音、图像等特定对象,也可以是状态和程度等抽象对象。这些对象与数字信息的区别称为模式信息。
模式识别分类的类别数量由特定的识别问题决定。有时,实际的类别数在一开始就无法知道,需要在识别系统反复观察被识别对象后确定。
模式识别与统计,心理学,语言学, 计算机科学 、生物学、控制论等都有关系。它与 人工智能 、 图像处理 研究有交叉关系。例如,自适应或自组织的模式识别系统包括人工智能的学习机制;人工智能研究的风景理解和自然语言理解也包括模式识别问题。也就是说,图像处理技术应用于模式识别中的预处理和特征提取环节;图像处理中的图像分析也应用于模式识别技术。
一、模式识别方法
1、理论决策方法
又称统计方法,是一种发展较早、成熟的方法。被识别对象首先数字化,转换为适合计算机处理的数字信息。一种模式通常用大量的信息来表示。在数字化环节之后,许多模式识别系统也进行了预处理,以消除混合干扰信息,减少某些变形和失真。然后是特征提取,即从数字化或预处理的输入模式中提取一组特征。所谓特征就是选定的一种度量,它对一般变形和失真保持不变或几乎不变,并且只包含尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间。此时,模式可以用特征空间中的一个点或一个特征矢量来表示。这种映射不仅压缩了信息量,而且易于分类。特征选择在决策理论方法中起着重要的作用,但没有一般的理论指导,只能通过分析具体的识别对象来决定选择哪些特征。特征提取后可分类,即从特征空间映射到决策空间。因此,引入识别函数,通过对识别函数值的比较,通过特征矢量计算相应类别的识别函数值。
2、句法方法
又称结构方法或语言学方法。其基本思想是将模式描述为简单子模式的组合,子模式可以描述为更简单子模式的组合,最终得到树形结构的描述,底部最简单的子模式称为模式基元。在句法中选择基元的问题相当于在决策理论中选择特征的问题。通常要求选定的基元能够对模式提供一个紧凑的描述,反映其结构关系,并且很容易用非句法提取。显然,基元本身不应包含重要的结构信息。模式描述为一组基元及其组合关系,称为模式描述句,相当于句子与短语单词的组合,单词与单词的组合。所谓语法指定了基元组合成模式的规则。一旦基元被识别,识别过程可以通过句法分析进行,即分析给定模式的句子是否符合指定的语法,并将满足某种语法的句子分为这一类。
模型识别方法的选择取决于问题的性质。如果识别对象极其复杂,结构信息丰富,一般采用句法;被识别对象不是很复杂或明显的结构信息,一般采用决策理论方法。这两种方法不能完全分开。在句法方法中,基元本身是通过决策理论方法提取的。在应用中,将这两种方法结合起来,分别施加到不同的层次,往往会取得更好的效果。
二、模式识别的应用
模型识别可用于文字和语音识别、遥感和医学诊断。
① 文字识别
汉字有几千年的历史,也是世界上用户最多的文字,对中华民族灿烂文化的形成和发展有着不可磨灭的功勋。因此,随着信息技术和计算机技术的日益普及,如何方便快速地将文本输入计算机已经成为影响人机接口效率的重要瓶颈,也与计算机是否能真正在我的流行应用程序有关。目前,汉字输入主要分为人工键盘输入和机器自动识别输入。人工输入速度慢,劳动强度高;自动输入分为汉字识别输入和语音识别输入。从识别技术的难度来看,手写识别的难度高于印刷识别,而在手写识别中,离线手写识别的难度远远超过在线手写识别。到目前为止,除了已经实际应用了脱机手写数字识别外,汉字等文字的脱机手写识别仍处于实验室阶段。
② 语音识别
语音识别技术涉及的领域包括:信号处理、模式识别、概率论和信息论、语音机制和听觉机制、人工智能等。近年来,在生物识别技术领域,声纹识别技术以其独特的便利性、经济性和准确性吸引了全世界的关注,并日益成为人们日常生活和工作中重要而流行的安全验证方法。此外,利用基因算法训练连续隐马尔柯夫模型的语音识别方法已成为语音识别的主流技术。该方法在语音识别中识别速度快,识别率高。
③ 指纹识别
手掌及其手指、脚、脚趾内表面皮肤凹凸不平产生的纹路会形成各种图案。这些皮肤的纹理在图案、断点和交叉点上是独一无二的。依靠这种独特性,一个人可以对应他的指纹,通过比较他的指纹和预先保存的指纹来验证他的真实身份。一般指纹分为以下大类:环形(loop),螺旋型(whorl),弓型(arch),这样,每个人的指纹都可以分别分类和检索。指纹识别基本上可以分为几个大步骤:预处理、特征选择和模式分类。
③ 遥感
作物估产、资源勘察、气象预报、军事侦察等已广泛应用于遥感图像识别。
④ 医学诊断
模型识别在癌细胞检测、X射线照片分析、血液检测、染色体分析、心电图诊断和脑电图诊断等方面取得了成效。
三、统计模式识别
统计模式识别(statistic pattern recognition)基本原理是模型空间中相似的样本相互接近,形成“集团”,即“物以类聚”。根据模式测得的特征,其分析方法是向量Xi=(Xi1,Xi2,...xid)T(i=1,2,…,N),将给定的模式归类为C类ω1,ω2,…, ω在c中,根据模式之间的距离函数进行分类。其中,T表示转移;N是样本点数;d是样本特征数。
识别统计模式的主要方法有:判别函数法、近邻分类法、非线性映射法、特征分析法、主因子分析法等。
在统计模式识别中,贝叶斯的决策规则理论上解决了最佳分类器的设计问题,但实施必须首先解决更困难的概率密度估计问题。BP神经网络直接从观测数据(培训样本)中学习是一种更简单、更有效的方法,因此得到了广泛的应用,但它是一种没有指定工程实践坚实理论基础的启发性技术。统计推断理论研究所取得的突破性成果导致了现代统计学习理论VC理论的建立。该理论不仅在严格的数学基础上成功地回答了人工神经网络中的理论问题,而且还引入了一种新的学习方法——支持向量机(SVM)。
四、模型识别技术的发展潜力几乎无限
模式识别技术是人工智能的基础技术,21世纪是智能、信息、计算和网络的世纪。在这个以数字计算为特征的世纪,模式识别技术作为人工智能技术的基础学科,将获得巨大的发展空间。在世界上,主要的权威研究机构和公司已经开始关注模式识别技术作为公司的战略研发重点。
1、语音识别技术
语音识别技术正在逐渐成为信息技术中的人机接口(Human Computer Interface, HCI)语音技术的应用已成为一个具有竞争力的新兴高科技产业。中国互联网中心的市场预测:未来五年,中国语音技术领域的市场容量将超过400亿元,然后以每年30%以上的速度增长。
2、生物认证技术
生物认证技术(Biometrics)本世纪最受关注的安全认证技术,其发展是大势所趋。人们愿意忘记所有的密码,扔掉所有的磁卡,用自己的独特性来识别身份和保密。国际数据集团(IDC)预测:移动电子商务基础核心技术的生物识别技术作为未来不可避免的发展方向,在未来10年将达到100亿美元的市场规模。
3、数字水印技术
数字水印技术自20世纪90年代以来在世界上开始发展(Digital Watermarking)数字媒体版权保护技术是最具发展潜力和优势的技术。IDC预测,数字水印技术在未来五年的全球市场容量将超过80亿美元。
五、结 语
自20世纪20年代以来,人们普遍认为没有适用于所有模式识别问题的单一模型和解决识别问题的单一技术。我们现在所拥有的只是一个工具袋。我们需要做的是将统计和句法识别与具体问题相结合,将统计模式识别或句法识别与人工智能中的启发性搜索相结合,将统计模式识别或句法模式识别与支持向量机的机器学习相结合,将人工神经元网络与人工智能中的各种现有技术、专家系统和不确定推理方法相结合,深入掌握各种工具的效率和应有的可能性,相互学习,开创模式识别应用的新局面。
对于识别二维模式的能力,有各种理论解释。模板认为,我们所知道的每一种模式在长期记忆中都有相应的模板或微缩副本。模式识别是匹配最适合视觉刺激的模板。根据特征,视觉刺激由各种特征组成,模式识别是存储在长期记忆中的刺激特征和模式特征。特征解释了模式识别中的一些自下而上的过程,但它不强调基于环境的信息和预期的自上而下的处理。基于结构描述的理论可能比模板或特征的理论更合适。

附件
大学课堂 -模式识别
448 MB
百度云盘资源
百度云盘分享下载
下载文件
附件购买
售价:19.8 RMB
荣誉会员免费下载
开通会员
开通荣誉会员或更高级的会员可免费下载该文件

登录注册购买

 您阅读本篇文章共花了: 

1.仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。我们非常重视版权问题,如有侵权请点击版权投诉。敬请谅解!

2.如遇下载链接失效、解压密码错误等问题请点击 提交工单

3.在下载源码前,请务必要仔细阅读并接受 购前/下载协议 购买即视为您同意该协议!


游人客栈 » 大学课堂 -模式识别

游人客栈资源库期待您的加入

开通会员 联系客服