当前位置：移动技术网 > IT编程>网页制作>HTML > 7/19数字图像处理

7/19数字图像处理

2020年07月20日 | 移动技术网IT编程 | 我要评论

目标识别

模式和模式类
基于决策理论方法的识别

匹配
最佳统计分类器

神经网络识别法

多层前馈神经网络

结构方法

匹配形状数
串匹配

特征检测和匹配概述

特征点概述
特征点的构成
特征点的匹配
特征点描述子
常用的特征点算法

注：在界定数字图像处理的覆盖范围时，包含了图像中各个区域的识别，在本章中，我们称这些区域为目标或模式。

模式和模式类

模式：描绘子的组合
模式类：具有某些共同属性的一族模式。
由机器完成的模式识别是对不同的模式赋予不同类别的技术，这种技术是自动的，并且尽可能地减少人的干预。
实践中常用的三种模式组合是向量(用于定量描述)、串和树(用于结构描述)。模式向量由粗体
小写字母表示，如x,y和z,并采取下列形式:
在这里插入图片描述

串：串描述适于生成其结构是基于基元的较简单的连接，并且通常是和边界形状有关系的目标模式和其他实体模式。

基于决策理论方法的识别

决策理论方法识别是以使用决策（或判别）函数为基础的。

匹配

基于匹配的识别技术通过一个原型模式向量来表示每个类。根据一种预先定义的度量，将一个未知模式赋予最接近的类。
最简单的方法是最小距离分类器，最小距离分类器计算该未知模式与每个原型向盘间的（欧氏）距离。它选择最小距离来决策。
模板匹配：当对象物的图案以图像的形式表现时，根据该图案与一幅图像的各部分的相似度判断其是否存在，并求得对象物在图像中位置的操作。

最佳统计分类器

多数测量和判断物理事件的场合，通常会产生随机的模式分类，因此对概率的考虑是十分重要的。而最佳则是平均的，产生分类错误的概率很低。
先验概率：表示在一个对象尚未被测量之前，对于对象所掌握的情况。
条件概率：当给定对象属于类1时。对象直径为x的概率。记为p(x|w1)
贝叶斯理论：将类隶属度先验概率、条件PDF和所进行的度量结合起来，计算出该对象属于每一类的概率，并据此赋予该对象最可能的类别。对象测量后。该对象属于第I类的概率可以根据贝叶斯定理计算：
图片: https://uploader.shimo.im/f/ZwD0N7wJUAW0cT8d

使用贝叶斯决策的分类器长期风险称为贝叶斯风险
图片: https://uploader.shimo.im/f/nmcrGjRodQdHqMw9

贝叶斯分类器的决策函数：
图片: https://uploader.shimo.im/f/uTU8gjlTvYq5hc1f

神经网络识别法

结构：由许多互联的相同的节点（处理单元，PE）构成。每个PE从上游的几个PE接受输入信号，产生一个标量输出，传给下游的一组PE。
处理单元：基本的处理单元的动作为将输入向量同权向量相乘，再经过依次S形变换，即得到输出值。此输出再经过网络地相互连接传递下去，成为许多PE的输入。

多层前馈神经网络

下图展示了神经网络的结构：
图片: https://uploader.shimo.im/f/Xbey8dDI0I8BriSS
最后输出层输出的值可当做属于这个类的概率，因此哪个值高就可认为它属于这类的概率高。而每个神经元的的形式与前面讨论的感知机模型类似，只是激活函数变成了如下的 ‘S形’函数：
图片: https://uploader.shimo.im/f/2YlZ2hUk1ElpGDH2
其中，Ij 是网络第 j 层每个节点激活元素的输入， θj 是偏移量，θ0 控制 S 函数的形状。上式对应的S函数如下：

任何一层中的节点输入都是来自前一层输出的加权和，令 K 层为 J 层的前一层，则有：
图片: https://uploader.shimo.im/f/SblEZimbIG315POp
其中， Ok 为第 k 层的输出
故 hj(Ij) 又可写成如下形式：

在这里插入图片描述

结构方法

匹配形状数

两个区域边界之间的相似度k定义为它们的形状书仍保持一致的最大阶。
例如，令a和b代表由4方向链码表示的闭合边界的形状数，如果
在这里插入图片描述
那么这两个形状有一个相似度k，其中s代表形状数，下标代表阶。两个形状a和b之间的距离定义为它们的相似度的倒数：
图片: https://uploader.shimo.im/f/KABQbVkhHbJLmy3f
该距离满足如下性质：

K或D都可以用于比较两个形状。如果使用相似度，则k越大，形状就越相似。当使用距离度量时，情形正好相反。

串匹配

假设两个区域边界a和b 已被编码成串，两个串分别表示为a1,a2,…,an和b1, b2,…, bm。令α表示两个串之间的匹配数，如果ak=bk。则匹配出现在第k个位置。不匹配的符号数为：
在这里插入图片描述

特征检测和匹配概述

特征点概述

如何高效且准确的匹配出两个不同视角的图像中的同一个物体，是许多计算机视觉应用中的第一步。虽然图像在计算机中是以灰度矩阵的形式存在的，但是利用图像的灰度并不能准确的找出两幅图像中的同一个物体。这是由于灰度受光照的影响，并且当图像视角变化后，同一个物体的灰度值也会跟着变化。所以，就需要找出一种能够在相机进行移动和旋转（视角发生变化），仍然能够保持不变的特征，利用这些不变的特征来找出不同视角的图像中的同一个物体。
为了能够更好的进行图像匹配，需要在图像中选择具有代表性的区域，例如：图像中的角点、边缘和一些区块，在图像识别角点是最容易，也就是说角点的辨识度是最高的。所以，在很多的计算机视觉处理中，都是提取角点作为特征，对图像进行匹配，例如SFM，视觉SLAM等。但是，单纯的角点并不能很好的满足我们的需求，例如：相机从远处得到的是角点，但是在近处就可能不是角点；或者，当相机旋转后，角点就发生了变化。为此，计算机视觉的研究者们设计了许多更为稳定的的特征点，这些特征点不会随着相机的移动，旋转或者光照的变化而变化。例如：SIFT,SURF,ORB等

特征点的构成

1、关键点：关键点指的是该特征点在图像中的位置，有些还具有方向、尺度信息；
2、描述子：描述子通常是一个向量，按照人为的设计的方式，描述关键点周围像素的信息。
通常描述子是按照外观相似的特征应该有相似的描述子设计的。因此，在匹配的时候，只要两个特征点的描述子在向量空间的距离相近，就可以认为它们是同一个特征点。

特征点的匹配

特征点的匹配通常分为三个步骤：
1、提取图像中的关键点，是为了查找图像中具有某些特征（不同的算法有不同的）的像素；
2、根据得到的关键点位置，计算特征点的描述子；
3、根据特征点的描述子，进行匹配；

特征点描述子

定义：从图像中提取到特征的关键点信息，通常只是其在图像的位置信息（有可能包含尺度和方向信息），仅仅利用这些信息无法很好的进行特征点的匹配，所以就需要更详细的信息，将特征区分开来，这就是特征描述子。另外，通过特征描述子可以消除视角的变化带来图像的尺度和方向的变化，能够更好的在图像间匹配。特征的描述子通常是一个精心设计的向量，描述了关键点及其周围像素的信息。
描述子的特性：
不变性：指特征不会随着图像的放大缩小旋转而改变；
鲁棒性：对噪声、光照或者其他一些小的形变不敏感；
可区分性：每一个特征描述子都是独特的，具有排他性，尽可能减少彼此间的相似性。
其中描述子的可区分性和其不变性是矛盾的，一个具有众多不变性的特征描述子，其区分局部图像内容的能力就比较稍弱；而如果一个很容易区分不同局部图像内容的特征描述子，其鲁棒性往往比较低。所以，在设计特征描述子的时候，就需要综合考虑这三个特性，找到三者之间的平衡。
特征描述子的不变性主要体现在两个方面：
1、尺度不变性
指的是同一个特征，在图像的不同的尺度空间保持不变。匹配在不同图像中的同一个特征点经常会有图像的尺度问题，不同尺度的图像中特征点的距离变得不同，物体的尺寸变得不同，而仅仅改变特征点的大小就有可能造成强度不匹配。如果描述子无法保证尺度不变性，那么同一个特征点在放大或者缩小的图像间，就不能很好的匹配。为了保持尺度的不变性，在计算特征点的描述子的时候，通常将图像变换到统一的尺度空间，再加上尺度因子。
2、旋转不变性
指的是同一个特征，在成像视角旋转后，特征仍然能够保持不变。和尺度不变性类似，为了保持旋转不变性，在计算特征点描述子的时候，要加上关键点的方向信息。

常用的特征点算法

上面提到图像的特征点包含两个部分：
1、特征点的提取，在图像检测到特征点的位置。
2、特征点的描述，也就是描述子。
在图像中提取到关键点的位置信息后，为了能够更有效的匹配（主要是保证尺度和旋转不变性），通常使用一个向量来描述关键点及其周围的信息。特征的描述子，在特征点的匹配中是非常重要的。但具体到一个算法来说，可能其既有特征点的提取算法也有特征点描述子的算法，也有可能其仅仅是一个特征点提取算法或者是特征点的描述子算法。

本文地址：https://blog.csdn.net/m0_45805664/article/details/107448498

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

CSS3 | 样式和优先级

css3一般介绍：CSS注释：/*CSS*/CSS长度单位：1.px（像素）2.em（倍数，一般用于文字）一、H... [阅读全文]
Web APP Index CSS 代码-立哥开发

// Copy right 2020 Jacky Zong .Version 1.7// All rights ... [阅读全文]
南宁小程序开发,挑战百日学习计划第43天(拖拉登录框的写法)

南宁小程序开发：www.zkelm.com今天的主题是做一个移动的登录model框，支持移动拖放！1.首... [阅读全文]
Html和CSS总结

1、HTML介绍超文本标记语言后缀 .html 或者 .htm作用：写网页结构内容2、DOCTYPE的作用文... [阅读全文]
HTML与CSS常见问题解决方式以及重点内容归类

HTML与CSS常见问题解决方式及重点内容归类一、快速生成标签的快捷写法归类（TAB键）：E：标签本身E>... [阅读全文]
让盒子水平居中解决方法！！！---（块元素，行内元素，行内块，文本）

如何让盒子水平居中在开发中我们会经常需要让一个盒子进行水平居中来达到某种效果，水平居中也是我们在开发中用到最多的... [阅读全文]
音频/视频进度条

实现一个简单的进度条，样式写的有点丑。。。可以根据自己喜好改一下，下面是源码<!DOCTYPE html&... [阅读全文]
CSS踩坑-------transform:scale(‘数字’)

transform:scale(‘数字’)今天进行HTML页面格式修改大致代码如下：<style type... [阅读全文]
DB旅游生态系统-03-日志管理-客户端代码实现

客户端页面事件分析客户端页面流转分析图当用户点击首页日志管理时，其页面流转分析如图-8所示：日志列表信息呈现业务... [阅读全文]
Html 初识

<!DOCTYPE html><html><head><meta ch... [阅读全文]

网友评论


验证码：