新宇的博客

Keep on going and never give up!

图像特征提取-上

角点特征、Harris、Shi-Tomas、SIFT、SURF

一、角点特征 图像特征要有区分性,容易被比较。一般认为角点,斑点等是较好的图像特征 特征检测: 找到图像中的特征 特征描述: 对特征及其周围的区域进行描述 二、Harris和Shi-Tomas算法 1. Harris算法 Harris角点检测的思想是通过图像的局部的小窗口观察图像,角点...

OpenCV-下

模版匹配、霍夫变换

一、模版匹配与霍夫变换 1. 模版匹配 1.1 原理 所谓的模板匹配,就是在给定的图片中查找和模板最相似的区域,该算法的输入包括模板和图片,整个任务的思路就是按照滑窗的思路不断的移动模板图片,计算其与图像中对应区域的匹配度,最终将匹配度最高的区域选择为最终的结果。 1.2 流程 将模板块每次移动一个像素 (从左往右,从上往下),在每一个位置,都计算与模板图像的相似程度。 对于每一...

OpenCV-中

形态学操作、图像平滑、直方图、边缘检测

一、形态学操作 形态学,即数学形态学(Mathematical Morphology),是图像处理过程中一个非常重要的研究方向。形态学主要从图像内提取分量信息,该分量信息通常对于表达和描绘图像的形状具有重要意义,通常是图像理解时所使用的最本质的形状特征。例如,在识别手写数字时,能够通过形态学运算得到其骨架信息,在具体识别时,仅针对其骨架进行运算即可。形态学处理在视 觉检测、文字识别、医...

OpenCV-上

图像基础、几何变换

OpenCV是应用广泛的开源图像处理库 一、OpenCV简介 1. 图像概念 图像 概念: 图像是人类视觉的基础,是自然景物的客观反映,是人类认识世界和人类本身的重要源泉; “图”是物体反射或透射光的分布, “像“是人的 视觉系统所接受的图在人脑中所形版的印象或认识 ...

条件随机场

一、HMM与MEMM 1. 概念介绍 HMM:隐马尔可夫模型 生成模型 本质上就类似于我们将朴素贝叶斯在单样本分类问题上的应用推广到序列样本分类问题上。 MEMM:最大熵马尔可夫模型 判别模型 利用判别式模型的特点,直接对每一个时刻的状态建立一个分类器,然后将所有的分类器的概率值连乘起来; ...

集成学习进阶

XGBoost、lightGBM

一、XGBoost 1. 介绍 XGBoost(Extreme Gradient Boosting)全名叫极端梯度提升树,XGBoost是集成学习方法的王牌,在Kaggle数据挖掘比赛中,大部分获胜者 用了XGBoost。 XGBoost在绝大多数的回归和分类问题上表现的十分顶尖 2. 最优模型构建方法 3. XGBoost的目标函数推导 3.1 目标函数的确定 3.2...

隐马尔可夫

Forward-Backward, Baum Welch, Vierbi

一、HMM简介 1. 马尔可夫链 马尔科夫链即为状态空间中从一个状态到另一个状态转换的随机过程。 1.1 举例 下图中的马尔科夫链是用来表示股市模型,共有三种状态:牛市(Bull market), 熊市(Bear market)和横盘(Stagnant market)。 每一个状态都以一定的概率转化到下一个状态。比如,牛市以0.025的概率转化到横盘的状态。 2. HMM模型介绍 ...

EM算法

一、算法介绍 1. 算法原理 EM算法也称期望最大化(Expectation-Maximum,简称EM)算法。 它是一个基础算法,是很多机器学习领域算法的基础,比如隐式马尔科夫算法(HMM)等等。 EM算法是一种迭代优化策略,由于它的计算方法中每一次迭代都分两步, 其中一个为期望步(E步), 另一个为极大步(M步), 所以算法被称为EM算法(Expectation-Maximization ...

支持向量机

间隔、对偶、核技巧

一、原理介绍 1. 算法简介 SVM全称是supported vector machine(支持向量机),即寻找到一个超平面使样本分成两类,并且间隔最大。 2. 超平面最大间隔介绍 3. 硬间隔和软间隔 3.1 硬间隔 严格地让所有实例都不在最大间隔之间,并且位于正确的一边,这就是硬间隔分类。 硬间隔分类有两个问题: 首先,它只在数据是线性可分离的时...

朴素贝叶斯

贝叶斯公式、概率计算、生成/判别模型

一、算法简介 1. 条件概率、联合概率 联合概率:包含多个条件,且所有条件同时成立的概率 记作:P(A,B) 条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率 记作:P(A|B) 相互独立:如果P(A, B) = P(A)P(B),则称事件A与事件B相互独立。 2. 贝叶斯公式 3...