方世恩-CSDN博客

原创【MatLab手记】 --从0到了解超超超详过程！！！

本篇介绍了：1. 矩阵的创建以及基本运算2. 函数的定义方法3. 逻辑控制的结构4. 绘图的方法

2024-11-10 23:23:54 1084 2

原创【YOLO模型】（4）--YOLO V3超超超超详解！！!

本篇介绍了：1. YOLO V3的网络架构只有卷积层，且有三个输出。2. YOLO V3先验框共有9个，分为小、中、大三种scale，每种有三个规格。3. 引入残差网络思想，搭建更深层次的网络。4. 使用softmax函数替代logistic函数，适用于多分类的任务。

2024-10-28 22:30:54 1573

原创【YOLO模型】（3）--YOLO V2超超超超详解！！

本篇介绍了：1. YOLO V2使用的网络结构是使用Darknet-19作为主干网络。输入图像的大小必须满足32的倍数。2. 先验框使用k-means聚类方法在训练集上对先验框进行聚类，分出五个先验框。改变了距离计算方式，增强边界框尺寸权重影响。3. 中心点使用直接位置预测方法：通过sigmoid函数将中心位置点限制在一定范围内，以确保预测的边界框更加准确。4. 由于多次池化，可能难以观测到小物体，使用多尺度融合方法，融合上下层的特征信息，提升目标检测的精度和召回率。

2024-10-27 22:53:14 2163

原创【YOLO模型】（2）--YOLO V1超详解

本篇介绍了：1. YOLO V1目标检测直接将整张图像作为网络的输入，直接输出边界框的位置以及所属的类别2. 网络结构借鉴了 GoogLeNet 。24个卷积层，2个全链接层。最后输出结果包含两个预选框返回的中心坐标值以及宽高和置信度、类别数量。3. YOLO的损失就包括三部分：坐标位置误差，confidence误差，分类误差。值得注意的是，损失值只计算识别到物体的误差。4. 针对邻近网格可能会识别同一目标，发生重复检测问题，使用非极大值抑制找到最优边界框。

2024-10-24 21:25:13 2239

原创【YOLO模型】（1）--YOLO是什么

本篇介绍了：1. YOLO是一种基于深度学习的目标检测算法。注意，是一个回归问题！！2. 两种经典的检测方法：one-stage和two-stage。 1. one-stage：直接生成候选框，定位图像。 2. two-stage：先生成候选框标出所有的物体，然后找到目标物体。3. 使用Map指标来评估YOLO算法的性能。

2024-10-23 21:49:48 12691

原创【进阶OpenCV】（22） --年龄性别预测

本篇介绍了，如何使用已有的OpenCV和Caffe深度学习框架（通过OpenCV的dnn模块接口）来实现实时的人脸检测、年龄估计和性别识别，并在检测到的人脸旁边绘制中文的年龄和性别信息。

2024-10-22 20:33:21 870

原创【进阶OpenCV】（21） --卷积神经网络实现人脸检测

本篇介绍了如何通过使用dlib库中的卷积神经网络（CNN）人脸检测模型来检测一张图片中的人脸。注意！！：为例减少模型的计算，使用加载的CNN人脸检测模型对图片进行人脸检测时，上采样次数可以少一点。

2024-10-21 13:59:07 999

原创【深度学习】（12）--模型部署＜连接客户端与服务端＞

本篇介绍了，如何进行模型部署，将客户端与服务端连接在一起，使客户可以借用服务端来操作。

2024-10-20 21:57:33 1240

原创【进阶OpenCV】（20） --疲劳检测

本篇介绍了，如何通过人脸部眼睛的变化来简单的进行疲劳检测。

2024-10-19 17:55:09 1082

原创【进阶OpenCV】（19）-- Dlib库 --人脸表情识别

本篇介绍了如何通过计算面部关键点的变化情况，来判断人脸的表情变化情况。

2024-10-18 22:11:07 954

原创【进阶OpenCV】（18）-- Dlib库 --人脸关键点定位

本篇介绍了如何通过Dlib库自带的预测器，来进行人脸的关键点定位，并将它显示出来。得到关键点定位后，我们就可以通过点位的距离变换，简单的判断人脸表情变换情况。

2024-10-17 21:51:05 1477

原创【进阶OpenCV】（17）-- Dlib库 --实现人脸检测

本篇介绍了如何通过Dlib库提供的get_frontal_face_detector()函数方法进行人脸检测。

2024-10-17 09:12:39 775

原创【进阶OpenCV】（16）-- 人脸识别 -- FisherFaces算法

本篇介绍了，如何通过FisherFaces算法来实现人脸识别，其中需要注意的是：1. 在使用EigenFaces算法进行人脸识别时，传入图像的大小（即尺寸）需要保持一致。2. 训练以及测试图像最好使用大头照，减少身体的部分。3. 置信度需要低于五千才有说服力，越小越准确。

2024-10-16 21:15:51 1445

原创【进阶OpenCV】（15）-- 人脸识别 -- EigenFaces算法

本篇介绍了，如何通过EigenFaces算法来进行人脸识别，其中需要注意的是：1. 在使用EigenFaces算法进行人脸识别时，传入图像的大小（即尺寸）需要保持一致。2. 训练以及测试图像最好使用大头照，减少身体的部分。

2024-10-16 15:31:11 1800

原创【进阶OpenCV】（14）-- 人脸识别 -- LBPH 算法

本篇介绍了如何通过创建LBPH的人脸识别器来进行人脸识别。

2024-10-15 22:22:04 2503

原创【进阶OpenCV】（13）--视频物体跟踪

本篇介绍了如何使用CSRT跟踪器对移动的目标进行跟踪。

2024-10-14 22:45:57 1982

原创【进阶OpenCV】（12）--人脸检测识别

本篇介绍了如何对人脸进行人脸识别检测。就是利用已经训练好的分类器模型，直接进行加载利用，识别图片。

2024-10-13 23:03:17 1318

原创【进阶OpenCV】（11）--DNN板块--实现风格迁移

本篇介绍了，如何通过DNN板块进行风格迁移。注意！！！：进行风格迁移时，需要将传入的图片转换成可以传入人工神经网络的数据形式。且输出时进行转置，将通道维度移动到了最后，因为OpenCV期望图像以HWC格式显示。

2024-10-13 22:56:17 1610

原创【进阶OpenCV】（10）--光流估计---＞描绘运动物体轨迹

本篇介绍了，如何利用光流估计来绘制移动物体的轨迹。注意！！：每两个连续帧之间计算完特征点并连线之后，都需要将上一帧的图像更新为当前帧，用于下次计算时称为它的上一帧。

2024-10-13 15:10:51 1840 1

原创【进阶OpenCV】（9）--摄像头操作---＞答题卡识别改分项目

本篇介绍了：如何对答题卡进行识别并计算准确率。要点知识：边缘检测、轮廓近似、透视变换以及掩膜。过程：1. 图片预处理 -----> 2. 描绘轮廓 -----> 3. 轮廓近似 -----> 4. 透视变换 -----> 5. 阈值处理 -----> 6. 找每一个圆圈轮廓 -----> 7. 将每一个圆圈轮廓排序 -----> 8. 比对正确答案 -----> 9. 计算正确率.

2024-10-12 11:26:07 1598

原创【进阶OpenCV】（8）--摄像头操作---＞识别文档内容

本篇介绍了：如何通过打开摄像头，识别文档。打开摄像头读取每一帧 ----> 识别轮廓 ----> 通过轮廓近似找到文档 -----> 透视变换取出文档 ----->二值化文档，使文档更清晰。

2024-10-11 21:26:47 1356

原创【自然语言处理】（4） --长短期记忆网络LSTM详解

本篇介绍了：1. LSTM网络的作用：解决标准RNN在处理长序列数据时容易出现的梯度消失和梯度爆炸问题。2. LSTM网络的核心是记忆单元，记忆单元由一个细胞状态和三个门控向量组成，这三个门控向量分别是遗忘门、输入门和输出门。3. LSTM网络通过引入门控机制和细胞状态等创新设计，只保留相关信息来进行预测，解决了传统RNN在处理长序列数据和长期依赖问题上的困难。

2024-10-10 21:28:22 1372

原创【自然语言处理】（3） --RNN循环神经网络

本篇介绍了：1. 传统神经网络的每个输入层之间是没有建立关系的，无法训练出具有顺序的数据。2. RNN的基本结构，保留之前输入的信息并继续作为后续输入的一部分进行计算。3. 重要特点：RNN看起来像是一个多层的前馈神经网络，但每一层的权重是共享的，每层的U、W、b是一样的。4. 局限：梯度会随着时间的推移不断下降减少，而当梯度值变得非常小时，就不会继续学习。

2024-10-09 20:00:01 1715

原创【自然语言处理】（2） --Word2Vec实现

本篇介绍了：1. 如何实现Word2Vec，从而搭建网络模型进行对词的预测。2. 生成词典：将每个单词同它对应的词向量在字典中存放在一起。3. 保存训练好的词典：将生成好的词典，保存进.npz文件中。

2024-10-08 22:06:35 1159

原创【进阶OpenCV】（7）--视频处理 - 之 - 背景建模及目标跟踪

本篇介绍了：1. 对视频进行背景建模，使用帧差法。2. 对视频中移动对象进行目标跟踪检测。

2024-10-07 21:29:10 1666

原创【进阶OpenCV】（6）--指纹识别

本篇介绍了，如何将源图像指纹同指纹库中的指纹进行匹配，并得到的对应指纹的信息。

2024-10-06 23:41:31 1996

原创【进阶OpenCV】（5）--指纹验证

本篇介绍了，通过使用SIFT特征特征提取方法，统计两者之间的特征匹配点数量，来验证指纹是否匹配。

2024-10-05 23:48:32 857

原创【进阶OpenCV】（4）--图像拼接

本篇介绍了：如何通过计算关键点以及透视变换的矩阵将两个不同视角的图片进行拼接，使得它们能够完整协和的展示出来。

2024-10-04 19:59:46 2273

原创【自然语言处理】（1） --语言转换方法

本篇介绍了自然语言处理中，语言转换方法的两个模型：统计语言模型：用于描述和预测自然语言文本中的词汇或句子出现的概率，但是没办法考虑词与词之间内在的联系且参数空间会出现爆炸式增长的问题。神经语言模型：通过神经网络训练，将每个词都映射到一个较短的词向量上来。将高维映射到低维。通过embedding词嵌入技术捕捉词句之间的语义。embedding词嵌入技术，有两个模型连续词袋模型（CBOW）和跳字模型（Skip-gram），用来捕捉到了词汇之间的语义和句法关系。

2024-10-02 23:11:02 2078

原创【进阶OpenCV】（3）--SIFT特征提取

本篇介绍了：sift特征提取的作用是描绘出图中的特征点；如何获得特征点的信息，以便于特征匹配

2024-10-01 09:30:00 1184

原创【进阶OpenCV】（2）--Harris角点检测

如何使用Harris角点检测算法来检测图片的角点。算法上，通过比较cornerHarris()函数方法中返回值的大小，来确定角点。

2024-09-30 09:23:49 1144

原创【深度学习】（11）--迁移学习

本篇介绍了：如何进行迁移学习对迁移模型进行微调：微调全连接层微调卷积层（本篇未写），原理相同，可自行尝试注意：原本的模型参数务必要冻结住，那是已经调好的，可以节省计算时间。仅需要调整修改部分的参数。

2024-09-29 10:08:41 2078 1

原创【深度学习】（10）--ResNet残差网络

本篇介绍了：ResNet残差网络的好处：解决梯度消失和梯度爆炸以及退化问题。ResNet残差网络有两个核心特征：1. 残差结构；2. BN（Batch Normalization）。残差结构：防止退化。BN：减少梯度消失和梯度爆炸问题。

2024-09-28 14:03:05 1543

原创【深度学习】（9）--调整学习率

本篇介绍了：1. 通过调整学习率能够优化训练速度、提高训练稳定性、适应不同的训练阶段以及改善模型性能。2. 调整学习率有两种方法：1.使用库函数进行调整；2.手动调整学习率3. Pytorch学习率调整策略通过 torch.optim.lr_sheduler接口实现。并提供3种库函数调整方法：有序调整、自适应调整以及自定义调整。4. 在库函数调整方法中，注意在每个epochs迭代训练时，使用scheduler.step()语句进行学习率更新。

2024-09-27 09:42:40 3796 1

原创【深度学习】（8）--神经网络使用最优模型

本篇介绍了：如何使用保存好的最优模型加载模型的两种方法：1.加载模型状态字典；2.加载整个模型实例注意：两种方法都需要提前定义神经网络结构。

2024-09-26 09:37:01 1323

原创【深度学习】（7）--神经网络之保存最优模型

本篇介绍了：为什么随着迭代次数越来越多，模型的准确率会上下震荡甚至于下降。—> 过拟合pt\pth,t7三个扩展名，用于保存完整模型或者模型参数。模型的好坏，通过体现在测试集的结果上。保存最优模型的两种方法：保存模型参数和保存完整模型。

2024-09-25 09:35:21 2137 10

原创【深度学习】（6）--图像数据增强

本篇介绍了：数据增强的方法。数据增强是如何体现的。注意：数据增强与过采样直接拟合大量数据不同，数据增强体现在每次循环训练数据前，都给数据进行一次随机变换，使得每次训练的数据都不一样，从而实现训练大量的数据。

2024-09-24 10:07:02 1692

原创【深度学习】（5）--搭建卷积神经网络

本篇介绍了如何搭建卷积神经网络，其主要的构造部分为卷积层、激活层以及池化层，可以搭建多层该部分对数据进行多次卷积、池化。注意：同普通的神经网络不同，卷积神经网络在传入图片时不需要将其展开，因为对图片进行卷积就是在原图上进行内积，不能展开。

2024-09-23 11:09:22 2470

原创【深度学习】（4）--卷积神经网络

本篇介绍了卷积神经网络的结构以及它的优点：1. 卷积神经网络能够将变换的物体识别出来。2. 卷积神经网络的结构：由输入层、卷积层、激活层、池化层、全连接层、输出层组成。3. 什么是感受野。

2024-09-22 19:46:17 1648

原创【深度学习】（3）--损失函数

本篇介绍了部分损失函数：1. L1Loss损失函数：通常用于回归任务中。2. NLLLoss损失函数：在多分类问题中广泛应用。3. MSELoss损失函数：在多种回归任务中表现出色。4. BCELoss损失函数：广泛应用于各类二分类任务中。5. CrossEntropyLoss交叉熵损失函数：广泛应用于多分类问题中。

2024-09-18 22:37:32 4488

空空如也

空空如也