Opencv项目实战：00 专栏内容介绍

Opencv项目实战：00 专栏内容介绍

2024-12-25 14:28

Opencv项目实战专栏介绍：

01 文字检测OCR

02 角度探测器

03 扫描二维码&条形码

04 全景图片拼接

05 物体检测

06 文档扫描仪

07 人脸识别和考勤系统

08 Yolov3更高精度的检测物体

09 物体尺寸测量

10 面部特征提取及添加滤镜

11 使用Opencv高亮显示文本检测

12 你这背景太假啦！

13 手部追踪

14 手势控制音量

15 手势缩放图片

16 虚拟拖拽系统

17 贪吃蛇游戏

18 人体姿态检测

19 手势控制鼠标

20 单手识别数字0到5

21 美国ASL手势识别

22 物体颜色识别并框选

23 物体计数与表单信息

本专栏在未有付费前，已经有百人订阅了，你可以放心的去订阅。在这里我会给整个项目简单的介绍，以及一些扩展应用。

地址1：

地址2：

介绍：使用了第三方库pytesseract，以及Tesseract进行字母和数字的OCR识别，文章分为了1和2篇，第2篇相较于第1篇有所改进。个人感觉是对于文字和数字的识别方面还是有相当进步的空间。好像目前不会使用这个方面来进行OCR识别。

应用：OCR的应用非常广泛。它可以用于文件扫描软件，将纸质文档转换为可编辑的电子文本。此外，OCR还可以用于搜题软件，帮助学生快速识别和搜索问题答案。在QQ或微信等聊天软件中，文字识别可以将图片中的文字提取出来，方便快捷地转发和共享信息。此外，OCR还可以应用于自动化数据录入、身份证识别、银行卡识别等场景，极大地提高了工作效率和准确性。

地址：Opencv项目实战：02 角度探测器

介绍：通过鼠标进行点击即可进行平面的角度检测，存在人为的点击误差。

应用：通过鼠标进行角度检测具有多种应用，包括三维建模、游戏和虚拟现实以及机器人控制和自动化系统。鼠标可以用于改变物体的角度、控制视角、编辑图像，或者手动控制机器人的姿态。这种技术需要借助算法和传感器来进行姿态估计和转换，以实现特定应用领域的需求。

地址：Opencv项目实战：03 扫描二维码&条形码

介绍：这里可以实现二维码和条形码的识别，扫描出来的结果可能会有数字，网址链接，英文等。除此之外，还进行了公司的员工使用工作牌扫描二维码开门的想法实现。

应用：二维码和条形码的应用广泛，如员工使用工作牌扫描二维码开门、移动支付等。这种扫描方式方便快捷，提高了门禁和支付的安全性和效率。在疫情期间更是少不了要扫场所码。

地址：Opencv项目实战：04 全景图片拼接

介绍：通过特征检测可将图片进行拼接，如何实现的也可以参考。

应用：全景图片拼接应用广泛，包括旅游、房地产、虚拟现实等领域。它将多张相邻照片合成一张全景图，提供宽广视野和沉浸式体验。在旅游中展示风景名胜，房地产展示房屋环境，VR创建虚拟场景等。手机的全景模式也采用这种方法，让用户轻松拍摄全景照片，享受更丰富的视觉体验。

地址：Opencv项目实战：05 物体检测

介绍：gif图像中检测了水瓶（截图时间不够了），鼠标，剪刀，书，手机，牙刷，键盘，电脑等。可以检测到coco,names文件中的物品。

应用：物体检测广泛应用于多个领域。其中包括自动驾驶、视频监控、物体识别与分类、增强现实和虚拟现实、医学影像分析等。物体检测技术的应用领域在不断扩展，未来还将涵盖更多的领域和场景。

地址：

实时检测

图片检测

介绍：修正文档，可以视频检测也可以使用图片检测，实现的话，要么有VIP，兑换积分，要么就是看广告等。如果你发现扫描的文档不清晰，请修改合适的分辨率。以我个人来看，它的实用性很高。

应用：文档扫描仪可以用于扫描身份证、护照等个人身份证件。有些还具有自动文档处理功能，如自动裁剪、校正图像、去除背景噪声等。这可以提高扫描效果的质量和一致性。

地址：

介绍：高精度执行面部识别，首先简要介绍理论并学习基本实现。然后将创建一个考勤项目，该项目将使用网络摄像头检测人脸并在 Excel 表中实时记录考勤情况。

应用：人脸识别和考勤系统可以用于企业、学校等场所的考勤管理。员工或学生只需在系统中注册自己的人脸信息，然后在每天上班或上课时，系统通过摄像头检测和识别人脸，自动记录考勤时间，提高考勤的准确性和效率。考勤数据可以实时记录在Excel表或数据库中，方便后续统计和分析。

地址：

介绍：本次物体检测，将采用新的方法，相比于上一次，它的检测效果更好，具体在下面的项目介绍当中，本次检测的物品有手机、牙刷、剪刀、杯子、运动球、书等。检测的这些物品是方便展示的，还可以使用水果的，大家做好后，不妨自己去试试。

应用：更高的检测精度，YOLOv3相对于前代模型，引入了更多的卷积层和更小的检测尺度，从而提高了物体检测的精度。YOLOv3在不同尺度下进行多次检测，从而能够更准确地捕捉不同大小的目标。

地址：

介绍：主要是运用了之前扫描文档的思想，以A4纸为背景，检测其中区域的物体长和宽。我的摄像头无法固定，所以是手持的，且由于我在寝室里面是真的没有找到合适的测量物体以及背景色（全是米色或原木色的）。所以效果有所欠缺，但经过ps修改的图片，检测的效果还是很不错的。

应用：在工业制造过程中，使用计算机视觉进行物体尺寸测量，可以自动进行物体尺寸测量，减少了人工操作的需求，并提高了测量的效率。相比传统的手动测量方法，计算机视觉可以在更短的时间内处理大量的数据，并实现高速、连续的测量。

地址：

介绍：采取dlib和shape_predictor_68_face_landmarks.dat文件，为图像添加蒙版，更改嘴唇的色号，如果你想修改其他的部位，它的方法是同理的，除此之外，让图片显示出脸部的68个地表.

应用：在美妆领域，可以利用计算机视觉和机器学习技术实现自动化的化妆效果。结合了图像分析、人脸识别和美妆技术，可以实时调整人脸上的妆容，不仅为用户提供了个性化的美妆体验，还可以帮助品牌和商家更好地推广和销售化妆品。

地址：

打开我们生成的.csv文件：

介绍：基于文字高亮的图片中，需要追求一种能够快速提取重点内容的方法。通过opencv的方法通过分析图片中的文字信息，并将其准确提取出来，使我们能够方便地获取关键信息并将其整理存储。为此，将文字高亮图片转换为可编辑的文本，并将提取的内容保存到一个CSV（逗号分隔值）文件中。

应用：在教育、学术、市场、法律法规以及新闻等领域，文字高亮图片的信息提取，可以帮助用户从大量的文字信息中迅速捕捉关键内容，并加速信息处理和决策过程。随着人工智能和图像识别技术的不断发展，这一方法在各个行业中的应用前景更加广阔。

地址：

介绍：平常我们在各个平台，比如某音、B站、小红薯等，有这么一群创作者——虚拟人物、带有各种背景板的创作者，前段时间还玩出了一个“我的背景板假吗？”这样的梗，那么我们今天要制作的是更改我们的背景板，将原有的去除，添加上新的背景板，并可以通过敲击键盘对背景板进行切换（本项目中，‘q’表示-1，‘w’表示+1）。

应用：在影视娱乐产业，背景替换技术，可将演员拍摄的前景图像与虚拟的背景场景进行合成，制作令人惊叹的特效，平时的工作中，线上会议中也可以替换虚拟的背景场景，可以显得更加的专业等等。

地址：

介绍：基于Mediapipe开发的简单手势识别，是后面很多有手势识别开发项目的基础。

应用：手势识别技术可以用于人机交互界面的设计，例如触摸屏、智能手机和平板电脑等设备。用户可以通过手势动作来控制和操作设备，实现更直观、自然的交互方式，提高用户体验。

地址：

介绍：本篇与上一篇有很多联系，大家可以看看这篇Opencv项目实战：13 手部追踪，我们将根据上一节的内容，进行一个拓展。本篇你可以学到如何通过手势来控制电脑的音量大小。这个就是一个主要的效果，通过大拇指与食指来控制音量，并在侧边具有一个音量条，更加美观和简洁。

应用：手势控制音量是手势识别技术在音频领域的一种应用。通过使用摄像头或其他传感器设备捕捉用户的手势动作，并将其识别为特定的音量控制命令，实现对音频设备的音量进行调节。

地址：

介绍：本篇将会以HandTrackingModule为模块，这里的模块与之前的有所不同，请按照本篇为准，前面的HandTrackingModule不足以完成本项目，本篇将会通过手势对本人的博客海报进行缩放，具体效果可以看下面的效果展示。

应用：手势缩放图片是手势识别技术在图像处理领域的一种应用。通过使用摄像头或其他传感器设备捕捉用户的手势动作，并将其识别为缩放命令，实现对图片的放大和缩小操作。

地址：

介绍：这次使用cvzone模块，制作一个虚拟拖拽系统，我们根据索引可以知道食指与中指的索引为8和12，当两指间合并时可以对虚拟方块进行拖拽，张开时解除拖拽，方块停在此处。虽然目前仍然存在一定的bug，即当两个虚拟方块重合较多时，会使其中的一个方块消失，但我们又能利用这一点可以制作计算机视觉方面的游戏，比如贪吃蛇等。

应用：虚拟拖拽系统在虚拟培训和模拟应用中发挥重要作用。例如，在医学培训中，学生可以使用虚拟拖拽系统来模拟手术操作，提高技能和手眼协调能力。在虚拟游戏和娱乐中也得到广泛应用。玩家可以使用手势或控制器来拖拽游戏中的角色、道具或物体，与虚拟环境进行互动，增加游戏的沉浸感和交互性。

地址：

介绍：这次是一个有意思的计算机视觉游戏——贪吃蛇，我们以食指为蛇头，不断的移动我们的手指，当吃到甜甜圈的时候，蛇身增长，当食指停止或触碰蛇身时，游戏结束。点击'r'将重新开始游戏。

应用：计算机视觉游戏贪吃蛇的应用是基于虚拟现实（VR）或增强现实（AR）技术的交互式游戏体验。通过计算机视觉技术和手势识别，将玩家的手指作为贪吃蛇的控制器，创造了一种全新的游戏体验。

地址：

介绍：mediapipe中有人体姿态检测的功能，今天我们就将实现最最基础的人体姿态估计项目，它的应用还是有很多的，比如：AI锻炼检测标准、老人跌倒检测等，这些方面其实已经有了很多的参考资料了，当然在我知道的当中用yolo的倒是挺多的。那么今天我们将会通过人物跳舞的视频进行一个姿态的检测。

应用：人体姿态检测可用于虚拟现实（VR）和增强现实（AR）应用。通过识别用户的姿势和动作，可以在虚拟或增强的环境中实时渲染用户的虚拟身体，实现身临其境的交互体验，增强虚拟现实的沉浸感和真实感。

地址：

介绍：在Opencv项目实战：15 手势缩放图片中，我们搭建了HandTrackingModule模块，但在这里你还得用本节的HandTrackingModule，因为有些功能并不需要，且也是分散了一些函数的功能。在这一节中，我的想法是通过点单个食指控制move，双指合并控制click，这样就能够实现手势控制鼠标。

应用：手势控制鼠标可以提供无触摸的交互方式，减少对鼠标和键盘的依赖。用户可以使用手势来控制鼠标的移动、点击和滚动等操作，从而实现更加直观和自然的交互体验。

地址：

介绍：今天要做的是单手识别数字0到5，通过在窗口展示，实时的展示相应的图片以及文字。

应用：这种应用可以用于儿童教育和数字学习。通过展示数字图片和文字，配合单手手势识别，孩子们可以学习和记忆数字0到5，并与相应的图像和文字进行关联，提高数字认知能力和学习兴趣。

地址：

介绍：你并不需要多么了解深的机器学习算法，我的初衷是通过本项目，激发大家学习机器学习的动力。选择这种手势原因是因为只有24个字母，你的电脑足以带的动，虽然我只训练A、B、C、D等字母的手势识别，但只要掌握了方法，你可以全部弄完24个字母的手势（我觉得没这必要）。

应用：ASL是美国聋人社区的主要交流方式。手势识别技术可以将ASL手势转化为文字或语音，实现聋人与听觉人群之间的无障碍沟通。通过识别ASL手势并转化为文字或语音，聋人可以与非手语使用者进行实时对话、视频通话或传递信息。

地址：

介绍：准确的颜色框选功能，统一使用绿色边界框显示；对物体内部的颜色边缘轮廓进行识别，以白色为边缘，实现更加精细的框选；用户可以选择感兴趣的颜色进行识别，不想要的颜色将被排除；在窗口中的边框旁打印相应的颜色英文字母；对于效果不理想的情况，可通过调试Color_trackbar.py文件进行优化。

应用：在物流和仓储方面，通过物体颜色识别，可以实现对货物的自动识别和分类，提高物流和仓储的效率。例如，将不同颜色的包裹或商品按照目的地进行自动分拣和打包。

地址：

介绍：本次项目是我的软件课设，自主命题。智能计数指的是对特定物体进行计数（对于比较规整的物体效果很好，例如硬币、钥匙、方块等），表单信息指的是对图片进行计数并写入excel表格当中。从投入到应用角度来看，使用深度学习的方法是更加的准确，而使用opencv的方法有局限性，仍然有改进的空间。

应用：物体体计数能够对场景中的物体进行准确的计数，为决策和统计提供重要依据；而表单信息则能够自动化地将检测到的信息整理并存储，方便后续的分析和查询。在零售、安防、交通监控等领域发挥着重要作用。

地址：

介绍：简单的自娱自乐的计算机视觉互动游戏，石头剪刀布，使用random生成随机数，用于模拟AI窗口随机出拳，玩家窗口手势识别检测石头、剪刀、布三种手势，根据游戏规则，两方玩家进行比较，按下空格键即为游戏开始，玩家在游戏开始后，有三秒的时间思考出拳策略。计时器会显示在屏幕上。在时间结束后，玩家出拳并与AI进行比较，根据游戏规则判断胜负并累计分数。**

应用：简单互动式的计算机视觉游戏。