参考视频
B站视频地址:【让 PLC 读懂人体动作:MediaPipe Pose 在工业安全监控中的应用】
什么是 MediaPipe Pose?适合工控场景吗?


在介绍姿态识别之前,先来聊聊它的“核心大脑” —— MediaPipe Pose。
MediaPipe Pose 简介
MediaPipe Pose 是 Google MediaPipe 框架下的一款 单人人体关键点检测模型,可在图像中实时预测 33 个关键骨骼点的位置(包括头、躯干、手臂、腿部等),并输出每个点的三维坐标(x, y, z)和可见度。
✅ 它并非“分类模型”,而是通过骨架结构,赋予开发者更大的自由度去设计动作识别逻辑。
技术优势:为什么选择 MediaPipe Pose?
特性 | 描述 |
---|---|
高性能 | 使用轻量化模型,CPU 即可实时运行,在普通笔记本、工控机上无需 GPU |
精准结构 | 输出 33 个人体关键点,比传统 17 点模型(如 COCO)更细致 |
稳定性高 | 带有 Tracking 模块,可持续跟踪目标,减少抖动和误判 |
可嵌入性 | 无需联网、本地运行、资源占用低,适合边缘计算与嵌入式部署 |
可组合性强 | 输出的是骨骼点坐标,可自由构建“站立”、“坐姿”等复杂状态逻辑 |
这正好契合我们“工控场景”的关键需求 —— 轻便、稳定、可控、好嵌入。
工控人的视角:我们怎么用 MediaPipe Pose?
我们在原始 MediaPipe Pose 模型基础上,加入了姿态状态判断、中文视觉增强、Modbus TCP 输出、HTTP 视频流发布等功能,打造出完整的“工控级姿态识别小系统”。
系统功能概览
功能模块 | 说明 |
---|---|
✅ 姿态识别 | 使用 Holding Register 写入状态(如 2=举手, 3=跌倒),可被 PLC 03功能码读取 |
✅ Modbus TCP 输出 | 使用 Holding Register 写入状态(如 2=举手, 3=跌倒),可被 PLC 03功能码读取 |
✅ 视频可视化 | 使用http网络串流推送视频,带中文标签的画面支持浏览器访问 ( |
✅ USB / RTSP / 文件支持 | 可从摄像头、网络流、历史录像中获取画面 |
✅ 中文 GUI 操作界面 | 不需要命令行,工控人员也能直接使用 |
姿态状态码示意(Modbus 寄存器输出)
我们针对工业现场实际需求,将复杂的人体姿态分类精简为 4 种关键状态,并通过 Modbus TCP(端口 502,站号 1,寄存器地址 0) 实时发布,便于 PLC、SCADA、MES 等系统直接读取和响应:
此判断逻辑更符合工业场景下的实际需求 —— 如识别紧急举手求助或意外跌倒。
部署与应用场景
该软件为 可执行程序(.exe),支持 Windows 10+ 环境运行,适用于:
厂区智能巡检:判断站岗人员状态是否异常;
设备操作行为记录:是否有人操作、是否正确姿态;
人员行为分析:数据上报 MES、生成安全报告;
⚠️ 跌倒检测报警:通过 SCADA 联动摄像头与警报;
- ⬇️ 下载链接:
- 源代码及调试生成:
MediaPipe Pose 姿态识别:源码、安装与一键打包 EXE
暂无评论内容