MediaPipe Hands新手教程：从环境搭建到WebUI展示，完整流程解析

张开发

• 2026/6/1 13:36:15 • 15 分钟阅读

分享文章

MediaPipe Hands新手教程从环境搭建到WebUI展示完整流程解析1. 引言为什么选择MediaPipe Hands手势识别技术正在改变我们与设备的交互方式。想象一下无需触碰屏幕只需在空中比划手势就能控制智能家居、玩游戏或进行演示。MediaPipe Hands作为Google开源的手势识别解决方案以其轻量级和高精度著称。与传统方案相比MediaPipe Hands有三大优势轻量高效仅3MB大小普通CPU就能流畅运行精准识别可检测21个手部关键点包括每个指节开箱即用无需复杂配置几行代码就能实现功能本教程将带你从零开始完整实现一个带Web界面的手势识别系统最终效果是上传图片后能看到彩色骨骼线标注的手部关键点。2. 环境准备与安装2.1 基础环境要求确保你的系统满足以下条件Python 3.7或更高版本pip包管理工具可联网下载依赖2.2 安装必要库打开终端或命令行执行以下命令pip install mediapipe opencv-python flask numpy这行命令会安装四个核心库mediapipeGoogle的手势识别库opencv-python图像处理工具flask轻量级Web框架numpy科学计算库安装过程通常只需1-2分钟。如果遇到速度慢的问题可以添加-i https://pypi.tuna.tsinghua.edu.cn/simple使用国内镜像源。3. 核心代码实现3.1 初始化手势识别模型创建一个名为hand_tracking.py的文件添加以下代码import cv2 import mediapipe as mp # 初始化MediaPipe Hands mp_hands mp.solutions.hands hands mp_hands.Hands( static_image_modeTrue, # 单图模式 max_num_hands2, # 最多检测2只手 min_detection_confidence0.5, # 置信度阈值 model_complexity0 # 使用轻量级模型 )关键参数说明static_image_modeTrue表示处理静态图片False适合视频流model_complexity0轻量1标准2高精度但更耗资源3.2 实现彩虹骨骼可视化继续在文件中添加可视化代码# 定义每根手指的颜色BGR格式 FINGER_COLORS [ (0, 255, 255), # 黄色 - 拇指 (128, 0, 128), # 紫色 - 食指 (255, 255, 0), # 青色 - 中指 (0, 255, 0), # 绿色 - 无名指 (0, 0, 255) # 红色 - 小指 ] def draw_hand_skeleton(image, landmarks): h, w image.shape[:2] points [(int(land.x * w), int(land.y * h)) for land in landmarks.landmark] # 绘制关节白点 for point in points: cv2.circle(image, point, 5, (255, 255, 255), -1) # 定义手指连接关系 connections [ [0, 1, 2, 3, 4], # 拇指 [0, 5, 6, 7, 8], # 食指 [0, 9, 10, 11, 12], # 中指 [0, 13, 14, 15, 16], # 无名指 [0, 17, 18, 19, 20] # 小指 ] # 绘制彩色骨骼线 for i, finger in enumerate(connections): color FINGER_COLORS[i] for j in range(len(finger)-1): start points[finger[j]] end points[finger[j1]] cv2.line(image, start, end, color, 2) return image这段代码实现了将21个关键点映射到图像坐标用白色圆点标记每个关节用不同颜色线条连接每根手指的关节3.3 创建Web服务接口添加Flask Web服务代码from flask import Flask, request, jsonify import numpy as np app Flask(__name__) app.route(/detect, methods[POST]) def detect_hand(): if image not in request.files: return jsonify({error: No image uploaded}), 400 file request.files[image] img_bytes np.frombuffer(file.read(), np.uint8) image cv2.imdecode(img_bytes, cv2.IMREAD_COLOR) # 转换为RGB格式 rgb_image cv2.cvtColor(image, cv2.COLOR_BGR2RGB) results hands.process(rgb_image) if results.multi_hand_landmarks: for landmarks in results.multi_hand_landmarks: image draw_hand_skeleton(image, landmarks) cv2.imwrite(static/result.jpg, image) return jsonify({success: True, result_url: /static/result.jpg}) else: return jsonify({success: False, message: No hand detected}) if __name__ __main__: app.run(host0.0.0.0, port5000)4. 前端界面开发4.1 创建简单HTML页面在项目目录下创建templates/index.html文件!DOCTYPE html html head title手势识别演示/title style body { font-family: Arial; max-width: 800px; margin: 0 auto; padding: 20px; } #preview { max-width: 100%; margin-top: 20px; display: none; } #result { max-width: 100%; margin-top: 20px; display: none; } .upload-btn { padding: 10px 15px; background: #4CAF50; color: white; border: none; cursor: pointer; border-radius: 4px; } /style /head body h1手势识别演示/h1 p上传包含手部的图片系统将自动识别并标注21个关键点/p input typefile idupload acceptimage/* button classupload-btn onclickuploadImage()分析图片/button div h3原始图片/h3 img idpreview /div div h3识别结果/h3 img idresult /div script document.getElementById(upload).onchange function(e) { const file e.target.files[0]; const reader new FileReader(); reader.onload function(event) { const img document.getElementById(preview); img.src event.target.result; img.style.display block; } reader.readAsDataURL(file); } function uploadImage() { const fileInput document.getElementById(upload); if (!fileInput.files[0]) { alert(请先选择图片); return; } const formData new FormData(); formData.append(image, fileInput.files[0]); fetch(/detect, { method: POST, body: formData }) .then(response response.json()) .then(data { if (data.success) { const resultImg document.getElementById(result); resultImg.src data.result_url ?t new Date().getTime(); resultImg.style.display block; } else { alert(data.message || 识别失败); } }) .catch(error { console.error(Error:, error); alert(请求失败); }); } /script /body /html4.2 更新Flask路由在hand_tracking.py中添加首页路由from flask import render_template app.route(/) def index(): return render_template(index.html)同时确保创建了static文件夹存放结果图片mkdir static5. 运行与测试5.1 启动服务在终端运行python hand_tracking.py看到类似输出表示启动成功* Running on http://0.0.0.0:50005.2 测试流程打开浏览器访问http://localhost:5000点击选择文件上传包含手部的图片点击分析图片按钮等待1-2秒后查看识别结果5.3 常见问题解决问题1导入mediapipe时报错解决方案确保安装的是最新版pip install --upgrade mediapipe问题2图片上传后无反应检查浏览器控制台(F12)是否有报错后端终端是否有日志问题3识别效果不理想尝试调整图片角度确保手部清晰可见可调节min_detection_confidence参数(0-1之间)6. 进阶优化建议6.1 性能优化技巧图片尺寸调整# 在处理前缩小图片尺寸 image cv2.resize(image, (640, 480)) # 调整为适合的大小模型复用避免在每次请求时重新初始化模型批量处理如需处理多张图片可以考虑批量请求6.2 功能扩展思路手势分类基于关键点位置实现特定手势识别如点赞、比耶等实时视频修改static_image_modeFalse实现摄像头实时检测3D可视化利用MediaPipe提供的z坐标信息实现3D效果6.3 部署建议生产环境考虑使用Gunicorn或Waitress替代Flask开发服务器容器化创建Docker镜像便于部署缓存机制对相同图片添加缓存避免重复计算获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章

前端开发 2026/5/27 2:16:13

终极指南：如何用present打造震撼终端演示——解锁烟花、爆炸、矩阵等特效的秘密

终极指南：如何用present打造震撼终端演示——解锁烟花、爆炸、矩阵等特效的秘密【免费下载链接】present A terminal-based presentation tool with colors and effects. 项目地址: https://gitcode.com/gh_mirrors/pr/present present是一款基于终端的演示…

发散创新：基于Go语言的服务网格实践与流量治理实战在微服务架构日益复杂的今天，服务网格（Service Mesh） 已成为云原生生态中不可或缺的一环。它通过将服务间通信的控制逻辑从应用代码中剥离出来，实现了更细粒度的流量…

张开发

前端开发 2026/5/25 11:04:15

Android-backup-extractor问题排查：常见错误与解决方案完整清单

Android-backup-extractor问题排查：常见错误与解决方案完整清单【免费下载链接】android-backup-extractor Android backup extractor 项目地址: https://gitcode.com/gh_mirrors/an/android-backup-extractor Android-backup-extractor是一款实用的Android…

张开发

MediaPipe Hands新手教程：从环境搭建到WebUI展示，完整流程解析

最新文章

2025最权威的六大降重复率助手实测分析

零成本构建移动服务器：基于Termux的安卓Web服务实战

别再只用默认指标了！用通达信APP自定义一个‘分时T+0’盯盘助手，保姆级配置指南

告别“一锤子买卖”：给你的Xilinx FPGA设计加上Multiboot双镜像冗余备份

苹果15年来首次换帅，新CEO能否带领苹果打赢AI硬件之战？

从‘联网盒子’到‘数据枢纽’：T-BOX的十年演进与未来猜想（附：独立硬件 vs 融入域控的深度分析）

推荐文章

相关文章

分享文章

更多文章

终极指南：如何用present打造震撼终端演示——解锁烟花、爆炸、矩阵等特效的秘密

23、数组去重有哪些方式？

如何使用Gin构建高性能知识付费API：从课程销售到内容保护的完整指南

5分钟快速上手Rocket.Chat实时监控：从告警到性能优化的完整指南

终极指南：gh_mirrors/ema/emacs.d的Vim模拟——Evil模式配置详解

深度学习必学内容：六周掌握核心知识点

告别编译报错！OCCT 7.9.0 + VS2022 + CMake 3.29 保姆级编译指南（附VTK路径配置）

Rust async-await 背后的原理

别再死磕公式了！用OpenCV的calibrateHandEye函数搞定机械臂手眼标定（眼在手外）

Phi-3-mini-4k-instruct-gguf基础教程：GGUF格式轻量模型在边缘设备部署的可行性验证

发散创新：基于Go语言的服务网格实践与流量治理实战在微服务架构日益复杂的今天，**服务网格（Serv

Android-backup-extractor问题排查：常见错误与解决方案完整清单