错题自动切分系统推荐：基于YOLOv11深度学习

2026-06-09阅读 0热度 0

深度学习

基于DyHead与YOLOv11的错题自动切分系统

这项技术的核心思路很直接：将动态头部检测（DyHead）与YOLOv11深度融合，构建一套自动识别错题的系统。系统主要完成三项任务——借助DyHead精准切割试卷上的题目区域，利用YOLOv11识别五种常见批改符号（✕、/、✓̷、?、○），最后通过四层匹配逻辑将错题与符号一一对应。

核心技术

双模型协同架构

模块	技术方案	精度指标
题目分割	DyHead+Swin-Transformer	mAP@0.5: 98.2%
错符检测	YOLOv11-640	F1-score: 96.5%

在题目分割环节，DyHead与Swin-Transformer联合工作，mAP@0.5达到98.2%，基本能将每道题的边界精准框定。错符检测则使用YOLOv11-640，F1-score为96.5%，对五类批改符号的识别表现稳定。

四级匹配策略

匹配逻辑是整个系统中最精巧的部分。如何将错题与错符正确关联？这里设计了四个层级，按优先级从高到低依次执行：

中心点包含（最高优先级）——若错符的中心点落在题目框内部，直接配对，简单且高效。
重叠面积占比 >30%——若中心点不满足条件，则检查两者重叠区域是否超过题目面积的30%。
IOU相似度 >0.25——若重叠面积仍不足，则计算交并比是否大于0.25。
欧氏距离 <50px（兜底方案）——若以上均无法匹配，则取距离最近的错符与题目，50像素以内视为匹配。

这套策略几乎杜绝了漏匹配的情况。实际测试数据显示，中心点包含方案覆盖了绝大多数场景——因为大部分错符直接写在题目区域内。后面三层主要应对边界情况，例如错符恰好落在题目边缘线上。

快速部署

环境配置

# 安装PyTorch+CUDA11.8
pip install torch==2.4.1 torchvision==0.19.1 --index-url https://download.pytorch.org/whl/cu118

# 安装项目依赖
pip install -e detectron2 ultralytics flask pillow==9.5.0

模型部署

下载预训练模型后，按以下路径存放：

./configs/dyhead_swint_atss_fpn_2x_ms.yaml
./yolo_ckps/best.pt

启动服务

python flask_error_detection.py  # 访问 http://localhost:5004

API接口文档

错题检测接口

Endpoint: POST /detect

请求示例：

curl -X POST http://localhost:5004/detect -F "image=@test.jpg"

响应示例：

{
  "success": true,
  "data": {
    "error_count": 3,
    "questions": [
      {
        "bbox": [100,50,200,150],
        "errors": [
          {
            "type": "cuo",
            "confidence": 0.92,
            "match_method": "中心点包含"
          }
        ]
      }
    ],
    "visualization": {
      "errors_img": "base64...",
      "matches_img": "base64..."
    }
  }
}

接口返回信息非常直观——错题总数、每道题的边界框、对应错符类型及置信度，还附带可视化结果图。base64编码的图片可直接在前端渲染，省去了额外的图片处理中间环节。

系统架构

Cut/
├── core/
│   ├── dyhead_detector.py  # 题目区域分割
│   └── yolo_detector.py    # 错符检测
├── utils/
│   ├── matcher.py          # 四级匹配算法
│   └── visualization.py   # 结果可视化
└── web/
    ├── static/             # 前端资源
    └── templates/          # HTML页面

架构设计轻量级，核心逻辑仅四个文件：两个检测器、一个匹配器、一个可视化工具。Web层使用Flask搭建，前端资源直接挂在static目录下，部署流程几乎没有额外负担。

效果演示

Web界面支持实时上传试卷图片，系统自动标注错题区域，并支持逐一切分下载。实际测试表明，无论是A4还是B5尺寸的试卷，手写批改痕迹还是印刷体符号，都能稳定处理。

![检测效果对比图]

左：原始试卷 | 右：错题标记与切分结果

教育场景适配：支持A4/B5试卷、手写批改痕迹、多科目符号体

这套系统已经在真实教育场景中持续运行。最大的优势在于无需对试卷做任何预处理——直接拍照上传即可。当然，若试卷倾斜严重或光线极差，建议先做预处理，以进一步提升检测精度。