错题自动切分系统推荐:基于YOLOv11深度学习

2026-06-09阅读 0热度 0
深度学习

基于DyHead与YOLOv11的错题自动切分系统

这项技术的核心思路很直接:将动态头部检测(DyHead)与YOLOv11深度融合,构建一套自动识别错题的系统。系统主要完成三项任务——借助DyHead精准切割试卷上的题目区域,利用YOLOv11识别五种常见批改符号(✕、/、✓̷、?、○),最后通过四层匹配逻辑将错题与符号一一对应。

核心技术

双模型协同架构

模块 技术方案 精度指标
题目分割 DyHead+Swin-Transformer mAP@0.5: 98.2%
错符检测 YOLOv11-640 F1-score: 96.5%

在题目分割环节,DyHead与Swin-Transformer联合工作,mAP@0.5达到98.2%,基本能将每道题的边界精准框定。错符检测则使用YOLOv11-640,F1-score为96.5%,对五类批改符号的识别表现稳定。

四级匹配策略

匹配逻辑是整个系统中最精巧的部分。如何将错题与错符正确关联?这里设计了四个层级,按优先级从高到低依次执行:

  • 中心点包含(最高优先级)——若错符的中心点落在题目框内部,直接配对,简单且高效。
  • 重叠面积占比 >30%——若中心点不满足条件,则检查两者重叠区域是否超过题目面积的30%。
  • IOU相似度 >0.25——若重叠面积仍不足,则计算交并比是否大于0.25。
  • 欧氏距离 <50px(兜底方案)——若以上均无法匹配,则取距离最近的错符与题目,50像素以内视为匹配。

这套策略几乎杜绝了漏匹配的情况。实际测试数据显示,中心点包含方案覆盖了绝大多数场景——因为大部分错符直接写在题目区域内。后面三层主要应对边界情况,例如错符恰好落在题目边缘线上。

快速部署

环境配置

# 安装PyTorch+CUDA11.8
pip install torch==2.4.1 torchvision==0.19.1 --index-url https://download.pytorch.org/whl/cu118

# 安装项目依赖
pip install -e detectron2 ultralytics flask pillow==9.5.0

模型部署

下载预训练模型后,按以下路径存放:

./configs/dyhead_swint_atss_fpn_2x_ms.yaml
./yolo_ckps/best.pt

启动服务

python flask_error_detection.py  # 访问 http://localhost:5004

API接口文档

错题检测接口

Endpoint: POST /detect

请求示例:

curl -X POST http://localhost:5004/detect -F "image=@test.jpg"

响应示例:

{
  "success": true,
  "data": {
    "error_count": 3,
    "questions": [
      {
        "bbox": [100,50,200,150],
        "errors": [
          {
            "type": "cuo",
            "confidence": 0.92,
            "match_method": "中心点包含"
          }
        ]
      }
    ],
    "visualization": {
      "errors_img": "base64...",
      "matches_img": "base64..."
    }
  }
}

接口返回信息非常直观——错题总数、每道题的边界框、对应错符类型及置信度,还附带可视化结果图。base64编码的图片可直接在前端渲染,省去了额外的图片处理中间环节。

系统架构

Cut/
├── core/
│   ├── dyhead_detector.py  # 题目区域分割
│   └── yolo_detector.py    # 错符检测
├── utils/
│   ├── matcher.py          # 四级匹配算法
│   └── visualization.py   # 结果可视化
└── web/
    ├── static/             # 前端资源
    └── templates/          # HTML页面

架构设计轻量级,核心逻辑仅四个文件:两个检测器、一个匹配器、一个可视化工具。Web层使用Flask搭建,前端资源直接挂在static目录下,部署流程几乎没有额外负担。

效果演示

Web界面支持实时上传试卷图片,系统自动标注错题区域,并支持逐一切分下载。实际测试表明,无论是A4还是B5尺寸的试卷,手写批改痕迹还是印刷体符号,都能稳定处理。

![检测效果对比图]

左:原始试卷 | 右:错题标记与切分结果

教育场景适配:支持A4/B5试卷、手写批改痕迹、多科目符号体

这套系统已经在真实教育场景中持续运行。最大的优势在于无需对试卷做任何预处理——直接拍照上传即可。当然,若试卷倾斜严重或光线极差,建议先做预处理,以进一步提升检测精度。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策