简历按需查询新趋势:从PDF到MCP的AI Agent智能检索

2026-06-08阅读 0热度 0
ai

从 PDF 到 MCP:让 AI Agent 按需查询你的简历

目前越来越多的企业借助 AI 进行简历初筛——HR 将职位描述(JD)输入 Agent,由 Agent 执行候选人匹配。这看似高效,实际存在一个关键问题:简历大多以 PDF(或网页)形式呈现,AI 解析时极易被排版干扰、信息分散,想要精确检索某个细节更是难上加难。

从 PDF 到 MCP:让 AI Agent 按需查询你的简历

所以核心思考是:为什么不直接构建一份 AI 原生可读的简历?不是那种空洞的“AI 友好”说辞,而是真正让 AI Agent 能够连接、按需查询并执行结构化分析。

为此,我们开发了一个项目:为个人简历附加一个 MCP Server。当招聘方访问公开页面时,AI Agent 能够自动发现该端点,连接后可搜索工作经历、分析岗位匹配度、查询技能熟练度。整个项目已在 GitHub 上开源(文末附链接)。

本文不聚焦技术实现的复杂性(实际上只是一个基础实现),而是重点讨论简历 + MCP这一组合所带来的深层价值。

什么是 MCP?

MCP(Model Context Protocol)是 Anthropic 提出的开放协议,旨在让 AI Agent 以标准化方式接入外部数据源和工具。可以将其理解为“AI 时代的 API”——其独特之处在于 MCP 是自描述的:工具本身包含 name、description、inputSchema,AI Agent 能够自动理解其用法,无需额外编写对接文档。

先看效果

招聘方的 AI Agent 连接后能完成哪些操作?直接看几个实际交互场景:

问:搜索大数据相关经历

search_resume({ query: "大数据" })
→ 返回:相关经历片段 + 来源模块 + 相关性评分

问:候选人是否适合这个岗位?

evaluate_fit({job_description: "高级全栈工程师,5年+经验,React/Node.js,有大数据平台开发经验,熟悉 DevOps"})
→ {score: 82,matched: ["react", "node", "big data", "devops", ...],missing: ["Kubernetes"],recommendation: "Strong match! ..."}

问:提供全面评估

get_career_summary({})
→ {seniority: "senior",totalYears: 6,domains: ["大数据云服务", "跨端应用开发", "独立产品开发"],coreStrengths: ["多技术栈适应能力", "独立产品交付", "AI 协议设计"],topSkills: [{ name: "React", level: 4, yearsUsed: 5 }, ...]}

所有输出均为结构化 JSON,AI Agent 可直接程序化处理,无需解析 PDF 或网页。

关键不是技术,是产品逻辑

投简历的方式变了

传统流程:投递 PDF → HR 人工浏览 → 可能转交 AI 辅助判断
新流程:向 HR 提供链接 + 邀请码 → HR 的 AI Agent 连接 MCP → Agent 自主决定查询内容和分析方法

核心区别在于:信息查询的主导权从 HR 转移到 AI Agent。Agent 能够根据自身关注的问题动态查询,而非被动解读固定格式文档。

邀请码 = 反向筛选

这一设计最具巧思。

投递简历时向 HR 提供「链接 + 邀请码」。HR 需将邀请码配置到 AI 客户端,Agent 才能获取深层信息。

此流程本身就是一道筛选门槛:AI 素养不足的团队根本无法完成配置。能够走通这一流程,说明该团队已实际运用 AI Agent 开展招聘工作,大概率具备更现代化的组织文化。

同时,邀请码支持溯源追踪——能够看到对方的 Agent 具体查询了哪些工具以及查询时间。这比传统的“简历被查看”通知更具价值,能明确揭示招聘方真正关注的重点。

隐私分级

公开页面与 MCP 返回的信息实施分级管理:

层级可见内容渠道
公开姓名、title、技能标签、工作经历/ 公开页
MCP 查询项目细节、技能熟练度、匹配分析/mcp(需邀请码)
隐私邮箱、手机号不通过 MCP 暴露

并非所有信息都适合直接提供给 AI。联系方式等敏感数据应保留在人工沟通阶段处理。

三层发现机制

AI Agent 如何发现简历附带的 MCP 服务?这是整个设计的关键环节——发现比连接更重要。

AI Agent 访问 https://your-domain.com
↓
解析 HTML,发现 
↓
请求 /.well-known/mcp 获取完整元数据(工具列表、认证方式)
↓
使用邀请码通过 Authorization header 连接
↓
开始查询

三层发现机制由浅入深:

第一层:HTML 注入 — 公开页自动嵌入,零维护成本



<script type="application/ld+json">{ "@type": "Person", "name": "...", "knowsAbout": [...] }</script>

第二层:/.well-known/mcp — 标准 well-known 端点,提供机器可读的完整 MCP 配置

{"mcp": {"endpoint": "/mcp","transport": "http","auth": { "type": "bearer" },"tools": [...]}}

第三层:/llms.txt — 遵循 llms.txt 标准,以 Markdown 格式呈现 AI 友好的描述信息

这三层数据均由服务端自动生成,统一来源于同一份 resume.json。简历修改后,所有发现信息同步更新。

架构设计

本项目为自托管全栈应用,非 SaaS 架构。面向单用户,部署于自有服务器。

/   → 公开页(任何人可见,注入 MCP 发现信息)
/mcp → MCP endpoint(邀请码认证,供 AI Agent 使用)
/edit→ 简历编辑器(认证码认证,供用户自用)

核心原则:数据仅有一份 resume.json,编辑器与 MCP 共享同一数据源。MCP 每次请求实时读取最新数据,彻底避免缓存同步问题。

技术栈方面无需过多渲染:React 19 + Vite 7 + Tailwind 4 构建编辑器,Node.js 原生 HTTP 处理服务端请求,MCP SDK 实现协议层,Zod 执行数据校验。搜索功能采用自实现的 TF 评分配合中英混合分词,基本满足需求但不算出色——目前仅停留在关键词匹配水平,与真正的语义搜索尚有差距。

工具总计 8 个:

工具功能说明
get_profile返回公开信息,隐私字段不过 MCP
get_experience工作经历,支持关键词过滤
get_projects项目经历,支持技术栈过滤
get_skills技能列表,附带熟练度和年限
get_education教育背景
search_resume全文搜索,TF 相关性评分
evaluate_fit根据 JD 输出匹配分 + 缺失技能
get_career_summary职业概览:资级、领域、核心优势

每个工具均支持 format: 'text' | 'json',text 便于人工阅读,json 供程序处理。

一些工程选择

不展开赘述,提炼几项值得关注的决策:

  • 原子写入而非数据库 — 简历数据仅 2KB,使用 SQLite 都显得冗余。采用 write-to-temp + rename 实现原子操作,配合写入队列防止并发冲突,完全够用。
  • MCP 请求时实时创建 Server 实例 — 不采用启动时创建长驻 MCP Server 的模式,而是每次请求时执行 createMcpServer(currentResume)。确保读取始终为最新数据,编辑器保存后 MCP 立即感知变化。
  • Zod schema 校验 — 读写数据前均执行验证。前端编辑器虽已进行校验,但后端不信任前端输入是基本安全原则。
  • stdio 模式 — 除 HTTP 外,支持 start:stdio 模式,可直接在 Claude Desktop 中配置,本地开发无需启动服务器。

部署

# Docker 一键部署
cp config.example.json config.json # 设置 authCode
docker compose up -d

或通过 Claude Desktop 直连:

{"mcpServers": {"resume": {"command": "npx","args": ["tsx", "server/stdio.ts"],"cwd": "/path/to/resume-maker"}}}

说点真话

本项目的搜索与匹配算法确实存在局限。TF 评分仅依赖关键词频率统计,技能标准化靠查表映射,evaluate_fit 的匹配逻辑本质上仍是字符串包含检测。这些与“精准理解个人数据”的目标相距甚远。

但项目真正的价值不在此处。

真正的价值在于“简历 + MCP”这一组合所催生的新可能:

  1. 信息获取方式变革 — 从“读取固定文档”转向“AI 按需查询结构化数据”
  2. 筛选逻辑革新 — 邀请码机制反向筛选招聘方的 AI 素养
  3. 数据主权重构 — 数据存储于自有服务器,由你决定谁能查看什么

这三个变化与技术实现的复杂性无关,属于产品形态层面的创新突破。

MCP 尚处于早期阶段,真正运用 AI Agent 连接 MCP 进行招聘的企业极为罕见。但方向已经明确——随着 AI 在招聘流程中扮演越来越重要的角色,简历应当从“供人阅读的文档”进化为“供 AI 查询的数据源”。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策