简历按需查询新趋势：从PDF到MCP的AI Agent智能检索

2026-06-08阅读 0热度 0

从 PDF 到 MCP：让 AI Agent 按需查询你的简历

目前越来越多的企业借助 AI 进行简历初筛——HR 将职位描述（JD）输入 Agent，由 Agent 执行候选人匹配。这看似高效，实际存在一个关键问题：简历大多以 PDF（或网页）形式呈现，AI 解析时极易被排版干扰、信息分散，想要精确检索某个细节更是难上加难。

所以核心思考是：为什么不直接构建一份 AI 原生可读的简历？不是那种空洞的“AI 友好”说辞，而是真正让 AI Agent 能够连接、按需查询并执行结构化分析。

为此，我们开发了一个项目：为个人简历附加一个 MCP Server。当招聘方访问公开页面时，AI Agent 能够自动发现该端点，连接后可搜索工作经历、分析岗位匹配度、查询技能熟练度。整个项目已在 GitHub 上开源（文末附链接）。

本文不聚焦技术实现的复杂性（实际上只是一个基础实现），而是重点讨论简历 + MCP这一组合所带来的深层价值。

什么是 MCP？

MCP（Model Context Protocol）是 Anthropic 提出的开放协议，旨在让 AI Agent 以标准化方式接入外部数据源和工具。可以将其理解为“AI 时代的 API”——其独特之处在于 MCP 是自描述的：工具本身包含 name、description、inputSchema，AI Agent 能够自动理解其用法，无需额外编写对接文档。

先看效果

招聘方的 AI Agent 连接后能完成哪些操作？直接看几个实际交互场景：

问：搜索大数据相关经历

search_resume({ query: "大数据" })
→ 返回：相关经历片段 + 来源模块 + 相关性评分

问：候选人是否适合这个岗位？

evaluate_fit({job_description: "高级全栈工程师，5年+经验，React/Node.js，有大数据平台开发经验，熟悉 DevOps"})
→ {score: 82,matched: ["react", "node", "big data", "devops", ...],missing: ["Kubernetes"],recommendation: "Strong match! ..."}

问：提供全面评估

get_career_summary({})
→ {seniority: "senior",totalYears: 6,domains: ["大数据云服务", "跨端应用开发", "独立产品开发"],coreStrengths: ["多技术栈适应能力", "独立产品交付", "AI 协议设计"],topSkills: [{ name: "React", level: 4, yearsUsed: 5 }, ...]}

所有输出均为结构化 JSON，AI Agent 可直接程序化处理，无需解析 PDF 或网页。

关键不是技术，是产品逻辑

投简历的方式变了

传统流程：投递 PDF → HR 人工浏览 → 可能转交 AI 辅助判断
新流程：向 HR 提供链接 + 邀请码 → HR 的 AI Agent 连接 MCP → Agent 自主决定查询内容和分析方法

核心区别在于：信息查询的主导权从 HR 转移到 AI Agent。Agent 能够根据自身关注的问题动态查询，而非被动解读固定格式文档。

邀请码 = 反向筛选

这一设计最具巧思。

投递简历时向 HR 提供「链接 + 邀请码」。HR 需将邀请码配置到 AI 客户端，Agent 才能获取深层信息。

此流程本身就是一道筛选门槛：AI 素养不足的团队根本无法完成配置。能够走通这一流程，说明该团队已实际运用 AI Agent 开展招聘工作，大概率具备更现代化的组织文化。

同时，邀请码支持溯源追踪——能够看到对方的 Agent 具体查询了哪些工具以及查询时间。这比传统的“简历被查看”通知更具价值，能明确揭示招聘方真正关注的重点。

隐私分级

公开页面与 MCP 返回的信息实施分级管理：

层级	可见内容	渠道
公开	姓名、title、技能标签、工作经历	`/` 公开页
MCP 查询	项目细节、技能熟练度、匹配分析	`/mcp`（需邀请码）
隐私	邮箱、手机号	不通过 MCP 暴露

并非所有信息都适合直接提供给 AI。联系方式等敏感数据应保留在人工沟通阶段处理。

三层发现机制

AI Agent 如何发现简历附带的 MCP 服务？这是整个设计的关键环节——发现比连接更重要。

AI Agent 访问 https://your-domain.com
↓
解析 HTML，发现 
↓
请求 /.well-known/mcp 获取完整元数据（工具列表、认证方式）
↓
使用邀请码通过 Authorization header 连接
↓
开始查询

三层发现机制由浅入深：

第一层：HTML 注入 — 公开页自动嵌入，零维护成本



<script type="application/ld+json">{ "@type": "Person", "name": "...", "knowsAbout": [...] }</script>

第二层：/.well-known/mcp — 标准 well-known 端点，提供机器可读的完整 MCP 配置

{"mcp": {"endpoint": "/mcp","transport": "http","auth": { "type": "bearer" },"tools": [...]}}

第三层：/llms.txt — 遵循 llms.txt 标准，以 Markdown 格式呈现 AI 友好的描述信息

这三层数据均由服务端自动生成，统一来源于同一份 resume.json。简历修改后，所有发现信息同步更新。

架构设计

本项目为自托管全栈应用，非 SaaS 架构。面向单用户，部署于自有服务器。

/   → 公开页（任何人可见，注入 MCP 发现信息）
/mcp → MCP endpoint（邀请码认证，供 AI Agent 使用）
/edit→ 简历编辑器（认证码认证，供用户自用）

核心原则：数据仅有一份 resume.json，编辑器与 MCP 共享同一数据源。MCP 每次请求实时读取最新数据，彻底避免缓存同步问题。

技术栈方面无需过多渲染：React 19 + Vite 7 + Tailwind 4 构建编辑器，Node.js 原生 HTTP 处理服务端请求，MCP SDK 实现协议层，Zod 执行数据校验。搜索功能采用自实现的 TF 评分配合中英混合分词，基本满足需求但不算出色——目前仅停留在关键词匹配水平，与真正的语义搜索尚有差距。

工具总计 8 个：

工具	功能说明
`get_profile`	返回公开信息，隐私字段不过 MCP
`get_experience`	工作经历，支持关键词过滤
`get_projects`	项目经历，支持技术栈过滤
`get_skills`	技能列表，附带熟练度和年限
`get_education`	教育背景
`search_resume`	全文搜索，TF 相关性评分
`evaluate_fit`	根据 JD 输出匹配分 + 缺失技能
`get_career_summary`	职业概览：资级、领域、核心优势

每个工具均支持 format: 'text' | 'json'，text 便于人工阅读，json 供程序处理。

一些工程选择

不展开赘述，提炼几项值得关注的决策：

原子写入而非数据库 — 简历数据仅 2KB，使用 SQLite 都显得冗余。采用 write-to-temp + rename 实现原子操作，配合写入队列防止并发冲突，完全够用。
MCP 请求时实时创建 Server 实例 — 不采用启动时创建长驻 MCP Server 的模式，而是每次请求时执行 createMcpServer(currentResume)。确保读取始终为最新数据，编辑器保存后 MCP 立即感知变化。
Zod schema 校验 — 读写数据前均执行验证。前端编辑器虽已进行校验，但后端不信任前端输入是基本安全原则。
stdio 模式 — 除 HTTP 外，支持 start:stdio 模式，可直接在 Claude Desktop 中配置，本地开发无需启动服务器。

部署

# Docker 一键部署
cp config.example.json config.json # 设置 authCode
docker compose up -d

或通过 Claude Desktop 直连：

{"mcpServers": {"resume": {"command": "npx","args": ["tsx", "server/stdio.ts"],"cwd": "/path/to/resume-maker"}}}

说点真话

本项目的搜索与匹配算法确实存在局限。TF 评分仅依赖关键词频率统计，技能标准化靠查表映射，evaluate_fit 的匹配逻辑本质上仍是字符串包含检测。这些与“精准理解个人数据”的目标相距甚远。

但项目真正的价值不在此处。

真正的价值在于“简历 + MCP”这一组合所催生的新可能：

信息获取方式变革 — 从“读取固定文档”转向“AI 按需查询结构化数据”
筛选逻辑革新 — 邀请码机制反向筛选招聘方的 AI 素养
数据主权重构 — 数据存储于自有服务器，由你决定谁能查看什么

这三个变化与技术实现的复杂性无关，属于产品形态层面的创新突破。

MCP 尚处于早期阶段，真正运用 AI Agent 连接 MCP 进行招聘的企业极为罕见。但方向已经明确——随着 AI 在招聘流程中扮演越来越重要的角色，简历应当从“供人阅读的文档”进化为“供 AI 查询的数据源”。