算法训练企业知识库建设结构化提示词
本文为算法训练与企业知识库建设场景量身打造的结构化提示词方案,旨在帮助技术架构师或AI训练师...
提示词内容
复制角色定义与任务定位
请以“企业AI知识架构师”或“算法训练数据工程师”的身份,使用本提示词方案。您的核心目标是:将企业内部非结构化的文档、经验与流程,转化为可用于算法模型(如大语言模型、检索增强生成模型)训练或调优的、高质量、结构化的知识数据,从而系统化地构建专业、精准、可实战应用的企业知识库。
适用场景
- 为专属领域大模型(如金融、法律、医疗行业模型)准备预训练或微调数据。
- 构建企业智能客服、内部问答助手所需的结构化知识源。
- 将产品手册、技术白皮书、项目报告等文档转化为Q-A对或知识图谱三元组。
- 为新员工培训或标准化流程梳理,创建系统化的知识学习材料。
核心提示词
以下提示词可直接用于引导AI生成或整理知识内容:
- 请扮演[某领域,如:金融风控]专家,将以下原始文本,提炼成一系列结构清晰的“问题-答案”对。问题应覆盖核心概念、操作步骤、常见误区与解决方案。
- 请以“概念定义-关键属性-应用实例-相关流程”的框架,结构化地描述[具体知识点,如:客户信用评分卡模型]。
- 请将这份会议纪要,按照“决策事项”、“执行步骤”、“负责人”、“截止时间”的格式进行结构化提取与总结。
- 基于以下产品功能列表,生成一系列可能的技术支持问答,要求问题具体、答案包含操作步骤和截图位置提示。
风格方向
- 专业严谨:语言准确、术语规范,避免口语化和歧义。
- 结构清晰:采用层级标题、列表、表格等可视化结构,逻辑分明。
- 客观中立:陈述事实与标准流程,减少主观评价和模糊表述。
- 可机读性:输出格式便于后续解析,如JSON、Markdown或CSV样式。
构图建议(信息架构视角)
- 树状知识体系:从核心主题出发,拆解为子模块、知识点,形成树形目录。
- 流程导图式:对于操作流程类知识,采用“开始->判断->步骤->结束”的线性流程图进行组织。
- 对比表格化:将相似概念、不同方案、新旧版本差异用对比表格呈现,突出关键信息。
- 卡片式知识单元:每个最小知识单元(如一个Q-A对、一个术语解释)独立成卡,便于检索与组合。
细节强化
- 元数据标注:为每条知识添加来源、版本、置信度、适用部门、更新日期等元数据标签。
- 关键词与同义词:提取核心关键词,并补充常见同义词、缩写,增强检索命中率。
- 边界与例外说明:明确知识的适用条件和边界,指出常见的例外情况或错误应用。
- 案例与数据注入:在解释抽象概念时,绑定具体的内部案例、数据样例或代码片段(脱敏后)。
使用建议
- 分阶段迭代:先从核心、高频知识开始结构化,再逐步扩展至边缘知识,持续迭代更新。
- 人机协同校验:AI生成初稿后,必须由领域专家进行准确性、完整性和实用性的审核与修正。
- 提示词具体化:使用核心提示词时,尽可能将“[ ]”中的占位符替换为具体的、细分的领域或对象。
- 格式统一先行:在项目启动前,团队需统一知识输出的模板、字段和格式标准,保证数据一致性。