进阶版运维监控代码生成调试提示词
本提示词方案专为运维开发与自动化工程师设计,旨在通过结构化指令,高效生成与调试运维监控系统...
提示词内容
复制角色定义与任务定位
请以“运维自动化架构师”或“高级SRE(站点可靠性工程师)”的身份,使用本组提示词。您的核心目标是:针对复杂的IT基础设施与业务系统,快速生成高可靠性、可观测性强的监控与告警代码原型,并具备高效的调试与优化指引,以提升系统稳定性和故障响应速度。
适用场景
- 为新的微服务或云原生应用设计定制化的指标采集与暴露代码。
- 编写针对特定中间件(如Kafka、Redis、数据库)的健康检查与性能监控脚本。
- 构建或优化基于阈值的告警逻辑、故障自愈的自动化处理脚本。
- 生成监控数据可视化面板(如Grafana)的查询语句或配置代码。
- 对现有监控代码进行逻辑调试、性能瓶颈分析或可读性重构。
核心提示词
可直接使用或组合以下关键词作为生成指令的起点:
- 生成类:“生成一个Python脚本,使用Prometheus客户端库暴露应用HTTP请求延迟和错误率的自定义指标。”;“编写一个Shell脚本,监控磁盘使用率,超过85%时发送企业微信告警。”;“提供一段Grafana Loki的日志过滤查询,用于提取所有‘登录失败’错误。”。
- 调试优化类:“调试这段监控告警规则,指出其阈值设置不合理可能导致的误报问题。”;“优化这段指标采集代码,减少其对目标系统性能的影响。”;“解释这段OpenTelemetry追踪代码的输出,并指出潜在的性能瓶颈所在。”。
风格方向
- 代码风格:强调工业级代码质量,要求模块化、注释清晰、具备错误处理与重试机制。优先使用行业标准库(如Prometheus client, OpenTelemetry SDK)。
- 文档风格:生成的代码应附带简明部署说明、配置项解释及预期的监控指标列表。
- 逻辑风格:告警逻辑需遵循“减少噪音、明确等级、指向清晰”的原则,推荐使用多条件组合与分级告警策略。
构图建议
此处的“构图”指代码与监控体系的结构设计:
- 分层结构:按“数据采集(Agent/Exporter) -> 传输汇聚(Pushgateway/Agent) -> 存储计算(TSDB) -> 可视化告警(Grafana/Alertmanager)”的流程组织代码逻辑。
- 模块构图:将大型监控脚本拆分为“配置读取模块”、“指标收集模块”、“告警判断模块”、“消息发送模块”,保持高内聚低耦合。
- 数据流构图:在提示中描述清晰的监控数据流向,例如:“从应用日志文件 -> 通过Filebeat采集 -> 发送至Elasticsearch -> 由Kibana展示”。
细节强化
- 指标维度:明确要求代码为指标添加有意义的标签(label/tag),如 `service_name`, `instance`, `env`,以便于多维度聚合查询。
- 可观测性三支柱:在提示中指定侧重方向:是生成“指标(Metrics)”、“日志(Logs)”还是“追踪(Traces)”相关的代码。
- 容错与降级:要求代码包含网络超时、依赖服务不可用时的降级处理逻辑,避免监控系统本身成为故障点。
- 安全细节:提醒在代码中避免硬编码密码,使用环境变量或配置中心,并考虑监控数据传输的加密。
使用建议
- 在生成代码前,先在提示词中明确监控目标(如:某API接口)、关键指标(如:P99延迟、QPS)、技术栈(如:K8s, Spring Boot, Prometheus)。
- 对于调试任务,请将待调试的代码片段直接附在提示词中,并具体描述异常现象或预期与实际不符的情况。
- 利用提示词进行迭代:首先生成基础代码,后续提示可基于此进行“添加指标”、“增加告警规则”、“优化查询性能”等渐进式优化。
- 生成的代码应视为可工作的原型,在生产部署前仍需进行充分的测试与代码审查。