首页/AI 系统可观测与 SRE/enterprise-agent-ops
E

enterprise-agent-ops

by @affaan-mv
4.4(20)

管理和操作长期运行的AI智能体工作负载,确保其可观测性、安全性和可靠性,适用于企业级AI应用。

ai-agent-operationsllm-orchestrationenterprise-aimonitoringdeploymentGitHub
安装方式
npx skills add affaan-m/everything-claude-code --skill enterprise-agent-ops
compare_arrows

Before / After 效果对比

1
使用前

在没有统一的运维框架下,管理长期运行的代理工作负载(如自动化脚本、数据抓取器)缺乏可见性、安全边界和生命周期控制,导致故障难以排查、资源浪费和安全隐患。

使用后

通过企业级代理运维技能,实现了对代理工作负载的全面生命周期管理、可观测性和安全隔离,显著提升了运维效率和系统的稳定性、安全性。

SKILL.md

Enterprise Agent Ops

Use this skill for cloud-hosted or continuously running agent systems that need operational controls beyond single CLI sessions.

Operational Domains

  1. runtime lifecycle (start, pause, stop, restart)
  2. observability (logs, metrics, traces)
  3. safety controls (scopes, permissions, kill switches)
  4. change management (rollout, rollback, audit)

Baseline Controls

  • immutable deployment artifacts
  • least-privilege credentials
  • environment-level secret injection
  • hard timeout and retry budgets
  • audit log for high-risk actions

Metrics to Track

  • success rate
  • mean retries per task
  • time to recovery
  • cost per successful task
  • failure class distribution

Incident Pattern

When failure spikes:

  1. freeze new rollout
  2. capture representative traces
  3. isolate failing route
  4. patch with smallest safe change
  5. run regression + security checks
  6. resume gradually

Deployment Integrations

This skill pairs with:

  • PM2 workflows
  • systemd services
  • container orchestrators
  • CI/CD gates

用户评价 (0)

发表评价

效果
易用性
文档
兼容性

暂无评价

统计数据

安装量3.8K
评分4.4 / 5.0
版本
更新日期2026年5月23日
对比案例1 组

用户评分

4.4(20)
5
25%
4
50%
3
25%
2
0%
1
0%

为此 Skill 评分

0.0

兼容平台

🔧Claude Code
🔧OpenClaw
🔧OpenCode
🔧Codex
🔧Gemini CLI
🔧GitHub Copilot
🔧Amp
🔧Kimi CLI

时间线

创建2026年3月16日
最后更新2026年5月23日