实战 · 打造会记忆的AI 写作搭档(一):多 Agent 架构进化

文章详细介绍了FantasyNovelAgent的演进历程,一个旨在帮助小说作者解决长篇写作中记忆遗失痛点的AI写作搭档。它通过多Agent架构实现灵感推演、沉浸式写作、动态记忆和逻辑守卫等核心功能,并采用“各司其职”的大模型策略优化不同任务。文章还复盘了从文件系统到SQLite数据库的存储架构重构,以及未来向前后端分离、云原生和向量检索双系统发展的规划,为读者提供了构建智能写作助手的实战经验和架构思考。

OWASP LLM Top 10 安全实战

OWASP LLM Top 10 v2.0 框架揭示了大型语言模型应用的核心安全威胁,包括提示注入、敏感信息泄露、供应链漏洞等十大风险。针对每项威胁,提供了基于 Kubernetes 环境的 Python 概念验证攻击代码与防御脚本,涵盖语义过滤、签名验证、最小权限控制等实战方案,帮助平台工程师构建安全的 AI 系统。

Helm 4 深度解析:不只是版本号 +1,而是 Kubernetes 原生时代的新起点

Helm 4 作为 Kubernetes 包管理的重大升级,默认启用 Server-Side Apply 以解决配置漂移和冲突检测,引入 Wasm 插件系统提升安全性与跨平台能力,OCI 成为推荐的 Chart 分发方式,CLI 参数如 --atomic 更改为 --rollback-on-failure。它偿还了历史技术债务,无需数据迁移,但需验证 GitOps 行为与 CLI 脚本兼容性,为生产环境带来更稳定的原生体验。

Kubernetes 1.35 原生 Gang Scheduling:调度生态的“大一统”前夜

Kubernetes 1.35 引入原生 Gang Scheduling 与 Workload API,将调度视角从单 Pod 提升至作业组,彻底解决 AI 训练资源死锁问题。它取代了 Coscheduling 插件,推动架构向“Kueue 决策+原生调度器执行”的简洁分层演进,大幅降低运维成本,为云原生 AI 基础设施提供内核级保障。

当AI拿到你的数据库密码:MCP暴露风险实战指南

MCP协议让AI获得操作数据库、文件系统等权限,但协议本身不强制认证,导致Prompt注入攻击可劫持这些权限。CVE-2025-49596漏洞(CVSS 9.4)暴露了本地主机劫持风险,供应链攻击和网络暴露同样威胁安全。防御需遵循网络隔离、强认证、最小权限和人工确认四层体系,核心原则是永远不给AI超出黑客能利用的权限。

从流量守门到质量内窥:2026 年企业级 LLM 可观察性体系构建指北

2026年企业级LLM可观察性体系从基础设施监控转向业务语义洞察,需构建三层防御:云平台原生监控(如Azure Content Safety)提供基础安全护栏,AI网关(如Kong/APISIX)实现统一鉴权、流控与模型路由,专用可观测工具(如Langfuse/LangSmith)通过链路追踪和自动化评估量化模型质量。三者组合确保成本、安全与效果可控。

告别 Iptables 时代:Kubernetes 网络数据平面的 Nftables 革命

Kubernetes 网络数据平面正迎来变革,nftables 模式已成为生产环境新标配,并在 Kubernetes 1.35 中取代 IPVS 模式。相较于 iptables 的 O(N) 线性查找和全量刷新,nftables 凭借 Maps 和 Sets 实现 O(1) 查找和原子增量更新,大幅提升大规模集群下的网络性能,P99 延迟降低 50 倍以上,并显著降低 CPU 消耗。它统一了 IPVS 和 iptables 的功能,简化了网络架构,并原生支持 IPv4/IPv6 双栈。Azure AKS 已全面支持,AWS EKS 计划设为推荐默认值,自建 K8s 用户若满足条件应积极切换,公有云用户可根据业务新旧和云厂商策略选择性采纳。