Shengxu · Cloud Architecture & DevOps

实战 · 打造会记忆的AI 写作搭档（二）：数据库篇（从 JSON 到单库，再到关系表）

2026-01-28

长篇小说写作系统的数据底座从JSON文件起步，经历SQLite单库KV存储，最终演进为关系表结构。这一过程将世界设定从文本堆转化为实体关系系统，解决了查询困难、一致性差和跨设备维护崩溃三大问题。通过唯一ID、关系表和SQL查询，AI写作搭档实现了可查、可改、可回溯的记忆能力。

实战 · 打造会记忆的AI 写作搭档（一）：多 Agent 架构进化

2026-01-25

本文介绍 FantasyNovelAgent 项目，一个会“记忆”的AI写作搭档，通过多Agent架构解决长篇小说创作中遗忘设定的痛点。它提供灵感推演、沉浸式写作、动态记忆和逻辑守卫等核心功能，并采用“各司其职”的大模型策略。文章复盘了项目从文件存储到SQLite数据库的演进，并展望了前后端分离和云原生架构，旨在为读者提供一个高效、智能且能保持上下文一致性的写作辅助工具。

Kubernetes 复杂度论：从一场面试题说起

2026-01-24

Kubernetes 并非解决所有部署问题的银弹，其本质是复杂度的交换而非消除。当服务数量少、团队缺乏运维专长或仅需发布容器时，引入K8s会徒增运维负担。只有当规模化治理、弹性调度、多租户隔离成为刚需，且组织愿意投入平台工程时，K8s才能成为效率杠杆。

实战：基于 Cloudflare Vectorize 与 Gemini 构建全自动 AI 语义搜索

2026-01-23

利用 Cloudflare Workers、Vectorize、D1 与 Google Gemini 构建零成本、全自动的 AI 语义搜索系统。通过 GitHub Actions 实现写作即部署，自动同步向量。引入动态阈值判定过滤无效匹配，并利用 D1 记录搜索日志，生成 Content Gap 洞察，引导作者填补内容空白，形成内容生产闭环。

OWASP LLM Top 10 安全实战

2026-01-23

OWASP LLM Top 10 v2.0 框架揭示了大型语言模型应用的核心安全威胁，包括提示注入、敏感信息泄露、供应链漏洞等十大风险。针对每项威胁，提供了基于 Kubernetes 环境的 Python 概念验证攻击代码与防御脚本，涵盖语义过滤、签名验证、最小权限控制等实战方案，帮助平台工程师构建安全的 AI 系统。

Helm 4 深度解析：不只是版本号 +1，而是 Kubernetes 原生时代的新起点

2026-01-22

Helm 4 作为 Kubernetes 包管理的重大升级，默认启用 Server-Side Apply 以解决配置漂移和冲突检测，引入 Wasm 插件系统提升安全性与跨平台能力，OCI 成为推荐的 Chart 分发方式，CLI 参数如 --atomic 更改为 --rollback-on-failure。它偿还了历史技术债务，无需数据迁移，但需验证 GitOps 行为与 CLI 脚本兼容性，为生产环境带来更稳定的原生体验。

Kubernetes 1.35 原生 Gang Scheduling：调度生态的“大一统”前夜

2026-01-21

Kubernetes 1.35 引入原生 Gang Scheduling 与 Workload API，将调度视角从单 Pod 提升至作业组，彻底解决 AI 训练资源死锁问题。它取代了 Coscheduling 插件，推动架构向“Kueue 决策+原生调度器执行”的简洁分层演进，大幅降低运维成本，为云原生 AI 基础设施提供内核级保障。

当AI拿到你的数据库密码：MCP暴露风险实战指南

2026-01-20

MCP协议让AI获得操作数据库、文件系统等权限，但协议本身不强制认证，导致Prompt注入攻击可劫持这些权限。CVE-2025-49596漏洞（CVSS 9.4）暴露了本地主机劫持风险，供应链攻击和网络暴露同样威胁安全。防御需遵循网络隔离、强认证、最小权限和人工确认四层体系，核心原则是永远不给AI超出黑客能利用的权限。

从流量守门到质量内窥：2026 年企业级 LLM 可观察性体系构建指北

2026-01-19

2026年企业级LLM可观察性体系从基础设施监控转向业务语义洞察，需构建三层防御：云平台原生监控（如Azure Content Safety）提供基础安全护栏，AI网关（如Kong/APISIX）实现统一鉴权、流控与模型路由，专用可观测工具（如Langfuse/LangSmith）通过链路追踪和自动化评估量化模型质量。三者组合确保成本、安全与效果可控。

Dragonfly：云原生时代的镜像与模型分发基础设施

2026-01-15

Dragonfly是基于P2P技术的云原生镜像与模型分发基础设施，解决大规模集群并发拉取时的带宽瓶颈与成本。通过分片传输和智能调度将分发压力分散到节点，显著降低回源流量。配合Nydus按需加载，有效缩短AI模型和容器启动时间，已成为CNCF毕业项目并被多家企业采用。