<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Kubernetes - 分类 - Shengxu · 云架构 &amp; DevOps</title><link>https://shengxu.pages.dev/categories/kubernetes/</link><description>Shengxu 的云架构 &amp; DevOps 技术博客：Kubernetes、Cilium、可观测性、LLM 基础设施、Agent 工程化等。</description><generator>Hugo 0.153.2 &amp; FixIt v0.4.0-alpha.3-20251225101113-8ffb9a95</generator><language>zh-CN</language><lastBuildDate>Fri, 17 Apr 2026 19:40:00 +0800</lastBuildDate><atom:link href="https://shengxu.pages.dev/categories/kubernetes/index.xml" rel="self" type="application/rss+xml"/><item><title>从 Azure SRE Agent 到 HolmesGPT：多云 Kubernetes 环境下的 AI 运维实践</title><link>https://shengxu.pages.dev/posts/azure-sre-agent-to-holmesgpt/</link><pubDate>Fri, 17 Apr 2026 19:40:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/azure-sre-agent-to-holmesgpt/</guid><category domain="https://shengxu.pages.dev/categories/ai/">AI</category><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/devops/">DevOps</category><category domain="https://shengxu.pages.dev/categories/observability/">Observability</category><description>&lt;p&gt;多云 Kubernetes 时代，SRE 的痛点已经不只是“告警太多”，而是调查链路太长、上下文太分散、跨云排障成本太高。真正消耗人的，不是看一眼图表，而是在多个云平台、日志系统、部署记录和工单系统之间反复切换。&lt;/p&gt;</description></item><item><title>Cilium 2026（续）：统一数据平面正在怎样改变 Kubernetes 的平台结构</title><link>https://shengxu.pages.dev/posts/cilium-2026-part-2-unified-dataplane/</link><pubDate>Sat, 21 Mar 2026 14:31:56 +0800</pubDate><guid>https://shengxu.pages.dev/posts/cilium-2026-part-2-unified-dataplane/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/devops/">DevOps</category><category domain="https://shengxu.pages.dev/categories/observability/">Observability</category><category domain="https://shengxu.pages.dev/categories/security/">Security</category><category domain="https://shengxu.pages.dev/categories/ai/">AI</category><description>&lt;p&gt;在&lt;a href="https://shengxu.pages.dev/posts/cilium-2026/"&gt;上一篇关于 Cilium 的文章&lt;/a&gt;中，我们探讨了 2026 年迁移潮背后的真实原因：它不再仅仅是“一个更快的 CNI”，而是将 Kubernetes 网络、安全、可观测与多集群能力，重新组织成了一套更统一的基础设施底座，并理清了它与 Istio 的分工协作边界。&lt;/p&gt;</description></item><item><title>在探讨 LLM 安全之前，你的 Kubernetes 底座及格了吗？</title><link>https://shengxu.pages.dev/posts/kubernetes-security-before-llm/</link><pubDate>Sat, 14 Mar 2026 10:00:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/kubernetes-security-before-llm/</guid><category domain="https://shengxu.pages.dev/categories/security/">Security</category><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/devops/">DevOps</category><description>&lt;p&gt;大模型（LLM）与 AI Agent 的爆发不仅带来了业务模式的革命，也引入了诸如提示词注入、数据投毒等全新的应用层安全挑战。当大家的目光都被这些前沿漏洞所吸引时，我们不妨先停下来，问自己一个直击灵魂的问题：&lt;strong&gt;在探讨这些复杂的 AI 安全之前，承载所有业务的云原生底座及格了吗？&lt;/strong&gt;&lt;/p&gt;</description></item><item><title>Cilium在 2026 年到底能为我们带来什么</title><link>https://shengxu.pages.dev/posts/cilium-2026/</link><pubDate>Sun, 08 Mar 2026 10:30:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/cilium-2026/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/devops/">DevOps</category><category domain="https://shengxu.pages.dev/categories/observability/">Observability</category><description>&lt;h2 class="heading-element" id="它到底带来了什么有意义的改变以及该如何与-istio-分工协作"&gt;&lt;span&gt;——它到底带来了什么有意义的改变，以及该如何与 Istio 分工协作&lt;/span&gt;
 &lt;a href="#%e5%ae%83%e5%88%b0%e5%ba%95%e5%b8%a6%e6%9d%a5%e4%ba%86%e4%bb%80%e4%b9%88%e6%9c%89%e6%84%8f%e4%b9%89%e7%9a%84%e6%94%b9%e5%8f%98%e4%bb%a5%e5%8f%8a%e8%af%a5%e5%a6%82%e4%bd%95%e4%b8%8e-istio-%e5%88%86%e5%b7%a5%e5%8d%8f%e4%bd%9c" class="heading-mark"&gt;
 &lt;svg class="octicon octicon-link" viewBox="0 0 16 16" version="1.1" width="16" height="16" aria-hidden="true"&gt;&lt;path d="m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z"&gt;&lt;/path&gt;&lt;/svg&gt;
 &lt;/a&gt;
&lt;/h2&gt;&lt;p&gt;到了 2026 年，很多团队讨论 Cilium，已经不是在问“它值不值得试试”，而是在问：“我们什么时候该迁过去？”
真正推动迁移的原因，通常不是单一的性能数字，而是 Cilium 把 Kubernetes 网络、安全、可观测性和多集群能力，重新组织成了一套更统一的基础设施底座。&lt;/p&gt;</description></item><item><title>Kubernetes 复杂度论：从一场面试题说起</title><link>https://shengxu.pages.dev/posts/kubernetes-complexity-interview/</link><pubDate>Sat, 24 Jan 2026 12:47:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/kubernetes-complexity-interview/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/devops/">DevOps</category><description>&lt;p&gt;最近经历了一场面试，面试官抛出了一个看似常规的问题：“你认为什么情况下应该使用 Kubernetes，而什么情况下使用 Kubernetes 是没有必要的、徒增复杂度？”&lt;/p&gt;</description></item><item><title>OWASP LLM Top 10 安全实战</title><link>https://shengxu.pages.dev/posts/owasp-llm-top-10-2026/</link><pubDate>Fri, 23 Jan 2026 10:00:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/owasp-llm-top-10-2026/</guid><category domain="https://shengxu.pages.dev/categories/security/">Security</category><category domain="https://shengxu.pages.dev/categories/ai/">AI</category><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><description>&lt;p&gt;昨天有幸参加了 Acronis 公司的 Sergey Saburov 的关于 &amp;ldquo;Agentic Engineering &amp;amp; LLM Security&amp;rdquo; 的分享。Sergey 深入剖析了现代 LLM 应用面临的安全威胁，并结合 OWASP LLM Top 10 框架提供了大量实战案例。&lt;/p&gt;
&lt;p&gt;现结合 &lt;strong&gt;OWASP LLM Top 10 v2.0 (2025)&lt;/strong&gt; 最新官方标准，对分享内容进行了梳理与总结。针对原分享中部分术语的偏差（如 LLM06、LLM10 等）做了必要的修正，并整理了面向 Kubernetes 平台工程师的 Python 代码 PoC（概念验证）与防御脚本，希望能为大家构建安全的 AI 系统提供参考。&lt;/p&gt;</description></item><item><title>Helm 4 深度解析：不只是版本号 +1，而是 Kubernetes 原生时代的新起点</title><link>https://shengxu.pages.dev/posts/helm-4-deep-dive-kubernetes-native-delivery/</link><pubDate>Thu, 22 Jan 2026 10:00:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/helm-4-deep-dive-kubernetes-native-delivery/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/devops/">DevOps</category><description>&lt;p&gt;在基础设施领域，有些版本更新是“锦上添花”，而有些则是“脱胎换骨”。如果说 Helm 3 让我们告别了 Tiller 的噩梦，那么于 &lt;strong&gt;2025 年 11 月&lt;/strong&gt; 正式发布的 Helm 4，则是 Helm 真正理解并融入 Kubernetes 声明式哲学的成人礼。&lt;/p&gt;</description></item><item><title>Kubernetes 1.35 原生 Gang Scheduling：调度生态的“大一统”前夜</title><link>https://shengxu.pages.dev/posts/kubernetes-1-35-native-gang-scheduling/</link><pubDate>Wed, 21 Jan 2026 00:00:00 +0000</pubDate><guid>https://shengxu.pages.dev/posts/kubernetes-1-35-native-gang-scheduling/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/ai/">AI</category><description>&lt;p&gt;Kubernetes 1.35 引入的原生 Workload API 和 Gang Scheduling 支持，被业界视为云原生 AI 基础设施的一次“内核级重构”。要真正理解这次升级的分量，我们不仅要看它带来了什么，更要看它试图取代（或融合）什么。&lt;/p&gt;</description></item><item><title>Dragonfly：云原生时代的镜像与模型分发基础设施</title><link>https://shengxu.pages.dev/posts/dragonfly-cloud-native-p2p-distribution/</link><pubDate>Thu, 15 Jan 2026 10:00:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/dragonfly-cloud-native-p2p-distribution/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/ai/">AI</category><description>&lt;p&gt;在 AI 和云原生基础设施持续演进的 2026 年，镜像与模型分发正逐渐从“边缘优化点”转变为影响平台效率的重要环节。传统依赖中心化 Registry + CDN 的方式，在面对“大规模节点并发、大体积镜像或模型”的场景时，往往面临速度与成本的双重挑战。Dragonfly 正是在这样的背景下成长为 CNCF 毕业（Graduated）项目，并在 Ant Group、Alibaba、Datadog、DiDi、Kuaishou 等企业的生产环境中被采用，用于支撑容器与 AI 模型的高效分发。&lt;/p&gt;</description></item><item><title>告别 iptables 时代：Kubernetes 网络数据平面的 Nftables 革命</title><link>https://shengxu.pages.dev/posts/kubernetes-nftables-revolution-2026/</link><pubDate>Fri, 09 Jan 2026 14:00:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/kubernetes-nftables-revolution-2026/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><description>&lt;p&gt;在 Kubernetes 的网络世界里，&lt;code&gt;kube-proxy&lt;/code&gt; 长期扮演着“守门人”的角色，负责将 Service 的流量分发到后端的 Pod。然而，长久以来，我们一直忍受着 iptables 模式带来的性能折磨，或被迫迁移到维护复杂的 IPVS 模式。&lt;/p&gt;</description></item><item><title>Kubernetes 1.34/1.35证书革命：从手动地狱到零信任天堂</title><link>https://shengxu.pages.dev/posts/kubernetes-1-34-1-35-certificates/</link><pubDate>Sat, 03 Jan 2026 19:00:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/kubernetes-1-34-1-35-certificates/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/cloud/">Cloud</category><category domain="https://shengxu.pages.dev/categories/security/">Security</category><description>&lt;p&gt;最近升级到1.35，发现&lt;strong&gt;证书管理&lt;/strong&gt;的变化堪称革命性——特别是对自管K8s用户来说，运维负担直接腰斩。&lt;/p&gt;
&lt;p&gt;过去证书问题是安全事件的&amp;quot;隐形杀手&amp;quot;：过期中断、token泄露、手动轮转占运维30%时间。1.34/1.35带来&lt;strong&gt;原生自动化mTLS&lt;/strong&gt;，让零信任不再是Istio的专利。今天咱们聊聊这些新特性，然后按&lt;strong&gt;自管K8s vs 云K8s&lt;/strong&gt;实战对比。&lt;/p&gt;</description></item><item><title>Kubernetes v1.33–v1.35 更新详解：从原生 Sidecar 到 AI 算力底座</title><link>https://shengxu.pages.dev/posts/kubernetes-v1-33-v1-35-updates/</link><pubDate>Fri, 02 Jan 2026 09:50:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/kubernetes-v1-33-v1-35-updates/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/cloud/">Cloud</category><category domain="https://shengxu.pages.dev/categories/security/">Security</category><description>&lt;h2 class="heading-element" id="时间线概览"&gt;&lt;span&gt;时间线概览&lt;/span&gt;
 &lt;a href="#%e6%97%b6%e9%97%b4%e7%ba%bf%e6%a6%82%e8%a7%88" class="heading-mark"&gt;
 &lt;svg class="octicon octicon-link" viewBox="0 0 16 16" version="1.1" width="16" height="16" aria-hidden="true"&gt;&lt;path d="m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z"&gt;&lt;/path&gt;&lt;/svg&gt;
 &lt;/a&gt;
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;v1.33 (Octarine)&lt;/strong&gt;：2025 年 4 月发布，原生 Sidecar GA、安全特性默认启用。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;v1.34 (Of Wind &amp;amp; Will)&lt;/strong&gt;：2025 年 8 月发布，DRA GA，标志着 AI/GPU 调度进入原生时代。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;v1.35 (Timbernetes)&lt;/strong&gt;：2025 年 12 月发布，In-Place Pod Resize GA，零中断弹性成为现实。&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 class="heading-element" id="1-v133-octarinesidecar-转正与默认安全"&gt;&lt;span&gt;1. v1.33 “Octarine”：Sidecar 转正与默认安全&lt;/span&gt;
 &lt;a href="#1-v133-octarinesidecar-%e8%bd%ac%e6%ad%a3%e4%b8%8e%e9%bb%98%e8%ae%a4%e5%ae%89%e5%85%a8" class="heading-mark"&gt;
 &lt;svg class="octicon octicon-link" viewBox="0 0 16 16" version="1.1" width="16" height="16" aria-hidden="true"&gt;&lt;path d="m7.775 3.275 1.25-1.25a3.5 3.5 0 1 1 4.95 4.95l-2.5 2.5a3.5 3.5 0 0 1-4.95 0 .751.751 0 0 1 .018-1.042.751.751 0 0 1 1.042-.018 1.998 1.998 0 0 0 2.83 0l2.5-2.5a2.002 2.002 0 0 0-2.83-2.83l-1.25 1.25a.751.751 0 0 1-1.042-.018.751.751 0 0 1-.018-1.042Zm-4.69 9.64a1.998 1.998 0 0 0 2.83 0l1.25-1.25a.751.751 0 0 1 1.042.018.751.751 0 0 1 .018 1.042l-1.25 1.25a3.5 3.5 0 1 1-4.95-4.95l2.5-2.5a3.5 3.5 0 0 1 4.95 0 .751.751 0 0 1-.018 1.042.751.751 0 0 1-1.042.018 1.998 1.998 0 0 0-2.83 0l-2.5 2.5a1.998 1.998 0 0 0 0 2.83Z"&gt;&lt;/path&gt;&lt;/svg&gt;
 &lt;/a&gt;
&lt;/h2&gt;&lt;p&gt;v1.33 的关键词是“&lt;strong&gt;原生 Sidecar&lt;/strong&gt;”和“&lt;strong&gt;安全默认开启&lt;/strong&gt;”。这一版把长期实验的能力变成了日常工程可依赖的基础设施。&lt;/p&gt;</description></item><item><title>IngressNightmare (CVE-2025-1974)：漏洞详解与 Gateway API 迁移指南</title><link>https://shengxu.pages.dev/posts/ingress-nightmare-gateway-api-migration/</link><pubDate>Sat, 27 Dec 2025 10:00:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/ingress-nightmare-gateway-api-migration/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/security/">Security</category><description>&lt;p&gt;最近曝光的 Ingress-NGINX &lt;strong&gt;“IngressNightmare”&lt;/strong&gt; 漏洞，把 nginx‑ingress 再次推上风口浪尖，也给还停留在传统 Ingress 的集群敲了警钟。&lt;/p&gt;
&lt;p&gt;下面从漏洞回顾、风险分析、短期修补，到如何借机迁移到 Gateway API，以及迁移前后的优劣对比，做一篇面向工程实践的技术梳理。&lt;/p&gt;</description></item></channel></rss>