<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>AI Infrastructure - 标签 - Shengxu · 云架构 &amp; DevOps</title><link>https://shengxu.pages.dev/tags/ai-infrastructure/</link><description>Shengxu 的云架构 &amp; DevOps 技术博客：Kubernetes、Cilium、可观测性、LLM 基础设施、Agent 工程化等。</description><generator>Hugo 0.153.2 &amp; FixIt v0.4.0-alpha.3-20251225101113-8ffb9a95</generator><language>zh-CN</language><lastBuildDate>Wed, 21 Jan 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://shengxu.pages.dev/tags/ai-infrastructure/index.xml" rel="self" type="application/rss+xml"/><item><title>Kubernetes 1.35 原生 Gang Scheduling：调度生态的“大一统”前夜</title><link>https://shengxu.pages.dev/posts/kubernetes-1-35-native-gang-scheduling/</link><pubDate>Wed, 21 Jan 2026 00:00:00 +0000</pubDate><guid>https://shengxu.pages.dev/posts/kubernetes-1-35-native-gang-scheduling/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/ai/">AI</category><description>&lt;p&gt;Kubernetes 1.35 引入的原生 Workload API 和 Gang Scheduling 支持，被业界视为云原生 AI 基础设施的一次“内核级重构”。要真正理解这次升级的分量，我们不仅要看它带来了什么，更要看它试图取代（或融合）什么。&lt;/p&gt;</description></item><item><title>Dragonfly：云原生时代的镜像与模型分发基础设施</title><link>https://shengxu.pages.dev/posts/dragonfly-cloud-native-p2p-distribution/</link><pubDate>Thu, 15 Jan 2026 10:00:00 +0800</pubDate><guid>https://shengxu.pages.dev/posts/dragonfly-cloud-native-p2p-distribution/</guid><category domain="https://shengxu.pages.dev/categories/kubernetes/">Kubernetes</category><category domain="https://shengxu.pages.dev/categories/ai/">AI</category><description>&lt;p&gt;在 AI 和云原生基础设施持续演进的 2026 年，镜像与模型分发正逐渐从“边缘优化点”转变为影响平台效率的重要环节。传统依赖中心化 Registry + CDN 的方式，在面对“大规模节点并发、大体积镜像或模型”的场景时，往往面临速度与成本的双重挑战。Dragonfly 正是在这样的背景下成长为 CNCF 毕业（Graduated）项目，并在 Ant Group、Alibaba、Datadog、DiDi、Kuaishou 等企业的生产环境中被采用，用于支撑容器与 AI 模型的高效分发。&lt;/p&gt;</description></item></channel></rss>