CNCFCNCF4天前
12 月 9 日,一場屬于中國開發者的年度技術盛宴即將拉開帷幕 —— 由云原生計算基金會 CNCF 主辦的 KubeCon + CloudNativeCon + Open Source Summit China 2021 將以線上直播的方式與中國開發者們見面。
作為云原生技術領域的頂級盛會,歷年的 KubeCon + CloudNativeCon + Open Source Summit China 都匯聚了國內外最活躍的開源云原生社區、最先進的技術代表與行業的最佳落地實踐,推動云原生計算領域的知識更新和技術進步。阿里云做為本屆大會的鉆石贊助商,為 CNCF 提供了大力的支持,獲得了大會主辦方的高度認可。自 2017 年以來,阿里巴巴在云原生技術領域投入了巨大力量,深度參與到 etcd、Kubernetes、ContainerD 等多個頂級開源項目的開發與維護當中,并通過云原生技術棧完成了整體基礎架構體系的自我升級。截至 2020 年底,阿里巴巴已有 KubeVela、OpenYurt、Fluid、OpenKruise 等超過 10 個項目進入 CNCF;對 Kubernetes 項目的貢獻量也位居全球前 10。
不能錯過!來自 10+ 阿里云技術專家的云原生創新實踐
在本屆大會中,來自阿里云的一線云原生技術專家帶來了豐富的演講議題,有超過 10 個議題通過主辦方的嚴格篩選,內容涵蓋云原生應用交付、云原生 AI、 k8s 集群管理、容器運行時、CNI、故障監測、Serverless 等云原生細分技術領域,在議題入選數量、話題豐富度方面都表現出色。
以下為本屆大會上由阿里云帶來的精彩分享議題:
Keynote:
主題:云未來,新可能
演講嘉賓:
易立 Li Yi (Mark),阿里云資深技術專家,阿里云容器服務研發負責人
議題簡介:
后疫情時代,數字技術全面融入了我們的日常生活,發揮著不可或缺的作用。綠色發展,產業升級已經成為經濟增長的新勢能。云原生技術是支撐企業數字化轉型的原動力,也在成為業務創新的引擎。
Session:
議題 1:以一致的經驗構建和管理多集群應用 | Build and Manage Multi-cluster Application with Consistent Experience - Yong Feng & Jianbo Sun, Alibaba
議題簡介:
與在多集群環境中部署和管理應用程序相比,當前在本地環境中開發應用程序的用戶體驗存在巨大差距。將經過良好測試的應用程序移到多集群環境時,需要付出大量的努力。在本節課中,我們將演示如何將 KubeVela 和 OCM(開放集群管理)結合起來解決阿里云中的問題。用戶只需根據 KubeVela 應用程序規范定義一個應用程序另一種標記語言 (YAML),其余的將由 KubeVela 和開放集群管理處理。KubeVela 將準備一個部署工作流,包括在需要時創建 Kubernetes 集群。開放集群管理將幫助注冊集群并在集群之間分配資源。因此,在本地開發和多集群生產部署之間部署和管理應用程序的用戶體驗是一致的。我們將討論這些用例、挑戰以及相關的工作和經驗。
議題 2:介紹和深入了解 TAG 應用程序交付 | Introduction and Deep - Dive into TAG App Delivery - Hongchao Deng, Alibaba & Thomas Schuetz, Dynatrace
議題簡介:
TAG 應用程序交付專注于簡化 Kubernetes 上的應用程序交付,以及改善開發者的體驗。此次討論將展示圍繞運營商、混沌工程、應用交付方法和演示應用的最新發展情況。無論您是剛開始了解云原生應用交付,還是想要了解最新進展,此次討論將基于應用交付領域的 CNCF 項目反饋,為您提供正在進行的活動信息、最新發展情況和所選定的發展趨勢信息。
議題 3:阿里巴巴如何在用戶面前發現和定位 k8s 集群問題 | How We Discover and Locate k8s Cluster Problems Before Users at Alibaba - Peng Nanguang, Alibaba
議題簡介:
快速發現和定位問題的能力是快速恢復系統的基石。只有首先快速發現和定位問題,我們才能討論如何解決問題并最大限度地減少用戶損失。那么,在復雜的大規模場景中,我們如何在用戶面前發現和定位問題呢?我將介紹一些我們在管理大型 K8S 集群過程中快速發現和定位問題的經驗和實踐——我們如何通過創建通用鏈接檢測 + 定向檢測工具 KubeProbe 來解決我們遇到的問題,以應對大規模集群的穩定性挑戰。鏈接檢測:模擬廣義用戶行為,檢測鏈接和進程是否異常:檢查集群的異常指標,找出未來系統增強中存在或可能存在的風險點:問題發現的效率和速度、問題發現后的根本原因分析,以及聊天操作。
議題 4:EROFS,我們目前在為容器做什么?| EROFS, What Are We Doing Now For Containers? - Xiang Gao & Xuyang Ge, Alibaba Cloud
議題簡介:
EROFS 文件系統是一個 Linux 只讀文件系統,目的是在保證端到端性能的前提下節省額外的存儲空間,這一文件系統從 Linux 4.19 開始得到了正式升級。此前,該文件系統主要用于嵌入式設備,但是,我們發現對于容器用例也有迫切的只讀高性能文件系統需求。本主題將詳細介紹我們正在為此種新場景開發的新特性。
議題 5:如何在零停機的情況下遷移 Kubernetes 集群 | How To Migrate Kubernetes Cluster With Zero Downtime - Jing Gu & Yaoyao Xie, Alibaba
議題簡介:
跨多個版本升級 Kuberentes 的風險更大。許多客戶選擇使用集群遷移(即創建一個新的高版本集群,然后將應用程序從低版本集群遷移到高版本集群)而不是升級集群。然而,如何在零停機的情況下遷移集群已經成為一個重大挑戰。本次分享提出了解決問題的辦法。
議題 6:最佳實踐:Kubernetes 集群中 DNS 故障的可觀測性與根因診斷 | Best Practice: DNS Failure Observability and Diagnosis in Kubernetes - Yuning Xie, Alibaba
議題簡介:
在阿里云數萬個 Kubernetes 集群中,DNS 域名解析故障是最常見的問題之一。DNS 解析故障的現象也千奇百怪,有些是間歇性的,有些是持續性的,有些影響了所有類型的域名查詢,有些只影響了小部分。其根因也不盡相同,大部分是容器網絡問題,有時候是配置錯誤。
Yuning Xie 將介紹在 Kubernetes 中 DNS 解析故障的可觀測性與根因診斷,本主題將包括以下內容:
1. 介紹 Kubernetes 中常見的 DNS 解析故障場景
2. 介紹 CoreDNS 內置的可觀測性插件,例如 log/errors/trace/dump/metrics
3. 如何通過 dnstap 協議診斷 CoreDNS 異常,以替代 tcpdump 等傳統高開銷的方法
4. 如何基于 BPF 完成客戶端側 DNS 異常的根因診斷
議題 7:Fluid:Kubernetes 原生分布式數據集協調器和加速器 | Fluid: Kubernetes Native Distributed Dataset Orchestrator and Accelerator - Yang Che, Alibaba & Yuandong Xie, Tencent
議題簡介:
在公有云上使用 Kubernetes 運行大數據和人工智能應用成為新趨勢。然而,在 S3、谷歌云存儲、Hadoop 分布式文件系統 (HDFS) 等云分解環境中訪問數據,極大地挑戰了訓練性能,限制了計算的可伸縮性。Yang Che 和 Chris 將介紹 Fluid,以及它如何提高 Kubernetes 中大數據和人工智能應用程序的性能。Fluid 是一個開源、社區驅動、高度協作的項目,由大學里的工程師和研究人員提供。它由云原生計算基金會 (CNCF) 作為沙盒項目主辦。在本課程中,與會者將了解項目動機、體系結構、最新功能和用戶采用情況。之后,Yang Che 和 Chris 將介紹項目路線圖以及新貢獻者如何參與,并展示一個關于通過 Fluid 加速無服務器計算的演示。
議題 8:在 OpenKruise 中擴展容器運行時的操作 | Extend the operations for container runtime in OpenKruise - Siyu Wang, Alibaba
議題簡介:
通常情況下,人們只能使用普通舊數據作為 Kubernetes 中最小的操作單元。他們可以創建一個普通舊數據,但不能控制普通舊數據中的容器,也不能通過 Kubernetes 應用程序接口在某些節點上提取圖像。這是因為 Kubernetes 沒有提供操作運行時的應用程序接口,比如 Containerd 或 Docker。據我所知,一些公司在他們的集群中入侵了 Kubelet 的代碼,以便他們可以對容器做更多的事情。然而,為運行時擴展操作確實是一種錯誤的方法,因為它不利于開源和社區的合作?,F在,云原生計算基金會沙箱項目之一 OpenKruise 提供了高級功能,可以在每個原始 Kubernetes 集群中操作容器運行時。它支持通過 CRD 進行大規模圖像預下載和容器重啟,因此用戶只需應用 CR 另一種標記語言即可完成這些工作。在本次演講中,我們將介紹 OpenKruise 中功能的用法,以及它如何與 Kubelet 和 CRI 合作。
議題 9:實現 Faas + Dapr + K8S 技術融合,構建全新的阿里巴巴云無服務器研發系統 | Achieving Faas + Dapr + K8S technology integration, and build a new Alibaba Cloud Serverless R&D system - Zhao Qingjie, Alibaba
議題簡介:
隨著云原生生態系統的不斷發展,Kubernetes 已經成為了一種云操作系統。與此同時,無服務器是云計算下一個十年的發展主題這種聲音越來越多,那么 Kubernetes 將如何更好地支持這種無服務器場景呢?如何使用 Kubernetes 生態系統更好地整合二者?盡管諸如 Kubernetes 原生和 Fission 一類基于 Kubernetes 的無服務器解決方案已經在行業內出現,但是其仍無法突破零還原和高密度 + 高頻率創建等技術瓶頸。本次討論主要介紹如何在阿里巴巴內部實現技術突破,以及如何實現現有應用的大規模遷移。1.FaaS 在 Kubernetes 上的瓶頸。2.如何突破節點瓶頸,實現單節點上 1200 個實例的高密度部署。3.如何打破性能瓶頸,實現 1w+/5s 的高頻創建和刪除。4.如何重復使用 Kubernetes 的生態能力,擴展 FaaS 的邊界。5.如何快速大規模遷移現有應用的無服務器形式?
議題 10:CNI 1.0.0 概述以及 CNI 2.0 扼要介紹 | Overview of CNI 1.0.0 and preview of CNI 2.0 - Bruce Ma, Ant Financial & Bingshen Wang, Alibaba
議題簡介:
CNI 1.0.0 版本是最近發布的首個穩定版本,這也意味著規范和特征將在一定程度上暫時保持不變,并且可以廣泛使用。本主題將詳細回顧 CNI 1.0.0 版本發展過程中的主要特征和增強功能,以助您更加合理、規范地使用 CNI。第二部分中,我們將深入探討 CNI2.0 的發展前景,以及 CNI1.0 時代存在的一些問題和不足,包括安全性、實時網絡狀態、插件二進制文件的執行、配置管理等。此外,我們希望這一主題能吸引更多 CNI 2.0 的貢獻者。
與CNCF 和阿里云一起,共建中國云原生生態
10 多年來,作為國內云計算領域的先行者,阿里云一直注重將自身在大規模云原生應用實踐中沉淀的經驗,通過產品、開源項目和技術輸出貢獻給廣大的企業和開發者,切實推動云原生人才的教育和培養。2021 年 8 月,在全球開源技術峰會 GOTC 現場,阿里云、 Linux 開源軟件學園共同宣布,聯合業界知名 IT 教育機構馬哥教育升級“云原生人才培養計劃 2.0” ,聚開源生態力量,幫助云原生開發者獲得從理論基礎、開源實踐到企業應用落的體系化成長。在未來,阿里云還將持續地與 CNCF 共同推動中國云原生技術發展,同時歡迎更多的企業、開源愛好者與云原生開發者成為 CNCF 和阿里云的伙伴,共建美好開源社區。本屆 KubeCon + CloudNativeCon + Open Source Summit China 2021 的議程安排現已全面上線,更多詳情請查看大會官網。