以 Autopilot 模式代管容器,就能安全地大規模執行企業工作負��,而且幾乎不需 Kubernetes 專業知識。
把握每月可免費獲得一個可用區或 Autopilot 叢集的好機會。新客戶可以獲得價值 $300 美元的免費抵免額,盡情試用 GKE 和其他 Google Cloud 產品。
功能
為迎接更大型的模型,我們即將支援擁有 65,000 個節點的叢集。如果想開發出先進的 AI 模型,團隊必須能將運算資源妥善分配給不同工作負載,包括訓練模型、提供模型、推論、進行臨時研究,以及管理輔助任務等。我們將運算能力集中在最少數量的叢集,當提供推論服務、研究和訓練工作負載的需求出現變化時,系統就能靈活迅速地做出因應。
GKE 推論功能,搭配掌握生成式 AI 需求的資源調度和負載平衡技術,可為生成式 AI 應用程式提供與眾不同的效能。與其他代管和開放原始碼 Kubernetes 產品相比,這些功能可創造以下效益:服務成本降低 30% 以上、尾延遲時間降低 60%,處理量最多可提高 40%。
平台團隊可以採用新推出的進階 GKE Enterprise 版本,在同一個位置設定及觀測���個叢集,以及定義團隊 (而非叢集) 的設定。開發人員則能透過自助式選項部署及管理應用程式。因此,平台團隊可以享有多項好處。您可以透過先進的安全防護機制,還有以 GitOps 為基礎的設定管理功能來降低風險,並運用全面整合的代管型解決方案減少總持有成本 (TCO)。這樣一來,投資報酬率最高可在三年內提升至 196%。
GKE Standard 版本具備全自動叢集生命週期管理、Pod 與叢集資源自動調度功能,而且費用公開透明,可以自動調整基礎架構費用,讓您獲得最佳成本效益。這個版本具備現有 GKE 的所有優點,並提供 Autopilot 和 Standard 兩種作業模式。使用新推出的進階 GKE Enterprise 版本,即可享有上述所有優勢,並能透過整合式控制台與服務網格控管、治理、保護及設定多個團隊與叢集。
GKE Autopilot 是一種免人工操作的作業模式,可以管理叢集的基礎運算資源,讓您不必自行設定或監控,也能享有完整的 Kubernetes 體驗。Autopilot 採用以 Pod 為單位的計費模式,您只需要為運作中的 Pod 付費,系統元件、作業系統營運負擔或未分配的運算資源都不會產生費用,因此您可以妥善運用資源並提高作業效率,最多省下 85% 的費用。GKE Enterprise 版本提供 Autopilot 和 Standard 兩種作業模式。
GKE Threat Detection 採用 Security Command Center (SCC) 技術,會持續監控 GKE 稽核記錄,以近乎即時的方式找出影響 GKE 叢集的威脅。
GKE Compliance 提供簡化的即時深入分析資訊和自動報表,還能讓您以安全的方式在 Google Cloud 上自由創新。
GKE 導入完整的 Kubernetes API、四向自動調度資源功能、發布版本和多叢集支援。您可以依據 CPU 使用率或自訂指標水平自動調度 Pod 資源,為每個節點集區自動調度叢集資源,並透過垂直自動調度 Pod 資源功能持續分析 Pod 的 CPU 和記憶體用量,自動調整 CPU 和記憶體要求。
透過 Google Distributed Cloud,在自己的資料中心運用 Kubernetes 和雲端技術。只要運用便捷的代管式安裝服務,再加上經過 Google 驗證的更新,就能體驗 GKE 的強大功能。
為叢集預留 IP 位址範圍,讓叢集 IP 能夠透過 Google Cloud VPN 與私人網路 IP 共存。
常見用途
您可以使用機群簡化多叢集部署作業的管理方式,例如將正式環境與非正式環境區隔開來,或是區隔各個層級、位置或團隊的服務。您可以使用機群將 Kubernetes 叢集分類並正規化,更輕鬆地管理基礎架構及採用 Google 最佳做法。
完善的 AI/機器學習平台應具備下列特點 (i) 可使用 GPU 進行大規模訓練及提供工作負載的基礎架構自動化調度管理 (ii) 能與分散式運算和資料處理架構彈性整合 (iii) 支援同一基礎架構中的多個團隊,盡可能提升資源使用率。
完善的 AI/機器學習平台應具備下列特點 (i) 可使用 GPU 進行大規模訓練及提供工作負載的基礎架構自動化調度管理 (ii) 能與分散式運算和資料處理架構彈性整合 (iii) 支援同一基礎架構中的多個團隊,盡可能提升資源使用率。
直接在 Cloud Shell 編輯器中建立容器化網頁應用程式、在本機測試,然後部署至 Google Kubernetes Engine (GKE) 叢集。完成這個簡短的教學課程後,您會瞭解如何建構、編輯 Kubernetes 應用程式,並進行偵錯。
直接在 Cloud Shell 編輯器中建立容器化網頁應用程式、在本機測試,然後部署至 Google Kubernetes Engine (GKE) 叢集。完成這個簡短的教學課程後,您會瞭解如何建構、編輯 Kubernetes 應用程式,並進行偵錯。
定價
GKE 的定價方式 | 使用免費抵免額後,總費用會依據版本、叢集作業模式、叢集管理費用和適用的傳入資料移轉費用計算。 | |
---|---|---|
服務 | 說明 | 價格 (美元) |
免費方案 | GKE 免費方案每個月會為每個帳單帳戶提供價值 $74.40 美元的抵免額,適用於可用區叢集和 Autopilot 叢集。 | 免費 |
Kubernetes | Enterprise 版 包含 Standard 版功能,適用於多個團隊與叢集,且提供自助式作業、進階安全防護、服務網格、設定與整合式控制台。 | $0.0083 美元 每小時每個 vCPU |
Standard 版 具備全自動叢集生命週期管理、Pod 與叢集自動調度資源功能,而且價格公開透明,可自動將基礎架構費用降到最低。 | $0.10 美元 每小時每個叢集 | |
運算 | Autopilot 模式:為 Pod 佈建的 CPU、記憶體和運算資源。 標準模式:系統會依據 Compute Engine 定價向您收取每個執行個體的費用。 | 參閱 Compute Engine 定價 |
進一步瞭解 GKE 定價。 查看所有定價詳細資料。
GKE 的定價方式
使用免費抵免額後,總費用會依據版本、叢集作業模式、叢集管理費用和適用的傳入資料移轉費用計算。
Enterprise 版
包含 Standard 版功能,適用於多個團隊與叢集,且提供自助式作業、進階安全防護、服務網格、設定與整合式控制台。
$0.0083 美元
每小時每個 vCPU
Standard 版
具備全自動叢集生命週期管理、Pod 與叢集自動調度資源功能,而且價格公開透明,可自動將基礎架構費用降到最低。
$0.10 美元
每小時每個叢集
Autopilot 模式:為 Pod 佈建的 CPU、記憶體和運算資源。
標準模式:系統會依據 Compute Engine 定價向您收取每個執行個體的費用。
參閱 Compute Engine 定價
進一步瞭解 GKE 定價。 查看所有定價詳細資料。
企業案例
Moloco:在 Google Kubernetes Engine 中使用 TPU 後,模型訓練時間縮短 10 倍
「隨著 Moloco 的廣告業務急遽成長,我們必須調整基礎架構,而這對我們來說是一大挑戰。有了 GKE 的自動調度資源功能,工程團隊就能將重心放在開發作業,不必花費大量心力處理各項作業。」- Moloco 機器學習部門總監 Sechan Oh
我們結合 NVIDIA NIM 的強大威力與 Google Kubernetes Engine,將平均符記速度提高了 6.1 倍。也就是說,LiveX AI 能即時為客戶提供個人化體驗,包括提供流暢的客戶服務、即時推薦產品,以及減少退貨次數。
- LiveX AI 共同創辦人暨 AI 長 Jia Li
「在 GKE 中使用 TPU,尤其是用於推論 (尤其是圖像生成) 的新型 Trillium,可將延遲時間縮短多達 66%,進而提升使用者體驗和轉換率。使用者可在 10 秒內收到回覆,不用再等待長達 30 秒。這對使用者參與度和留存率來說至關重要。」
- HubX 共同創辦人 Cem Ortabas
「對我們的客戶來說,最佳化生成式 AI 推論的性價比至關重要。我們很高興看到 GKE 推論閘道將開放原始碼的負載平衡和擴充功能最佳化。新的 GKE 推論閘道功能可協助我們進一步提升客戶推論工作負載的效能。」
- BentoML 執行長暨創辦人 Chaoyu Yang