以 AI 為核心的新科技浪潮,正在推動新一輪的產業變革。各行各業都希望獲得更高性價比的算力,滿足 AI 應用下激增的計算資源需求,實現降本增效,驅動業務的創新和增長。
在這樣的需求背景下,火山引擎全面升級了第三代云服務器。結合了火山引擎全棧自研、軟硬一體的 DPU2.0 架構以及自研虛擬化全卸載技術,可實現算力零損耗,讓升級后的第三代云服務器具備超強算力、超高網絡及更強存儲 I / O 性能。
第三代云服務器各項性能較上一代有大幅提升,重點升級發布了通用型實例 g3i、高主頻實例 hfr3i,以及國內業界首創的彈性預約實例,為客戶不同應用場景提供更優性價比的新選擇。
通用場景算力全面升級,AI 降本新選擇
隨著 AI 技術的不斷發展和應用場景的拓展,越來越多的大模型逐漸部署到企業的實際生產環境中,給企業帶來了高昂的推理成本。企業對性能強大且性價比更高的算力需求日益猛增。
火山引擎第三代通用型實例 g3i,相較于上代實例整機算力最高提升 122%,在高性能計算、數據庫部署、Web 應用和音視頻處理等業務場景下性能表現更加優異,尤其是針對 AI 推理領域實現了顯著技術突破,每個內核均內置 AMX AI 加速功能,可勝任 80 億參數的模型推理,并為用戶提供即時且流暢的交互體驗。
例如,文生圖是生成式 AI 中的典型應用場景,在第三代通用型實例 g3i 上進行 SDXL-Turbo 文生圖模型推理,可實現秒級生圖;在對話式文本生成的場景中,g3i 實例上進行 80 億參數量的大語言模型的推理,首包時延能控制在 1 秒內。
此外,與字節跳動國內各業務的潮汐資源并池,g3i 實例搭配 Spot 搶占式計費模式,推理成本相比 A10 GPU 實例最高可降低 77%,進一步幫助企業降低成本。
單核算力提升 25%, 輕松應對計算密集型場景
科學計算、工程計算領域的諸多業務場景,需要處理龐大的計算密集型任務,單核性能更高的高主頻實例,可幫助企業降低成本,并提升設計、研發和生產的效率。
火山引擎新一代高主頻實例 hfr3i 提供了高達 3.4GHz 的主頻和 4.0GHz 的全核睿頻,單核算力比上一代高主頻實例提升了 25%,得益于單核性能的強勁表現,hfr3i 實例在算力密集場景下,應用性能最高可提升 30%,單 vCPU 算力性價比更是提高了 15%,可滿足電子設計自動化(EDA)、工業仿真、MMORPG 游戲、關系數據庫部署等場景日益增長的性能需求。
例如,在 EDA 軟件應用場景中,通過 hfr3i 實例提供的更高單核性能,能夠在相同實例規格上運行更多的 EDA 作業,從而減少所需 vCPU 總數量,有效降低業務部署成本。同時,強勁的單核性能還能縮短整體設計任務的耗時,進一步提升芯片設計的全流程效率。
彈性場景性價比首選,成本優化 27%
除了升級更高性能、更優性價比的第三代實例以外,如何通過規模化的優勢給企業帶來更普惠的算力資源也一直是火山引擎努力的方向。
依托于字節跳動內部大規模算力集群優勢,火山引擎通過和字節跳動國內各業務潮汐資源進行并池、混部,以及應用內外硬件機型統一等技術手段,構建了充沛的彈性資源池,并重磅推出業界首創的“彈性預約實例”售賣模式。這是一種“免費提前預約、到點自動交付”的按量計費方式。該模式具有超高性價比,相比普通按量計費實例,成本優化 27% 以上。同時火山引擎公有云擁有百萬級服務器、億核 CPU 規模,在高并發的情況下,以澎湃算力應對客戶多場景的需求。
彈性預約實例既具備按量計費的靈活性,又有接近包月計費的超高性價比,尤其適用于可預見、有計劃的彈性資源使用場景,例如,游戲、在線教育、財務 SaaS、電商大促以及渲染等。
火山引擎服務了某全球領先的云設計軟件平臺和 SaaS 服務提供商,其渲染業務高峰具有顯著的規律性與周期性。在采用火山引擎所提供的彈性預約實例后,通過接入海量資源和靈活低價的計費方式,既保障了該公司業務高峰期資源的充分供應,又在 CPU 性能持平的情況下,使該公司總體算力成本降低了 38.6%。
火山引擎第三代云服務器現已全面售賣,以技術驅動的更優性價比普惠客戶,持續為各行各業的海量云上應用場景提供更加穩定、可靠的算力支撐。
想了解更多以更優成本落地 AI 業務的方法與實踐?
7 月 4 日,火山引擎將攜手英特爾,以《算力再升級:如何以更優成本實現 AI 業務落地?》為主題,對第三代通用實例 g3i、高主頻實例 hfr3i 以及彈性預約實例的應用場景與實踐進行深入解讀。
歡迎報名,預約直播!
本文鏈接:http://www.tebozhan.com/showinfo-26-96583-0.htmlAI 降本新選擇,火山引擎第三代云服務器全面升級!
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com