AMD 釋出最新的 ROCm 6.3 版本開源軟體,新增頂尖工具以簡化開發,同時提升人工智慧(AI)和高效能運算(HPC)工作負載的效能和可擴展性。
ROCm 6.3 的關鍵亮點包括:
· SGLang-專為優化在AMD Instinct GPU上執行的大型語言模型(LLM)和視覺語言模型(VLM)等頂尖生成模型的推論所建構,可提升 LLM 推論的吞吐量高達 6 倍。
· 進階的Transformer最佳化-FlashAttention-2 為 ROCm 6.3 進行最佳化,可將 Transformer 模型訓練和推論加速高達 3 倍,縮短企業級 AI 的上市時間。
· AMD Fortran編譯器-簡化傳統 HPC 應用的 GPU 加速,提供直接卸載、反向相容性,並且能輕鬆整合,無需大量更改編碼。
· rocFFT中的全新多節點FFT-多節點 FFT 支援在更大的資料集上進行高效能 FFT 運算,改善油氣和科學研究等領域的效率與決策時間。
· 增強的電腦視覺庫-AV1 和 rocJPEG 等增強視覺庫使開發者能夠為各種工作負載建構先進的 AI 解決方案,例如影片分析和資料集增強,助力媒體娛樂至自主系統等產業。
透過秉持開源精神並不斷發展以滿足開發者需求,AMD ROCm 6.3 持續幫助企業加速創新,提升擴展能力,並在競爭激烈的產業中保持領先地位。