業界動態

亞馬遜推出新一代基礎模型Amazon Nova

News 12/05/2024

亞馬遜的新一代基礎模型提供前沿智慧和業界領先的性價比
Amazon Nova模型擴展了Amazon Bedrock中針對企業客戶提供的豐富且強大的基礎模型選擇

亞馬遜在 2024 年 AWS re:Invent 全球大會上，宣布推出新一代基礎模型 Amazon Nova，這些模型在多種任務上展現出頂尖智慧，且具備業界領先的性價比。Amazon Nova 模型將在 Amazon Bedrock 中提供，包括超快速文本生成模型 Amazon Nova Micro，以及能夠處理文本、圖像和影片並生成文本的多模態模型 Amazon Nova Lite、Amazon Nova Pro 和 Amazon Nova Premier。此外，亞馬遜還推出了兩個全新模型——用於生成高品質圖像的 Amazon Nova Canvas 和用於生成高品質影片的 Amazon Nova Reel。

亞馬遜通用 AI 資深副總裁 Rohit Prasad 表示：「在亞馬遜內部，我們約有 1,000 個生成式人工智慧（AI）應用正在進行中，因此可以全面了解開發者所面臨的挑戰。我們的新一代 Amazon Nova 模型旨在幫助內外部開發者應對這些挑戰，提供強大的智慧和內容生成功能，並在延遲、成本效益、客製化、檢索增強生成（RAG）和智慧代理（agentic）等方面取得顯著進展。」

Amazon Nova理解模型展現出卓越的智慧、能力與速度

Amazon Nova 包含四款先進的模型。Amazon Nova Micro 是一款僅處理文本的模型，能夠以極低的延遲和成本提供回應；Amazon Nova Lite 是一款極具成本效益的多模態模型，能夠快速處理圖像、影片和文本輸入；Amazon Nova Pro 是一款功能強大的多模態模型，可在準確性、速度和成本之間實現絕佳平衡，適合多種任務；Amazon Nova Premier 是亞馬遜的頂級多模態模型，專為複雜推論任務而生，並將其作為蒸餾客製化模型（distilling custom models）的最佳典範模型（teacher model）使用。目前，Amazon Nova Micro、Amazon Nova Lite 和 Amazon Nova Pro 已全部正式可用，Amazon Nova Premier 預計將在 2025 年第一季度可用。

亞馬遜對 Amazon Nova 模型進行了廣泛的業界基準測試。結果表明，Amazon Nova Micro、Amazon Nova Lite 和 Amazon Nova Pro 在各自類別中與最佳模型相比均表現得相當有競爭力。

Amazon Nova Micro 在 11 項適用基準測試中，其表現與 Meta 的 LLaMa 3.1 8B 相當或更優，而在 12 項適用基準測試中，其表現也與 Google Gemini 1.5 Flash-8B 持平或更優。憑藉每秒 210 個輸出 token 的業界領先速度，Amazon Nova Micro 非常適合需要快速回應的應用場景。

Amazon Nova Lite 在同類模型中同樣具備強勁競爭力。與 OpenAI 的 GPT-4o mini 相比，它在 19 項基準測試中有 17 項表現持平或更優；與 Google的Gemini 1.5 Flash-8B 相比，在 21 項基準測試中也有 17 項表現相當或更優；與 Anthropic 的 Claude Haiku 3.5 相比，則在 12 項基準測試中有 10 項表現相當或更優。除了在文本基準測試中展現出色的準確性外，Amazon Nova Lite 在影片、圖表和文檔理解方面也表現突出，這一點透過 VATEX、ChartQA 和 DocVQA 等基準測試得到了證明。此外，Amazon Nova Lite 在代理工作流程上也表現優異，如在 Berkeley Function Calling Leaderboard 上的函式呼叫能力，以及在理解視覺元素以在瀏覽器和電腦螢幕上執行操作的核心能力方面表現出色，這一點在 VisualWebBench（網頁瀏覽器操作基準測試）和 Mind2Web（通用多模態代理基準測試）得到證明。

Amazon Nova Pro 在與 OpenAI 的 GPT-4o 的 20 項基準測試中，有 17 項表現相當或更優；在與 Google 的 Gemini 1.5 Pro 的 21 項基準測試中，有 16 項表現持平或更優；在與 Anthropic 的 Claude Sonnet 3.5v2 的 20 項基準測試中，有 9 項表現相當或更優。除了在文本和視覺智慧基準測試中的準確性外，Amazon Nova Pro 在遵循指令和多模態代理工作流程方面也表現出色，相關測試包括綜合 RAG（Comprehensive RAG Benchmark）、Berkeley Function Calling Leaderboard 和 Mind2Web。

多語言和多模態支援，具備長上下文處理能力

Amazon Nova Micro、Lite 和 Pro 支援 200 多種語言。Amazon Nova Micro 支援 128K 輸入 token 的上下文長度，而 Amazon Nova Lite 和 Pro 的上下文長度可達 300K token，處理影片時長可達 30 分鐘。到 2025 年初，亞馬遜將支援超過 200 萬輸入 token 的上下文長度。

快速且具有成本效益

Amazon Nova 模型快速、具有成本效益，且設計上易於與客戶的系統和資料無縫整合。Amazon Nova Micro、Lite 和 Pro 在各自的智慧類別中，成本比 Amazon Bedrock 中表現最佳的模型至少便宜 75%，同時也是 Amazon Bedrock 中對應類別速度最快的模型。

與Amazon Bedrock的無縫整合

所有 Amazon Nova 模型均已與 Amazon Bedrock 整合。Amazon Bedrock 是一項全受管服務，透過單一API提供來自領先 AI 公司的高效能模型。客戶可以輕鬆試用和評估 Amazon Nova 模型及其他模型，找到最適合其應用的模型。

支援微調以提升準確性

這些模型還支援自訂微調，允許客戶根據自身專有資料中的已標記範例來提升準確性。Amazon Nova 模型能夠從客戶的資料（包括文本、圖像和影片）中學習最重要的資訊，隨後 Amazon Bedrock 會訓練一個專屬的微調模型，以提供客製化回應。

蒸餾用於訓練更小、更高效的模型

除了支援微調外，這些模型還支援蒸餾，可以將規模更大、實力更強的「典範模型」中的特定知識轉移到更小的模型上，從而實現更高的精確度、更快的回應速度以及更低的營運成本。

基於資料回應的檢索增強生成（RAG）

Amazon Nova 模型與 Amazon Bedrock 知識庫緊密整合，專注於檢索增強生成（RAG）方法，使客戶能夠透過利用自身的資料確保生成內容的高度準確性和相關性。

針對代理應用進行優化

Amazon Nova 模型經過優化，便於代理應用在執行多步驟任務時透過多個 API 與企業的專有系統和資料進行互動。

借助Nova創意內容生成模型，取得生產級視覺內容

Amazon Nova Canvas 是一款先進的圖像生成模型，能夠根據輸入的文本或圖像生成專業級的視覺內容。它提供了便捷的編輯功能，使用者可以透過文本輕鬆調整圖像，控制顏色組合和佈局。該模型內建的安全控制措施確保安全和負責任地使用 AI，包括浮水印功能，能夠追溯每張圖像的來源；以及內容審核功能，限制可能產生的有害內容。根據合作廠商的對比評估，Amazon Nova Canvas 在效能上優於 OpenAI 的 DALL-E 3 和 Stable Diffusion，並在關鍵的自動化指標上表現出色。

Amazon Nova Reel 是一款先進的影片生成模型，能夠幫助客戶輕鬆以文本和圖像打造高品質影片，適用於廣告、行銷和培訓等內容創作。客戶可以使用自然語言提示控制視覺風格和節奏，包括鏡頭移動、旋轉和縮放。根據合作廠商的評估，Amazon Nova Reel 在品質和一致性上優於同類模型，客戶更傾向於選擇由其生成的影片，而非 Runway 的 Gen-3 Alpha 生成的影片。與 Amazon Nova Canvas 一樣，Amazon Nova Reel 也具備內建的安全控制措施，包括浮水印和內容審核。目前，Amazon Nova Reel 支援生成六秒的影片，未來幾個月將支援最長為兩分鐘的影片生成。

下一步：語音到語音和多模態到多模態模型

亞馬遜計畫在 2025 年第一季度推出 Amazon Nova 語音到語音模型。該模型旨在透過理解自然語言的即時語音輸入，解釋語言和非語言訊號（如語調和節奏），提供流暢、接近真人的互動，徹底改變對話式 AI 應用，並確保低延遲的雙向交流。

此外，亞馬遜還在開發一種新模型，能夠接受文本、圖像、音訊和影片作為輸入，並以任意模態生成輸出。這款具備本地多模態到多模態，即「任意到任意」模態能力的 Amazon Nova 模型預計將在 2025 年中旬推出。該模型將簡化應用程式開發，使同一模型能夠執行多種任務，如內容模態轉換、內容編輯，以及驅動能夠理解和生成所有模態的 AI 代理。

AWS的合作夥伴和客戶已開始使用Amazon Nova模型，從其強大功能和超高性價比中獲益

AWS 的策略合作夥伴 SAP 正在將 Amazon Nova 模型整合到 SAP AI Core 生成式 AI 中心支援的大型語言模型（LLMs）家族中。藉此，開發者能夠為 SAP 的 AI 助理 Joule 打造新功能，並利用 SAP 資料中完整的業務上下文，安全地建構 AI 驅動的解決方案，從而實現自動化、個人化以及供應鏈規劃等進階功能。

勤業眾信作為 AWS 的策略合作夥伴，致力於為全球各產業提供一流的生成式 AI 服務。勤業眾信深知，沒有一種 AI 解決方案和基礎模型能解決所有問題，認為 Amazon Nova 模型的進階客製化能力和提升的安全性將推動創新，為全球客戶帶來卓越的價值。