NVIDIA (輝達) 今天宣布推出兩項全新大型語言模型 (Large Language Model;LLM) 雲端人工智慧 (AI) 服務,分別為 NVIDIA NeMo LLM 服務與 NVIDIA BioNeMo LLM 服務,讓開發人員能夠輕鬆地調整 LLM,並部署用於內容生成、文字摘要、聊天機器人、程式碼開發,以及預測蛋白質結構和生物分子屬性等客製化的 AI 應用程式。

NeMo LLM 服務讓開發人員能夠在 NVIDIA 管理的基礎設施上,使用被稱為快速學習 (Prompt Learning) 的訓練方法,迅速自訂調整一些預先訓練好的基礎模型。NVIDIA BioNeMo 服務是一個雲端應用程式介面 (API),它將 LLM 的使用範圍擴大到語言之外的科學應用範疇中,以協助製藥和生技公司更快開發新藥物。

NVIDIA 創辦人暨執行長黃仁勳表示:「LLM 具有改變各行各業的潛力。調整基礎模型的能力將讓數百萬名開發人員能夠獲得 LLM 強大的力量,無需從頭開始建立龐大模型,就能開發語言服務並推動科學發現。」

開發人員使用 NeMo LLM 服務,便能使用自己的訓練資料自行調整基礎模型,模型大小從 30 億個參數到 Megatron 530B (這是世界上最大的 LLM 之一)。跟過去從頭開始訓練一個模型所需的數週或數個月相比,使用 NeMo LLM 服務只需幾分鐘到幾小時即可完成。

開發人員使用快速學習來自行調整模型,而快速學習採用一種名為 p-tuning 的技術。開發人員只需使用幾百個範例,就能快速地自行調整基礎模型,而過去則要使用數十億個資料點來進行調整。在客製化的過程中會產生特定任務的提示權杖 (token),然後將權杖結合基礎模型,為特定使用範例提供更高的準確性與更相關的回應內容。

開發人員可以使用同一個模型對多個使用範例進行客製化調整,並產生出多個不同的提示權杖。Playground 功能提供了一個無需編寫程式的選項,可以輕鬆地對模型進行實驗及互動操作,進一步提高將 LLM 用於特定產業使用範例的有效性和可取得性。

準備好部署後,調整好的模型便能在雲端執行個體、企業內部系統或透過 API 運行。

BioNeMo LLM 服務包含兩個用於化學和生物學應用的全新 BioNeMo 語言模型,可用於支援處理蛋白質、DNA 和化學資料,幫助研究人員發現生物序列中的模式並取得寶貴洞察。

BioNeMo 讓研究人員能夠透過內含數十億個參數的模型來擴大其研究工作範圍。這些更大的模型可以儲存更多關於蛋白質結構、基因間進化關係的資訊,甚至可以生成用於治療的新型生物分子。

除了調整基礎模型外,LLM 服務還能讓研究人員透過雲端 API 來使用現成和客製化的模型。

如此一來開發人員便能接觸到眾多預先完成訓練的 LLM,包括 Megatron 530B,還能接觸到透過 NVIDIA NeMo Megatron 框架所建立的 T5 和 GPT-3 模型 (該框架現已進入公開測試階段),以支援廣泛的應用程式和多語言服務需求。

汽車、電腦運算、教育、醫療、電信等產業的領導業者正使用 NeMo Megatron,為客戶提供中文、英文、韓文、瑞典文及其他語言的服務。

NeMo LLM、BioNeMo 服務及雲端 API 預計將於下個月開放搶先試用。開發人員現在可以申請加入,以瞭解更多細節。

NeMo Megatron 框架測試版可透過 NVIDIA NGC 取得 ,其經過最佳化調整可在 NVIDIA DGX Foundry 和 NVIDIA DGX SuperPOD,以及 Amazon Web Services (AWS)、Microsoft Azure 與 Oracle Cloud Infrastructure 的加速雲端執行個體上運行。

開發人員可以在 NVIDIA LaunchPad 實驗室中,免費體驗 NeMo Megatron 框架。

Tags: