2025年初,全球AIoT平臺與服務提供商研華科技宣布推出一款新的軟件產(chǎn)品——GenAI Studio,該產(chǎn)品是研華Edge AI SDK的一部分,主要目標是為了滿足對成本效益高、本地部署的大語言模型(LLM)解決方案日益增長的需求。
加速人工智能發(fā)展,應對行業(yè)挑戰(zhàn)
作為研華邊緣AI軟件開發(fā)工具包(Edge AI SDK)的一部分,GenAI Studio致力于解決行業(yè)痛點,例如縮短工廠操作員等待關鍵信息的時間,減輕醫(yī)療專業(yè)人員的文檔工作負擔。其無代碼、成本效益高的平臺簡化了大語言模型(LLM)的采用,使企業(yè)能夠快速高效地部署AI解決方案,從而提高生產(chǎn)力和運營效率。
GenAI Studio為研華Edge AI SDK構(gòu)建,憑借其多功能的LLM平臺,具備出色的本地和云端LLM集成能力,支持包括OpenAI、Gemini、Anthropic和Ollama在內(nèi)的多種LLM。此外,它還引入了全參數(shù)微調(diào)功能,針對GPU資源有限的環(huán)境進行了優(yōu)化,實現(xiàn)了更廣泛的可訪問性和性能提升。
GenAI Studio為大語言模型(LLM)開發(fā)提供了一整套全面的工具:
首先是集成微調(diào)與推理服務:GenAI Studio將微調(diào)與推理功能相結(jié)合,最大化硬件利用率,實現(xiàn)資源的更靈活、高效分配。
再次,該平臺具備高級GPU資源管理與任務調(diào)度的能力:這些功能使用戶能夠優(yōu)化AI硬件性能,提升高價值設備的成本效益。
隨著AI的迅猛發(fā)展,對易于獲取的大語言模型解決方案的需求日益凸顯,但許多公司因資源有限而受阻。研華邊緣AI軟件開發(fā)工具包(Edge AI SDK)通過提供一套工具來應對這一挑戰(zhàn),該工具能夠高效地評估、開發(fā)和部署邊緣AI應用。例如,傳統(tǒng)上需要超過30個、每個擁有48GB內(nèi)存的GPU來微調(diào)一個700億參數(shù)的大語言模型,而使用研華Edge AI SDK,僅需4個GPU即可完成。這代表著資源需求減少了87%,顯著降低了成本,使大語言模型解決方案更加觸手可及。
借助研華的GenAI Studio和邊緣AI服務器AIR-520,賦能AI創(chuàng)新
為與GenAI Studio相輔相成,研華的AIR - 520邊緣AI服務器提供了一個強大的硬件平臺,配備了NVIDIA RTX GPU和Phison AI SSD。這種整合交付了可靠、高效的計算能力,旨在滿足制造業(yè)、醫(yī)療保健、零售等行業(yè)的AI應用需求。
研華Edge AI SDK軟件開發(fā)工具包:從模型微調(diào)到部署簡化工作流程
研華Edge AI SDK軟件開發(fā)工具包是一個為無縫邊緣AI開發(fā)設計的全集成平臺。憑借預配置的硬件和優(yōu)化調(diào)整的軟件,它提供了即插即用的體驗,能夠?qū)崿F(xiàn)成本效益高的大語言模型定制、無縫工具包兼容以及大規(guī)模邊緣部署的輕松管理。研華邊緣AI軟件開發(fā)工具包以可靠性、可擴展性和用戶友好性為設計理念,簡化了通往AI創(chuàng)新的道路。它現(xiàn)在包括三個核心組件:
1. GenAI Studio:便于在本地以成本效益高的方式創(chuàng)建、評估和集成定制的大語言模型。
2. 推理套件:能夠快速優(yōu)化和評估與嵌入式操作系統(tǒng)兼容的高效AI運行時。
3. 操作平臺:為大規(guī)模邊緣部署中的AI模型和應用更新提供高效管理,整合MLOps以簡化操作。
(圖:研華GenAI Studio操作界面)
研華通過其Edge AI SDK軟件開發(fā)工具包以及新增的GenAI Studio軟件模塊,提升了企業(yè)更高效、更低成本地開發(fā)和部署AI解決方案的能力。