0代碼微調大模型火了,只需5步,成本低至150塊
明敏 發自 凹非寺
量子位 | 公眾號 QbitAI
0代碼微調一個大模型,成本不到20美元(人民幣約144元)?
過程也非常簡單,只需5步。
如LLaMA、GPT、StableLM等爆火的開源生成式模型,都能搞定。
這就是Monster API,一個最新火起來的API平臺。
有人覺得這個開源領域的新工作,能改寫AI開發的游戲規則,加速AI應用的速度。
還有人興奮提問,之后會接入GPT-3/GPT-4嗎?
所以,它具體是怎么實現的?
五步零代碼搞定
簡單理解,Monster API就是將微調步驟盡可能簡易化,讓開發者不用再手動進行一系列設置,同時也提供便宜的GPU資源及內存優化。
具體過程如下:
第一步,選擇一個模型進行微調。
比如LLaMA-7B、GPT-J-6B、StableLM-7B等,Monster API提供了至少10個基礎大模型。
第二步,選擇或創建微調任務。比如指令微調、文本分類等,或者自定義任務。
第三步,選擇一個HuggingFace數據集。
Monster API可以無縫集成HuggingFace數據集,可選擇范圍很大;還可以根據任務類型推薦數據集。
并且不用自己手動操作,就能自動設置好格式。
第四步,設置超參數。
第五步,檢查和提交。
在設置好如上所有步驟后,確定沒有錯誤就可以提交了。
Monster API表示可以通過WandB上的日志來監測任務。
在其博客中寫道,用DataBricks Dolly 15k微調LLaMA-7B完成3個epouch,成本僅需不到20美元(折合人民幣約144元)。
官網顯示,注冊用戶后會贈送2500積分。會員分為三檔,收費分別是每月9美元/29美元/39美元。
除了微調以外,Monster API還提供各種生成式AI的API接口,并表示成本比其他方案低80%。
背后公司已獲110萬美元融資
消息顯示,Monster API背后公司拿下了110萬美元的種子前資金(pre-seed funding)。
這家AI初創公司給自己的定位是要做“GPU領域的愛彼迎”,把全世界分散的GPU資源實現靈活調度,讓開發者們能夠以更低的價格使用。
創始人是兩兄弟Gaurav Vij和Saurabh Vij。
其中Gaurav Vij還創立了一家CV公司,正是因為CV公司需要面臨巨大的云計算資本,才啟發了他們要做這樣一個平臺。
Saurabh Vij之前是歐洲核研究中心的粒子物理學家,同時也研究分布式計算。
兄弟倆表示在經過多輪技術迭代后,他們優化了消費級GPU在機器學習任務上的性能,使得運行Whisper AI模型的成本相較于AWS平臺降低了90%,所以他們就想著為什么不利用這個方法來幫助數以萬計的開發者們。
同時他們透露公司的一個客戶使用他們的分散的GPU計算資源,已經節省了30萬美元。
參考鏈接:
[1]https://blog.monsterapi.ai/no-code-fine-tuning-llm/
[2]https://www.enterpriseai.news/2023/06/09/monster-api-launches-the-airbnb-of-gpus-with-1-1m-pre-seed/
— 完 —
量子位 QbitAI · 頭條號簽約
關注我們,第一時間獲知前沿科技動態