第一財經周報|微軟辦公套件上線AI功能,每月最高87美元;百度上線文心一言收費版,每月59.9元;阿里云發布第二代通義大模型…
撰文 | 新皮層小組
編輯 | 吳洋洋
年底將近,距離不少中國公司承諾的「GPT-3.5時刻」開始倒數——之前,幾乎每家自研大語言模型(Large Language Models, LLMs)的中國公司都或多或少對外承諾過,要在今年年底使其模型性能趕上GPT-3.5。
檢驗時刻很快就要到了,不少公司都在趕工。本周,百川智能和阿里云都更新了其大模型。其中,百川把上下文窗口開得更大了,意味著用戶可以一次性輸入更多內容讓模型解讀(比如30萬個漢字),模型也能記住更多,不容易聊著聊著就忘記前面說過的東西。阿里云則把模型參數變得更高了,從百億級增長至千億級,根據大模型的「規模定律」,當模型變得更大,其學習能力和智能水平就會更好。
作為第一家發布類ChatGPT產品的國內科技公司,百度也在持續鞏固其(在國內的)領先優勢。上周發布號稱對標GPT-4的最新模型「文心4.0」后,本周,百度就將其加載到了收費版的文心一言中,定價59.9元/月。這個價格差不多只是微軟、Google類似功能(30美元)的1/4,不過就國內市場而言仍是一個不算低的價格。除了在熱門影視上映時為愛奇藝、騰訊視頻等娛樂平臺付費,中國用戶還沒怎么為生產力工具付過費,包括微軟的Office套裝。
本周,海外生成式AI的關鍵詞也是成本。微軟終于將其承諾許久的辦公套件中的AI功能上線,不過它能獲得多少付費用戶目前是個未知數。加上AI功能的30美元后,微軟辦公套裝的總成本將最高可至每人每月87美元。這個數字無論個人付費還是企業付費都不算低。而微軟還未曾給出足夠的證據,證明這些支出對于企業是值得的。
微軟的定價嘴上說是來自于對用戶付費意愿的調查,本質上還是成本。上個月,微軟旗下同樣加載了AI功能的代碼工具GitHub Copilot,被爆在每位用戶身上虧損20美元至80美元不等,用戶用得越多,算力就消耗越多,虧損也越大。生成式AI的成本問題如今已是行業性挑戰,Meta的大語言模型Llama2剛發布并開源時,被認為將顛覆閉源模型市場,但這個月,一個叫Cypher的初創公司就吐槽稱,使用Llama2的算力成本是使用GPT-3.5 Turbo算力成本的上百倍。若算力問題不解決,開源就會夢碎。不過,這不意味閉源模型就是無憂的。
OpenAI即將于11月6日(北京時間為11月7日凌晨2點)召開發布會,主題之一也是如何降低模型成本。新皮層將追蹤報道,請隨時關注。
以下內容由新皮層團隊制作:
Key Points
融資與商業篇
Anthropic獲得Google 20億美元投資;
百度上線文心一言收費版,每月59.9元;
微軟辦公套件上線AI功能,每月最高87美元;
釘釘公測生成式AI功能;
Meta開源大語言模型Llama2也有成本,還不便宜。
模型篇
百川智能新模型支持192k上下文窗口;
阿里云發布第二代通義大模型。
融資與商業篇
Anthropic獲得Google 20億美元投資
10月28日,Google表示已同意向人工智能初創公司Anthropic投資高達20億美元。本輪融資后,Anthropic的估值或高達300億美元,股價將高于OpenAI。
一個月前,Anthropic才從亞馬遜那里融資40億美元
今年9月,亞馬遜與Anthropic達成投資協議,表示將投資近40億美元,并以其中的12.5億美元作為初期投資購買少數股權。為此,Anthropic將使用亞馬遜云科技(AWS)作為主要云提供商。
Anthropic于2021年1月成立,是聊天機器人Claude 2的開發商,其創始人Dario Amodei曾任OpenAI的研究和安全副總裁。目前,Anthropic是大語言模型賽道估值排名第二的公司,僅次于OpenAI。
Anthropic為何需要那么多資金?
加上Google的20億美元,Anthropic自9月以來已融資60億美元,這些資金將被用來與OpenAI競爭。
Anthropic今年4月的一封內部文件顯示,該公司計劃籌集不低于50億美元資金以直接對抗OpenAI,其中包括:在2024年年底之前花費10億美元,以構建他們的下一代模型 「Claude-Next」,據介紹,該模型的功能要比當今最強大的模型還要強10倍。今年7月,Anthropic表示其已投入至少兩個月的時間來開發最新的聊天機器人,有30至35人直接參與了AI模型的開發,總共有150人為其提供支持。
Google此前已投資過Anthropic
其實早在半年前,Google就已經向Anthropic投資3億美元,獲得了該公司10%的股權。當時,Anthropic也與OpenAI、Google、微軟等一同受邀,參加了在白宮舉行的關于「負責任的AI」發展討論會。
除Google外,今年8月,SK Telecom Co. Ltd.也曾向Anthropic投資1億美元;今年5月的4.5億美元融資中,Google、Salesforce Ventures和Zoom Ventures都參與其中。
參考鏈接:
https://techcrunch.com/2023/10/27/ais-proxy-war-heats-up-as-google-reportedly-backs-anthropic-with-2b/
百度上線文心一言收費版,每月59.9元
11月1日,百度大模型文心一言正式上線專業版(基于文心4.0),定價59.9元/月,連續包月優惠價49.9元/月。這一價格約為ChatGPT的一半,目前,ChatGPT會員版的收費價格為19.9美元/月(約合140元/月)。除了付費版本,文心一言基礎版(基于文心3.5)依然可免費使用。
相較于基礎版,文心一言專業版基于百度10月17日發布的第4代大模型「文心4.0」。百度稱,該模型對標GPT-4,而文心一言專業版將具有「更強的模型能力和圖片生成能力,支持各種插件,適合需要使用文心一言編程、撰寫文案、繪畫設計等專業工作需求的用戶」。
文心一言今年8月31日上線,官方稱其當前用戶規模約為4500萬。
微軟辦公套件上線AI功能,最高87美元/月
11月1日,微軟宣布生成式AI助手Copilot正式在其辦公套件Microsoft 365(包括Word、Excel、Powerpoint、OneNote、Teams、OneDrive等)中上線,面向企業用戶,每人每月30美元。
對企業規模有要求,且功能沒有全部上線
微軟在今年3月發布了最新版本的辦公套件Microsoft 365 Copilot,增加了生成式AI助手Copilot,能夠提供文檔匯總、生成電子郵件、根據筆記創建計劃、改進Excel分析等功能。
此次上線的Microsoft 365 Copilot對市場有些不夠友好:首先,它要求企業客戶至少擁有300個用戶;而與此同時,不少產品中的生成式AI功能尚沒有開放,例如Excel產品中Copilot功能仍處于預覽階段,OneNote產品中的Copilot功能僅限Windows平臺使用,SharePoint、OneDrive產品中的Copilot功能則連預覽版也沒有。
加上基礎訂閱費,使用Microsoft 365 Copilot成本高達87美元/月
今年7月,微軟就披露了Microsoft 365 Copilot訂閱費用是每人每月30美元。這意味著,微軟企業客戶訂閱Microsoft 365 Copilot,軟件訂閱費用最高將達到87美元/月——其中包括原先使用Microsoft 365辦公套件就要支付的訂閱費(有36美元和57美元兩個版本),如今還要加上Copilot的生成式AI功能費30美元。
微軟首次透露30美元的定價邏輯
效仿微軟,Google對于辦公套件中使用的生成式AI(Duet AI)的定價也是30美元。
對于這一定價策略,負責Microsoft 365的微軟公司副總裁Jared Spataro稱,每月30美元是在研究了客戶愿意為人工智能提供的幫助支付多少費用后確定的。同時,微軟也研究了「人均成本的數學題」,即每月30美元到底相當于雇傭一名知識工作者成本的多少,以及AI究竟需要創造多大收益,才能合理化為其花費的額外成本。
Spataro稱,微軟已經收集了足夠數據,表明Copilot可以大幅提高工作效率。它計劃在11月14日舉行的年度Ignite會議上披露調查結果。
此前有分析師稱,微軟Microsoft 365 Copilot可能覆蓋大約1.5億名企業員工,但華爾街似乎預期不高。投資銀行TD Cowen分析師Derrick Wood認為,微軟客戶可能不愿意在整個企業范圍內使用該產品。根據他的測算,即使成功推廣,微軟2025財年營收也可能只增長1%,大約20億至25億美元。
參考鏈接:
https://techcommunity.microsoft.com/t5/microsoft-365-copilot/microsoft-365-copilot-is-generally-available/ba-p/3969331
https://www.ft.com/content/81db7c36-f9ae-496b-9dd4-971aefe6f9a9
釘釘公測生成式AI功能
11月3日,在超過50萬家企業內測后,釘釘的生成式AI功能——AI魔法棒啟動公測。所有用戶可直接在釘釘首頁的「魔法棒」入口,以對話方式使用聊天AI、文檔AI、宜搭AI等功能,或在文檔、知識庫、腦圖、閃記、Teambition等17個產品的各自界面中,點擊魔法棒按鈕來提供適合的技能。
Meta開源大語言模型Llama2也有成本,還不便宜
The Information報道稱,創建虛擬聊天角色的產品Cypher的創始團隊發現,他們在產品中采用Meta公司開源大語言模型Llama 2所需要的云計算算力更多。
今年8月,使用Llama 2的Cypher當月耗費了價值1200美元的Google Cloud云計算算力,而切換成GPT-3.5 Turbo后,每月所需云計算成本下降到了每月5美元。
Llama 2是Facebook母公司Meta今年2月發布的第二代大語言模型,向所有開發者開源。當時,Meta聲稱該模型相比其他模型需要的算力大幅減少。
導致使用開源模型算力成本更高的原因可能與模型本身的「粗糙性」有關,因為免費,所以它并沒有像閉源的GPT-3.5那樣已經極大程度上降低了使用者調用模型的復雜度,更沒有為適配不同場景提供多種能力相當但規格更小的模型。
開源模型可能的確更耗算力,不過,請注意這里的成本計算的只是算力,并沒有算上調研模型本身需要支付的模型使用費用。
參考鏈接:
https://www.theinformation.com/articles/metas-free-ai-isnt-cheap-to-use-companies-say
https://www.theinformation.com/articles/what-it-takes-to-make-open-source-ai-cheaper-than-openai-microsoft-goes-multimodal
模型篇
百川智能發布模型支持192k上下文窗口
10月30日,百川智能發布Baichuan2-192K大模型,其上下文窗口長度最高可支持192k個token(注:相當于14.4萬個單詞,不過百川智能稱該模型能夠處理約35萬個漢字),為目前全球最長的上下文窗口。
該模型的上下文窗口長度是GPT-4的6倍
上下文窗口長度是大型語言模型的核心指標之一,窗口長度越長,意味著模型理解文本的能力越強,從而可以更準確、流暢地生成內容。如果窗口長度不夠長,就會限制律師、分析師、咨詢師等需要分析和處理較長文本的工作者使用模型。
不過,超長的上下文處理也需要更高的算力以及更大的顯存,一般用戶很難支持這樣的模型成本。百川智能稱,新模型將以API調用和私有化部署的方式提供給企業用戶。
?OpenAI的GPT-4:支持32k上下文窗口,可處理2.5萬個單詞;
?Anthropic的Claude 2:上下文窗口為100k,能夠處理約7.5萬個單詞;
Moonshot AI的Kimi Chat:上下文窗口20萬字(注:如果Baichuan2-192K上下文長度確實達到35萬字,就會超過Kimi Chat的紀錄)。
百川智能
該模型目標是傳媒、金融、法律等場景
Baichuan2-192K模型是百川智能發布的第7款模型,也是首個以上下文窗口長度命名、而非模型參數量命名的模型。從命名方式上可以看出,它基于百川智能的第二代大模型Baichuan2開發。
百川智能稱,Baichuan2-192K現已正式開啟內測,并已與財經類媒體及律師事務所等機構達成合作,用于傳媒、金融、法律等場景中。
百川智能是搜狗創始人王小川在今年4月創立的大模型公司,公司成立以來累計融資3.5億美元。目前,百川估值超過10億美元,為國內晉升生成式AI獨角獸用時最短的初創公司。百川智能目前團隊規模170余人,已發布兩代大模型,其中參數規模在70億和130億的模型(Baichuan-7B/13B、Baichuan2-7B/13B)都已開源,兩個參數規模為530億的模型(Baichuan-53B、Baichuan2-53B)為閉源模型,也是該公司目前規模最大的模型。
參考鏈接:
https://mp.weixin.qq.com/s/lAJh6qGG27u_qCl0kI-0lA
阿里云發布第二代通義大模型
10月31日,阿里云在2023年云棲大會上發布通義千問2.0模型,參數量達到千億。
相較于1.0,2.0 有哪些提升?
今年4月11日的阿里云峰會上,阿里云推出第一代大語言模型「通義千問」。阿里云當時并未公布該模型的參數大小,但據公開報道,該模型參數約為200億至300億。相較于通義千問1.0,通義千問2.0在參數規模上有大幅躍升,與騰訊的混元大模型相當,不過仍然不是業界參數量最大的模型:
參數大小構成模型能力的天花板。一般來說,參數越大,模型潛力越大,能夠學習的東西越多。阿里云稱,相較于1.0版本,通義千問2.0在復雜指令理解、文學創作、通用數學、知識記憶、幻覺抵御等能力上均有顯著提升。英語任務方面,2.0能更好地理解和處理復雜的語言結構和概念;中文任務方面,模型理解和表達能力都有所加強。
除了對話功能,通義大模型官網還上線了多模態和插件功能,支持圖片理解和pdf文檔解析。阿里云稱,目前通義千問的綜合性能已經超過GPT-3.5,正在加速追趕GPT-4。
除了基礎模型,阿里云還發布了8個行業大模型:
?編碼助手「通義靈碼」
?閱讀助手「通義智文」
?投研助手「通義點金」
?智能客服「通義曉蜜」
?個人健康助手「通義仁心」
?法律助手「通義法?!?/p>
?個性化角色創作平臺「通義星塵」
?音頻轉寫助手「通義聽悟」(6月發布)
阿里云表示,8大垂類模型使用了垂直領域數據專門訓練。未來,開發者可以通過網頁嵌入、API/SDK調用等方式,將模型能力集成到自己的AI應用中。
此外,阿里云計劃近期開源通義千問的72B(B即billion,72B即720億參數)版本。8月和9月。公司已分別開源7B(70億參數)和14B(140億參數)版本的模型,累計下載量超過100萬。
阿里云CTO周靖人稱,目前中國已有一半大模型公司跑在阿里云上,包括百川智能、智譜AI等公司的大模型;而阿里云并不是想做一款To C的終端應用,更希望開放模型能力,服務好開發者。
-END-
我們是一個誕生于GPT浪潮、由《第一財經》YiMagazine孵化的全新內容IP。
和每一位關心技術、關注人類命運的讀者一樣,我們希望在這個充滿不確定性的時代,更好地理解快速變化的科技世界,也更好地理解生而為「高級智能」的我們自己。
在這個目標下,我們計劃從學術、商業、倫理、監管等多個角度報道和討論與“智能”相關的議題。請注意,我們說的智能,不只是 AI。
與記者交流,可添加微信(請備注公司名稱和姓名):
王杰夫 微信號: wjfsty
張司鈺 微信號: helianthus351
吳洋洋 微信號: qitianjiuye
本文版權歸第一財經所有,
未經許可不得轉載或翻譯。
即可購買《第一財經》雜志2023年11月刊