Claude 3 暴打 GPT4 時,亞馬遜云科技露出了「神秘微笑」

摘要

在大家都在卷自建大模型的時候,亞馬遜云科技更傾向于為大模型提供「淘金的鏟子」。

在 OpenAI 正在熱火朝天地跟 Musk「扯皮」,Gemini 因為在圖像中加入過量「多元化」導致政治過于正確而深陷泥潭之時,Anthropic 帶著 Claude 3 模型家族仿佛橫空出世般,殺了個措手不及。

這次「新王登基」究竟籌劃了多久?Anthropic 是 Amodei 兄妹在 2021 年創建的獨角獸公司——一家崇尚安全和以人類為中心價值觀的 AI 公司(這在價值觀方面與 OpenAI 有著不一樣的愿景),核心創始團隊均來自 OpenAI 并參與了 GPT-3 產品的早期開發。


Anthropic 創立之初就在亞馬遜云科技上訓練了他們的第一個基礎模型,然后 Claude 2.1 迭代到 Claude 3, 就只用了短短 4 個月,Claude 3 發布后第一時間,Sonnet 模型就在 Amazon Bedrock 上支持使用,僅僅 9 天后的今天 Haiku 也在 Bedrock 上線。而時至發稿谷歌云上 Claude 3 仍然是 preview 和 coming soon 狀態,而谷歌云的Vertex AI的產品欄仍然把前排位置都給了Gemini。

去年亞馬遜云科技的 re:Invent 上,當時大家就很莫名其妙的發現,亞馬遜云科技 CEO Adam Selipsky 采訪了一位名不見經傳的創業者 Anthropic 聯合創始人 Dario Amodei,而以往這個位置是要留給可口可樂、納斯達克、高盛這種大客戶的。也沒有太多媒體關注到當時戰略合作的具體內容:Anthropic 把大部分軟件遷移到亞馬遜云科技的數據中心,亞馬遜云科技為 Anthropic 提供從定制化的 GPU 算力到存儲、數據分析等多方位支持,而且亞馬遜云科技的客戶將獲得 Anthropic 模型的優先使用權。而且這個戰略合作的「定制化程度」莫名其妙的高:1、大模型全托管服務 Amazon Bedrock 為 Claude 提供定制化服務;2、為 Claude 優化亞馬遜云科技自研芯片——不斷優化訓練芯片 Trainium 和推理芯片 Inferentia。顯然,當時我們都沒注意到,Dario 的措辭異常的霸道:「這是一場『力爭上游』的競賽(a race to the top)?!?/span>


01

是一盤投資大棋?


其實,在 re: Invent 之前 2 個月,也就是去年 9 月,亞馬遜才宣布對 Anthropic 投資 40 億美金,是 Google 對 Anthropic 投資的 2 倍。業內對這次投資的評價是:顯示了「金主爸爸」對 Anthropic 的強大信心,也說明了亞馬遜在「生成式 AI」領域的破釜沉舟和孤注一擲。真的是這樣嗎?雖然 Anthropic 這 40 億美金的投資非常炸裂,但你打開亞馬遜云科技的網頁一看 Amazon Bedrock 上還有另外 17 個高性能基礎模型!這 17 個模型來自于 6 家公司:AI21 Labs、Cohere、Meta、Mistral AI、Stability AI,而第六家雖然是亞馬遜自己,但 Titan 似乎反而在刻意讓位。

  • AI21Labs – 2 個模型,Jurassic-2 Ultra、Mid,這是個針對多語種的大語言模型,包括葡萄牙語、意大利語和荷蘭語。
  • Cohere – 4 個模型,是針對檢索和匯總信息的大語言模型,主要是用于提取摘要、文案聚類或分類任務。
  • Meta – 2 個開源模型,亞馬遜云科技是首個集成 Facebook 的 Llama 2 的云廠商, 這是個開源模型,目前中國區可用,好處就是客戶可通過 Amazon SageMaker 對 Llama 2 進行微調。
  • Stability AI – 2 個模型,主要是針對圖像生成功能。
  • Mistral AI – 2 個高性能模型,這是一家法國的 AI 公司,大模型的基本場景均可覆蓋。
  • 另外,還有 Amazon 自研的 5 個模型。

Amazon Bedrock 的吸引力,除了大模型多,還在于,它能評估和比較具體應用場景的最佳模型;用專屬數據庫來訓練最適合自己的大模型,比如組織內各種縮寫、各種名詞、各種流程,訓練之后讓它具有專屬于自己的「默契」;開源的大模型,都還可以自己再次調優;Agents for Amazon Bedrock,還能在確保數據安全和隱私保護的情況下執行業務指令,Guardrail 能對最終的生成式 AI 應用提供專屬的保護措施。

于是 Amazon Bedrock 的「工程化的能力」,讓它在圈內被打上了「好用」的標簽。

但是,問題來了:

1、亞馬遜云科技為什么要上這么多種模型?根據亞馬遜云科技自己的官方說法,已經從全球 100 多個客戶使用生成式 AI 的真實場景中發現:沒有某個基礎模型可以統治一切,甚至一個使用場景需要調用多個模型,而且要綜合考慮價格。在亞馬遜云科技看來,問題就從「選哪個模型更好」已經變成了「如何輕松訪問」,所謂「輕松訪問」,是指低多次嘗試和切換模型的成本。有企業開發者說:「現在大模型的數量太多,來回切換和嘗試不同的大模型一點也不智能,Amazon Bedrock 就一個「call」,想調那個調那個。而且什么任務都調用龐大的大模型,成本高,也承受不起?!?/span>

2、模型多,可以。但亞馬遜云科技為什么不主推自己的模型?

有一條時間線很能說明問題,Bedrock 發布的時間是 2023 年 4 月,像 Meta(23 年 7 月上線)、Cohere(23 年 7 月上線)、Mistral AI(24 年 2 月底上線)這些「明星」AI 公司的大模型都是在 Bedrock 發布之后才陸續登陸這個平臺。也就是說,亞馬遜云科技從一開始就賭定了「淘金熱里賣鏟子」這一賽道。

或許,除了永遠沉迷于客戶需求(亞馬遜稱之為「Customer Obsession」),更重要的原因就是:云計算平臺,原本就應該是個「集市」,Market Place,而一個公共的基礎設施重要的是能夠為優質的入住玩家提供更好的服務——云計算是工程化的「商場」服務——這才是本質。


02

投資生成式 AI

只是買買買嗎?


看到擁有強大功能的 Amazon Bedrock 和 17 個領先的基礎模型,你以為布局生成式 AI 只是在市場上買買買嗎?不!你想買空市場所有存貨,人家還不見得想讓你投呢,為什么?因為你的基本盤「技術底座」不行。生成式 AI 是非常燒錢的行業,成本主要包括算力、算法和數據三個方面。當我們把更多的目光投向算法的時候,總是容易偏頗的忽略算力。這是亞馬遜云科技 最具有競爭力的部分。

引用 VentureBeat 的報道:「亞馬遜云科技正在生成式 AI 領域進行全棧式布局,包括云基礎設施、基礎模型和面向用戶的應用?!?/span>

亞馬遜云科技在生成式 AI 的「全棧式」布局:最底層是訓練和推理的基礎設施層,各類超級芯片(自研+NVIDIA) 為基礎模型訓練和推理提供超級算力;中間層是以 Amazon Bedrock 為主的模型全托管服務;上層是生成式 AI 應用層,包括生成式 AI 助手-Amazon Q 和 AI 編程助手 Amazon CodeWhisperer。

這樣看來,亞馬遜云科技正在憑借著極其穩固的基本盤,與像 Anthropic 一樣的大模型「先鋒」,在玩一場雞生蛋、蛋生雞的游戲——或許這就是貝索斯的飛輪效應:貨多了-場活了-人多了-場大了-貨便宜了-人更多了-場更大了……

看懂了亞馬遜云科技在生成式 AI 這場浪潮里的獨特占位,我就一直試圖找到亞馬遜云科技挑選大模型的標準:既然選了很多,又沒有都選,那標準是什么?有一個詞反復的跳出來,吸引了我的注意力「Constitutional AI」,它的直譯是「憲法 AI」。官方給出的解讀是:亞馬遜云科技強調幫助企業建立公正、可解釋、穩健、透明、可治理、確保隱私與安全的「負責任的 AI」。在字里行間的反復暗示中,我發現這個詞的正確解讀,不應該是它是什么?而是它不是什么——它不是 General AI?;蛘哒f,它不是一個比照人、超越人、無所不能的人造上帝。具體來說,確保用戶用自定義模型將數據保留在客戶自己的企業內網,任何數據都不會用于訓練底層模型。這會不會是亞馬遜云科技挑選大模型的標準?我并沒有得到亞馬遜云科技的官方回應。

03

結尾


在大家都在卷自建大模型的時候,亞馬遜云科技更傾向于為大模型提供「淘金的鏟子」——作為云計算的開創者、迄今為止云計算領域的老大,亞馬遜云科技在生成式 AI 時代的戰略占位、對「云是公共服務」這一本質的認知邏輯,值得我們今天中國云計算廠商思考。沒錯,公共服務是規模效益,公共服務是穩定第一,公共服務是成本降低、價格下降,但這只是結果,前提是絕對優秀、值得信賴的工程化能力。

其實,本質上,亞馬遜云科技是在憑借平臺優勢的一己之力,卷更多的大模型。它不是不卷而是卷更多

那么就還有最后一個「看似顯而易見,但深究卻不得其所」的問題:為什么云廠商都在卷大模型?是怕生成式 AI 另辟賽道搶了云計算的風頭嗎?顯而易見,是因為業內人士會認為這是個偽命題,大模型根本無法離開算力。

那云計算廠商,究竟在卷什么?

2022 年,亞馬遜云科技的 re: Invent 上的一個概念或許給出了回答「Data Gravity」,它的基本理念是指:數據在哪里,資源就在哪里,趨勢就在哪里。數據就像具有引力一樣,吸引著一個又一個的技術潮流奔向它,比如 2021 年的 Data Lake。這句話放在今天的生成式 AI 同樣成立。

過去經常提到「數據驅動型」(Data-driven),數據驅動型企業、數據驅動型決策、數據驅動型應用、數據驅動型硬件設計……我們過去更多的關注到了「數據」倆字,或許更重要的是「驅動」,數據如何「驅動」?就是今天強大的 AI。說到底,云廠商從誕生的那一天起,就已經清楚的知道數據、AI、云缺一不可。草蛇灰線伏延千里,今天的生成式 AI 其實一直在那里,這盤大棋一直在下。我們看的是熱點,他們早就看到了自己宿命的未來。

參考資料:

https://www.amazonaws.cn/en/newsroom/2023/global-1130-bedrock/?searchQuery=bedrock&tag=search&targetPage=MARKETING_OTHERhttps://mp.weixin.qq.com/s/C7EEI73oK24rnt2-lk0eKAhttps://mp.weixin.qq.com/s/To9muQObT_LF7vTjq2rACw https://venturebeat.com/ai/amazon-adds-gpt-4-beating-claude-3-to-bedrock/

*頭圖來源:亞馬遜云科技

最新文章

極客公園

用極客視角,追蹤你不可錯過的科技圈.

極客之選

新鮮、有趣的硬件產品,第一時間為你呈現。

張鵬科技商業觀察

聊科技,談商業。

国产精品揄拍一区二区,欧美aⅴ精品一区二区三区,久久九九99这里有精品10,999精品在线