阿里雲推出自己的 GPT「通義千問」,不久後又把官宣刪了

阿里雲通過官方微信公眾號宣佈,阿里雲大型語言模型「通義千問」開始邀請企業參加測試,並發布「通義千問」的官方網頁。這是繼百度版的 GPT「文心一言」推出後,中國另一個即將釋出的大型語言模型。

(圖:通義千問/取自:通義千問官網)

通義千問官方網頁上寫著:「我是通義千問,一個專門響應人類指令的大模型;我是效率助手,也是點子生成機;我服務於人類,致力於讓生活更美好。」

不過,阿里雲官方微信發布此「官宣」沒多久,就將文章刪除了,目前已無法瀏覽。不過,下周二將在北京舉行「阿里雲峰會」,據傳執行長張勇有可能在會上說明關於「通義千問」的進一步消息。

事實上,早在去年9月,阿里雲就在官方微信發布:讓AI更通用的「通義」大模型,來了!文章指出,達摩院團隊使用相對較少算力即實現 10 萬億參數大模型 M6,同等參數規模能耗僅為此前業界標桿的 1%,極大降低了大模型訓練門檻。此外,通義統一底座中M6-OFA模型,作為單一模型,在不引入新增結構的情況下,可同時處理圖像描述、視覺定位、文生圖、視覺蘊含、文檔摘要等10余項單模態和跨模態任務,且效果達到國際領先水平。

(圖:通義大模型文生圖創作,可根據關鍵詞生成不同風格圖像/取自:阿里雲

阿里雲認為,這一突破最大程度打通了 AI 的感官,受到學界和工業界廣泛關注。近期M6-OFA完成升級後,可處理超過30種跨模態任務。未來,「通義」的使用場景,包括電商跨模態搜索、AI 輔助設計、開放域人機對話、法律文書學習、醫療文本理解等。

當時的官宣,就已提及將「面向全球開發者開源」。如今「通義千問」的發佈,應是整體大型訓練模型的階段里程。

目前,世界上由科技巨頭領軍的大型語言訓練模型,除了阿里雲推出的「通義千問」,另有三大玩家:第一為由微軟資助、Open AI 開發的 ChatGPT,是目前應用最廣,表現最為出色且穩定的聊天機器人;第二為 Google Bard, 在今年 2 月的發佈會翻車後,Google 正積極調整升級,目前已在美國、英國開放測試,其他地區仍需加入等候清單;第三,是百度在今年三月發布的「文心一言」,但發佈會上只有簡報,沒有任何展示,網友滿滿的吐嘲,活動甫結束,百度股價直接下跌近 10%。

via:阿里雲通義千問bloomberg