阿里雲推出自己的 GPT「通義千問」，不久後又把官宣刪了

發布日期：2023 年 4 月 8 日2023 年 4 月 8 日作者：陳黛比

Bookmark the permalink.

阿里雲通過官方微信公眾號宣佈，阿里雲大型語言模型「通義千問」開始邀請企業參加測試，並發布「通義千問」的官方網頁。這是繼百度版的 GPT「文心一言」推出後，中國另一個即將釋出的大型語言模型。

（圖：通義千問／取自：通義千問官網）

通義千問官方網頁上寫著：「我是通義千問，一個專門響應人類指令的大模型；我是效率助手，也是點子生成機；我服務於人類，致力於讓生活更美好。」

不過，阿里雲官方微信發布此「官宣」沒多久，就將文章刪除了，目前已無法瀏覽。不過，下周二將在北京舉行「阿里雲峰會」，據傳執行長張勇有可能在會上說明關於「通義千問」的進一步消息。

事實上，早在去年9月，阿里雲就在官方微信發布：讓AI更通用的「通義」大模型，來了！文章指出，達摩院團隊使用相對較少算力即實現 10 萬億參數大模型 M6，同等參數規模能耗僅為此前業界標桿的 1%，極大降低了大模型訓練門檻。此外，通義統一底座中M6-OFA模型，作為單一模型，在不引入新增結構的情況下，可同時處理圖像描述、視覺定位、文生圖、視覺蘊含、文檔摘要等10余項單模態和跨模態任務，且效果達到國際領先水平。

（圖：通義大模型文生圖創作，可根據關鍵詞生成不同風格圖像／取自：阿里雲）

阿里雲認為，這一突破最大程度打通了 AI 的感官，受到學界和工業界廣泛關注。近期M6-OFA完成升級後，可處理超過30種跨模態任務。未來，「通義」的使用場景，包括電商跨模態搜索、AI 輔助設計、開放域人機對話、法律文書學習、醫療文本理解等。

當時的官宣，就已提及將「面向全球開發者開源」。如今「通義千問」的發佈，應是整體大型訓練模型的階段里程。

目前，世界上由科技巨頭領軍的大型語言訓練模型，除了阿里雲推出的「通義千問」，另有三大玩家：第一為由微軟資助、Open AI 開發的 ChatGPT，是目前應用最廣，表現最為出色且穩定的聊天機器人；第二為 Google Bard，在今年 2 月的發佈會翻車後，Google 正積極調整升級，目前已在美國、英國開放測試，其他地區仍需加入等候清單；第三，是百度在今年三月發布的「文心一言」，但發佈會上只有簡報，沒有任何展示，網友滿滿的吐嘲，活動甫結束，百度股價直接下跌近 10%。

via：阿里雲、通義千問、bloomberg