跟GPT3.5一樣強、中文更好!最懂台灣的AI大模型「福爾摩沙」登場,厲害在哪?

  • 發佈時間:2023/05/22 15:40更新時間:2023/05/22 15:40
  • LINE
    FACEBOOK
    TWITTER
    COPYLINK
跟GPT3.5一樣強、中文更好!最懂台灣的AI大模型「福爾摩沙」登場,厲害在哪?

台灣也有自己專屬的AI大型語言模型了!華碩子公司台智雲於17日宣布打造出「福爾摩沙大模型」,是亞洲唯一能提供商用,也是首個可以選擇部署在地端(企業自家機房)的企業級大型語言模型,保障機密資料的安全和自主性。

更多新聞: 上網抱怨婆媳問題 引發網友兩面論戰還意外釣出她來留言

福爾摩沙大模型具備1760億個龐大參數量,和Open AI的GPT3.5達到同等級的表現能力,但比起ChatGPT更強調繁體中文的資料,因此適合本地企業使用,將在7月正式上線。


跟GPT3.5一樣強、中文更好!最懂台灣的AI大模型「福爾摩沙」登場,厲害在哪?
來源:台智雲
台智雲舉辦年度「AIHPCcon台灣AI超算年會」,以台灣杉二號超級電腦建立出的台灣第一個高達1,760 億參數的福爾摩沙大模型。


「福爾摩沙」號稱最懂台灣,厲害在哪?
福爾摩沙大模型算能力達到接近GPT3.5的等級,但數據庫更新,並號稱是市面上「最懂台灣的預訓練模型」,用30%的繁體中文進行訓練,華碩營運長謝明傑以ChatGPT來做比較,其中所訓練的繁體中文資料,比例僅低於0.1%,簡體中文資料也不超過2%,還是以「英文腦」為主,中文知識量相當低。 相比之下福爾摩沙大模型對於句型、用語、文本的理解力,都更符合台灣本地的使用需求。而雖然強調繁體中文,但是仍有多語言特性,英、日、德、法、義、越南文……等多國語言都能使用。

台智雲在訓練福爾摩沙時,投入約一億台幣、768個GPU的算力,並採用多達1760億個參數,台智雲總經理吳漢章表示,其實超過1000億參數這個門檻的模型,會突破一個「頓悟點」,已經超越文字、圖像等基本理解能力,還可以做到理解因果關係、邏輯推理、預測推薦等任務。例如當業者把自己的商業資料,和一個假設性的念頭丟進模型的「黑盒子」中,AI會靠算力、算法,把念頭往前推進成一個完整的計畫決策,還能讓你看見結果可能的樣貌。


跟GPT3.5一樣強、中文更好!最懂台灣的AI大模型「福爾摩沙」登場,厲害在哪?
來源:台智雲
華碩雲端暨台智雲總經理吳漢章指出,在打造福爾摩沙過程中投入龐大資源。


企業為什麼適合導入「福爾摩沙」?
除了符合在地需求外,福爾摩沙大模型還有三大優勢,為企業需求打造:

一、部署彈性
福爾摩沙最大亮點就是全球首創的「AFS Appliance 大型語言模型地端部署解決方案」,台智雲平台工程處總工程師趙逢毅指出,這代表台智雲幫忙把模型訓練好後,協助把龐大、一般機房難駕馭的模型做精簡瘦身,完整服務可以能要16顆GPU才跑的動,但也有1顆和8顆GPU就夠用的版本,同時還能分成176B和7B兩種參數大小的模型,可以讓企業依照自己的需求彈性選擇,把強大的算力搬進企業的機房裡,可能只要一台伺服器就夠。

跟GPT3.5一樣強、中文更好!最懂台灣的AI大模型「福爾摩沙」登場,厲害在哪?
來源:隋昱嬋攝影
台智雲福爾摩沙大模型可以部署在地端,一台伺服器可能就足以支應企業所需算力。

跟GPT3.5一樣強、中文更好!最懂台灣的AI大模型「福爾摩沙」登場,厲害在哪?

來源:隋昱嬋攝影
台智雲提供的管理介面,可以讓人員用No-Code的簡單方式就選擇自己想要的模型版本進行調校。

如果不確定自己需要多大的模型,在後台也提供一個「遊樂場Playground」供企業自由使用、做試驗,做決策時更有把握。

二、資料安全性
也因為可以放在地端,對資料高度機敏的產業來說,等於擁有一顆「專屬大腦」,更加安全可控。例如醫院、律師事務所、金融機構等單位,都可以利用模型做出自己想要的應用,不用擔心資料被上傳到雲端、海外,違法法規,也不用和其他企業共用機房,避免在資安漏洞事件發生時遭到牽連。

三、較省成本
吳漢章舉例,若企業要給模型4500萬個字,希望他在1小時內能夠學起來的算力,台智雲提供的門檻是1小時6萬元。相比之下,若企業選擇自建,成本、工程投入,可能6千萬都還不夠,若是租三大公有雲,在上面調動算力,要花的錢則是10倍,還可能要雇用20個工程師來幫你運行。對中小型企業來說門檻較低,還有推出針對新創提供的優惠方案。

AI進入「類摩爾時代」,台灣不能缺席
福爾摩沙大模型將在今年7月開放企業客戶申請使用,前科技部長陳良基今日出席致詞,他表示「算力產業」看似是一個未來名詞,其實已經來到眼前,因為很多企業都很想使用AI算力,希望把產業Know-how餵給AI,卻礙於商業資料機密等問題,沒辦法直接使用現有的模型去訓練。因此台灣品牌,加上名列全球前十大的「台灣杉二號超級電腦」的算力,如今讓這件事情成為可能。

吳漢章表示,人工智慧已經進入類似摩爾定律的時代,成長如此之快,台灣企業不能錯過這其中的機會。 過去半年台智雲團隊拜訪超過百家機構,包含國內外大型企業、新創、台灣和東南亞的超算中心,了解到產業界的需求,不希望如此強大的AI只有文字能力,而是包含來自產線、企業資源規劃(ERP)的結構化數據,在商業應用上更進一步。



責任編輯:錢玉紘

延伸閱讀

免責聲明:本文為合作外稿授權《民視新聞網》原文轉載,如對內文有任何疑問請逕與原作單位確認。

更多新聞: 【桃園文選】《關於台灣民眾喜愛影劇類型統計》112年會考作文試寫