全球首款「繁體中文」AI 大型語言模型 - 股票QA

Genevieve avatar
By Genevieve
at 2023-05-03T12:46

Table of Contents

-------------------------------發文提醒----------------------------------
1.發文前請先詳閱[新聞]分類發文規範,未依規範發文將受處份。
2.連結過長請善用 https://bit.ly/ 等縮網址服務,連結不能點擊者板規1-2-2處份。
3.心得/評論請盡量充實,心得過短或濫竽充數將以板規 1-2-3、4-4 水桶處份。
4.發文請依照格式文章標明段落,不符合格式者依4-1刪文處分。
------------------------ 按ctrl+y 可刪除以上內容。 ----------------------

原文標題:

※請勿刪減原文標題

全球首款「繁體中文」AI 大型語言模型登場!聯發科攜手中研院打造
原文連結:

※網址超過一行過長請用縮網址工具

https://3c.ltn.com.tw/news/53050
發布時間:
2023/04/30 18:52

※請以原文網頁/報紙之發布時間為準

記者署名:

劉惠琴

※原文無記載者得留空

原文內容:

美國新創科技公司 OpenAI 以基於 AI 生成式打造的強大語言模型 GPT-4,透過大量的語言
材料與資料訓練等技術,讓會說人話的「對話式」AI聊天機器人ChatGPT,從去年底開始火
速於全球掀起風靡熱潮後,不但可輸入文字進行問答,現在還能給出圖片讓AI去解讀,甚至
還能要求AI生成所需要的圖片範例。與此同時,各大科技巨頭廠商,也爭相投入這波創新AI
技術競賽的浪潮。

不讓 GPT-4 專美於前,身為IC設計龍頭的聯發科於官網宣布,旗下來自前瞻技術研究單位
的「MediaTek Research」聯發創新基地,近幾年來以致力深耕人工智慧技術領域為主要核
心,日前已成功開發出全球首款以繁體中文打造、具備增強AI生成訓練的大型語言模型「BL
OOM-zh」,並公開釋出該原始碼的測試模型提供外界下載,除能直接輸入繁體中文進行問答
或生成文案之外,同時兼具支援英文等多語言能力。

由於現有多數開放原始碼所釋出的大型語言訓練模型,主流普遍大都傾向以英文作為首要語
言與主要優化版本,相較下,以繁體中文所打造的預生成式AI語言訓練模型,則是較為少見
,且資料量也相對不足。

有鑑於此,聯發創新基地於去年五月就已攜手與中研院、國家研究院展開合作計畫,透過三
方共同組成的AI研究團隊,以打造出全球首款使用繁體中文作為主要對象的大型語言模型「
BLOOM-zh」為主要訴求,欲藉此讓與繁體中文相關的AI人工智慧技術、研究與應用,能更進
一步地加速普及化。

聯發科表示,聯發創新基地的AI研究團隊,於今年成功開發的首個繁體中文「BLOOM-zh」大
型語言模型,主要運用兩大關鍵技術,其一,就是使用能理解包括中文、英文、法文與越南
文在內、共計46種語言的「BLOOM」大型語言模型,以「BLOOM」既有具備的繁體中文模型與
英文模型作為開發基準。

其二,則是另外擴展涵蓋新聞、書籍、教育、百科全書與口語化等多個領域文章,包含中文
與英文共計74億個參數值,作為預訓練模型。

同時,並使用來自國家教育研究院提供的大量高品質繁體中文作為主要訓練材料,加上聯發
科制訂以符合國際標準繁體中文評量指標的硬體性能訓練環境,與收集近期較新語言材料,
以訓練模型能具備有更易於讀懂使用者輸入指令的高效率執行能力。還有,來自中研院針對
該語言模型生成的文字,進行自動偵測與評估修正,避免生成的文字內容具有特定偏見或敵
意等不適內容。

BLOOM-zh 繁體中文大型語言模型釋出開源,點下列網址可前往試用、下載
https://huggingface.co/ckip-joint

另,補充說明的是,上述內文提到的「BLOOM」模型,是由總部位於紐約的AI新創公司 Hugg
ing Face,集結全球60個國家、逾一千多位研究人員、於去年2022年推出「BigScience」開
源專案項目的成果,「BLOOM」大型語言模型,具備高達1,760億個參數值,並擁有理解46種
語言與13種程式語言的能力。
心得/評論:

※必需填寫滿30字,無意義者板規處分

原來聯發科也有AI團隊,一直以為只有做硬體,少數軟體部份也是EDA之類的輔助軟體,沒
想到已經有在做中文AI了。繁中版且不是中國那種擋住一堆敏感詞版本,最近應該很多人會
試用


--
Tags: 股票

All Comments

Ethan avatar
By Ethan
at 2023-05-05T10:10
國外一開源 國內就自研
Zenobia avatar
By Zenobia
at 2023-05-07T07:34
該不會model有參考GPT-2.0 open source 吧
Freda avatar
By Freda
at 2023-05-09T04:58
不都這樣? 對岸早就一堆"自研"了XD
Delia avatar
By Delia
at 2023-05-07T19:03
超廢
Lucy avatar
By Lucy
at 2023-05-09T16:27
自研cc
Connor avatar
By Connor
at 2023-05-07T19:03
不能畫色圖的AI我可是不要的
Freda avatar
By Freda
at 2023-05-09T16:27
如果是gpt-2開源碼做出來的 對岸一堆了 人家不公開
的已經做到4代了 不知道能力差ㄅ別多少
Isabella avatar
By Isabella
at 2023-05-07T19:03
發哥之前還成立元宇宙辦公室呢,真的蠻愛顧股價的
Wallis avatar
By Wallis
at 2023-05-09T16:27
瑟瑟
Charlie avatar
By Charlie
at 2023-05-07T19:03
這沒辦法畫圖吧,我看連生成色色文都不行
Ivy avatar
By Ivy
at 2023-05-09T16:27
明天漲停不要不信。
Puput avatar
By Puput
at 2023-05-07T19:03
而且學習的內容居然還包含新聞?..真期待會教出啥
玩意兒
Anonymous avatar
By Anonymous
at 2023-05-09T16:27
發哥也懂AI?那就只能噴了
Audriana avatar
By Audriana
at 2023-05-07T19:03
要重返農藥了嗎
Regina avatar
By Regina
at 2023-05-09T16:27
去玩玩demo吧,我只能說廢到笑
Andy avatar
By Andy
at 2023-05-07T19:03
\發哥/\發哥/
Caitlin avatar
By Caitlin
at 2023-05-09T16:27
發糕重返農藥 上看一千
Margaret avatar
By Margaret
at 2023-05-07T19:03
一樓不懂裝懂 內文就說是BLOOM基底了 別只會酸
Tristan Cohan avatar
By Tristan Cohan
at 2023-05-09T16:27
沾邊就想炒 下一個元元宙
Tristan Cohan avatar
By Tristan Cohan
at 2023-05-07T19:03
國內有大廠願意投資就值得鼓勵了
Emily avatar
By Emily
at 2023-05-09T16:27
發哥本業沒未來了是嗎? 搞這個東東
Necoo avatar
By Necoo
at 2023-05-07T19:03
配合政府發展計劃領個打工費而已
Harry avatar
By Harry
at 2023-05-09T16:27
還以為是自研 結果是拷貝別人的拿來改== 這樣我單
人就可以做了 發哥有沒有考慮高薪聘請
Gary avatar
By Gary
at 2023-05-07T19:03
之後會講一堆廣東話吧
Carolina Franco avatar
By Carolina Franco
at 2023-05-09T16:27
華語首家線上____上線囉
Kristin avatar
By Kristin
at 2023-05-07T19:03
AI炒起來
Catherine avatar
By Catherine
at 2023-05-09T16:27
AI發糕 AI肉鬆 好ㄘ嗎
Kyle avatar
By Kyle
at 2023-05-07T19:03
不過做繁體字沒前途就是了
Brianna avatar
By Brianna
at 2023-05-09T16:27
大語言模型搞到剩繁中...
Selena avatar
By Selena
at 2023-05-07T19:03
台灣首家線上AI上線啦!
Annie avatar
By Annie
at 2023-05-09T16:27
等等 這不是it 就有在教學
Skylar DavisLinda avatar
By Skylar DavisLinda
at 2023-05-07T19:03
粉紅:乳 為什麼不是簡體
Todd Johnson avatar
By Todd Johnson
at 2023-05-09T16:27
阿難的就是預訓練模型,從Bert開始,語言一直都不
是太大的障礙,對模型來說啥語言都差不多,好的預
訓練模型隨便tuning一下就可以在其他語言上有很好
的表現。
不過有大方的說自己套什麼預訓練模型,誠實給讚
Jack avatar
By Jack
at 2023-05-07T19:03
訓練資料來自?
Delia avatar
By Delia
at 2023-05-09T16:27
這個用開源模型做出來的 懶叫比雞腿喔
Charlotte avatar
By Charlotte
at 2023-05-07T19:03
chatgpt用reddit訓練,bloom-zh該不會用ptt...
Zenobia avatar
By Zenobia
at 2023-05-09T16:27
hugging face,會想到face hugger
Skylar Davis avatar
By Skylar Davis
at 2023-05-07T19:03
2000億 大概到GPT 3.0規格吧
Isabella avatar
By Isabella
at 2023-05-09T16:27
跑出答案的速度超慢
Lydia avatar
By Lydia
at 2023-05-07T19:03
笑死 直接git clone算什麼研發
Hedwig avatar
By Hedwig
at 2023-05-09T16:27
真的懶趴比雞腿 https://i.imgur.com/z9kyC9M.jpg
Callum avatar
By Callum
at 2023-05-07T19:03
肥宅福音
Ida avatar
By Ida
at 2023-05-09T16:27
有ai就是噴了,管他內容是什麼!重返千金股
Ophelia avatar
By Ophelia
at 2023-05-07T19:03
你各位是多嚴格?能跑出結果來就該放鞭炮了
Thomas avatar
By Thomas
at 2023-05-09T16:27
試了一下....爛到不知道該說啥了!
Callum avatar
By Callum
at 2023-05-07T19:03
太神啦
Edith avatar
By Edith
at 2023-05-09T16:27
傻傻的 豬在風口都會飛 發哥本益比這麼低 就差題材
Kama avatar
By Kama
at 2023-05-07T19:03
試用了一下爛到笑,工程師是不是if(最高建築)cout
<<101<<Endl;這樣 那找我去做就可以了
Suhail Hany avatar
By Suhail Hany
at 2023-05-09T16:27
http://i.imgur.com/HhBai7a.jpg 理解能力真差
Queena avatar
By Queena
at 2023-05-07T19:03
發哥 上看兩千 一切 預告在前
Elvira avatar
By Elvira
at 2023-05-09T16:27
用開源軟體刻出來,大概大學專題程度
Audriana avatar
By Audriana
at 2023-05-07T19:03
參數量差太多,你在幼稚園學習別人讀高中了
Anonymous avatar
By Anonymous
at 2023-05-09T16:27
基本上台灣搞的起來的東西都是老蔣那一幫留美回來
的中國人搞的 土生土長的台灣人搞出來的東西就是些
小鼻子小眼睛
Michael avatar
By Michael
at 2023-05-07T19:03
成不了氣候 這麼說也不是台灣沒人材 而是台灣的人
材都不會傻呆在台灣早就出走了
Dora avatar
By Dora
at 2023-05-09T16:27
看到工研院心就涼一半了…
Anthony avatar
By Anthony
at 2023-05-07T19:03
30億參數、130億 tokens 應該還沒湧現現象,如果跟
前幾代能力差不多就糗大了。再觀察~
Ursula avatar
By Ursula
at 2023-05-09T16:27
爽啦打爆殘體文
Erin avatar
By Erin
at 2023-05-07T19:03
真的是git clone等級而已。拿別人的模型,Bloomz上f
ine-tune而已。而且有7.7%的資料是從簡體中文直接翻
成繁體中文。
Joseph avatar
By Joseph
at 2023-05-09T16:27
模型參數只有1B-3B,10億-30億,真的是GPT-2規模而
已。
Agnes avatar
By Agnes
at 2023-05-07T19:03
馬上被串去交友軟體
Jack avatar
By Jack
at 2023-05-09T16:27
用之乎者來交談很利害嗎
Ingrid avatar
By Ingrid
at 2023-05-07T19:03
git clone:
James avatar
By James
at 2023-05-09T16:27
坦白說 transformer 我也能刻,不知道能不能上新聞
。坦白說,我也用 prompt 讓 ChatGPT 產出 transfo
rmer encoder(by torch) 同時也驗證正確能執行,不
知道能不能上新聞。我不叫發科、我也不姓聯。
Agatha avatar
By Agatha
at 2023-05-07T19:03
用來發費雯 超讚 !
Mia avatar
By Mia
at 2023-05-09T16:27
這東西跟拿來當基底的語言模型差在哪? 有沒有什麼d
emo之類的可以展示出差別?

6244 茂迪 太陽神多

Delia avatar
By Delia
at 2023-05-03T11:40
1. 標的:6244 茂迪 2. 分類:多 3. 分析/正文: 現在太陽能類股有點族群表現,三月已經噴過一次,進入盤整後有機會再向上攻。 太陽能在三月題材後續加上魚電共生題材,在營收表現比去年亮眼很多,這只是淡季第一 年,後續看好營收持續上漲。 技術面整理後站回周線,之後有機會再向上 ...

泰山董事長詹景超:後悔引進龍邦 市場派

Iris avatar
By Iris
at 2023-05-03T11:22
原文標題: 泰山董事長詹景超:後悔引進龍邦 市場派目的不光併購公司 還要吃中聯油脂 原文連結: https://money.udn.com/money/story/5613/7137390 發布時間: 2023/05/02 記者署名: 何秀玲 原文內容: 泰山(1218)董事長詹景超今(2) ...

本週3檔新股抽籤出列 桓鼎KY 綠茵 貿聯KY

Isla avatar
By Isla
at 2023-05-03T11:22
原文標題:本周3檔新股抽籤出列 幸運兒最高可拿4.3萬紅包 原文連結:https://reurl.cc/rLWygN 發布時間:2023-05-03 10:38 記者署名:時報資訊 廖小蕎 原文內容: 5月首周新股抽籤出列,除了桓鼎-KY申購日3日截止,貿聯-KY及准上櫃新兵綠茵也開放抽 籤。(示意 ...

航運3雄股價上演「跳水秀」

Erin avatar
By Erin
at 2023-05-03T09:32
------------------------------- 原文標題:航運3雄股價上演「跳水秀」 背後關鍵因素曝光 原文連結: https://finance.ettoday.net/amp/amp_news.php7?news_id=2490744 發布時間:2023年05月2日 14:48 ...

AMD.US 財報

Lauren avatar
By Lauren
at 2023-05-03T09:09
1. 標的:AMD.US (例 2330.TW 台積電) 2. 分類:討論 3. 分析/正文: GAAP Quarterly Financial Results Q1 2023 Q1 2022 Y/Y Revenue ($M) ...