設置
          • 日夜間
            隨系統(tǒng)
            淺色
            深色
          • 主題色

          與荀子對話:“古籍版ChatGPT”發(fā)布

          2023-12-17 23:21:05 來源: 中國科學報

           t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          對于普通受眾而言,想要走近繁體、豎版、未添加句逗的古文不是一件容易的事。近日,國內首個專門應用于古籍處理與研究的智能工具“荀子”上線,意味著在智媒時代和古籍對話成為可能。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          據(jù)悉,古籍大語言模型“荀子”由南京農業(yè)大學信息管理學院教授王東波研究團隊研發(fā),是一個包含了《四庫全書》在內古籍文獻的超20億字大型語料庫,能夠實現(xiàn)自然語言理解、自動翻譯、詩歌生成、自動標引等多項功能。作為開源的、公益的研究成果,該模型已在GitHub、ModelScope等網(wǎng)站開源。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          向思想家荀子致敬t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          為何取名“荀子”?據(jù)王東波介紹,荀子不僅是我國先秦時期偉大的樸素唯物主義思想家,也是一位散文大家。在對他作品的深入研討中,團隊發(fā)現(xiàn),他在語言學理論的闡述上也是一位開拓者,命名荀子是為了紀念這位中國歷史上的語言學先驅。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          “咱們請它以金陵為主題,生成一首五言絕句。”王東波現(xiàn)場演示了“荀子”的智能寫詩功能。指令一輸入,系統(tǒng)便生成了一首堪稱絕妙的原創(chuàng)絕句:“秦淮佳麗地,城闕望中迷。柳暗青絲發(fā),花香碧玉衣。歌樓留夜色,畫閣斂春暉。細雨輕舟去,雙魚夢澤飛。”t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          除此之外,古文的閱讀理解、標點添加,以及將古漢語翻譯為現(xiàn)場漢語,這些讓受眾難啃的“硬骨頭”,“荀子”可以輕松拿下。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          對于領域專家而言,可以借助“荀子”完成古籍詞法分析、實體識別、關系抽取、文本分類與匹配、文本摘要等專業(yè)古籍研究處理場景。同時發(fā)布的基座模型,還可以讓用戶根據(jù)自己的需求,使用本地的訓練語料微調“荀子”基座模型,使其在古籍下游處理任務上取得更優(yōu)越的處理性能。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          10年“冷板凳”教會機器通讀古今t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          盡管目前有200多個通用模型在各領域得到應用,但古籍領域仍缺乏專業(yè)的大語言模型。功能強大的 “荀子”到底是怎么做到化繁為簡、通讀古今的呢?t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          “首先是‘算力充足’,并且‘飽讀經(jīng)書’!”王東波介紹,“荀子”的順利問世離不開南京農業(yè)大學提供的高性能算力基礎設施支持,以及團隊長期積累的大量標注、精加工語料庫,團隊給“荀子”投喂了40億字大型混合語料數(shù)據(jù)。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          “模型的構建受算力、場景應用等多方影響,但精準度較高的優(yōu)質數(shù)據(jù),是最為關鍵的。”據(jù)王東波介紹,團隊從2008年開始接觸古籍,2013年至今一直專注于人工精標注數(shù)據(jù)的工作。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          “比如《岳陽樓記》,要訓練機器標注該典籍中的形容詞,就要首先訓練相關人員標注形容詞,在大量人工標注的基礎上,再讓機器學習。”這項坐冷板凳的基礎標注工作一做就是10年之久。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          王東波表示,期待能將古籍的智能化研究與跨學科的人才培養(yǎng)相結合,讓學生既有前瞻的科研視野,又能積累較為深厚的人文底蘊。同時讓更多受眾接觸古籍、品讀古籍、傳播古籍,真正地喚活“故紙堆”,共同推動中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉化和創(chuàng)新性發(fā)展,賡續(xù)傳承中華文脈。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          聯(lián)合發(fā)布荀子古籍大語言模型的中華書局古聯(lián)公司則主要致力于未來的場景應用和領域推廣。荀子大模型除讓大眾用戶能夠順暢利用古籍內容、在專業(yè)領域推動古籍整理、古籍數(shù)字化、古籍活化利用與傳播之外,未來還可廣泛應用于AI寫作、AI教學、數(shù)字文娛等領域。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          該成果依托國家社科基金重大項目“中國古代典籍跨語言知識庫構建及應用研究”。在同步舉行的古籍智能化研究與產業(yè)應用研討會上,來自高校、出版界和互聯(lián)網(wǎng)企業(yè)的與會專家學者分別立足于各自領域,圍繞大模型在古籍整理、傳統(tǒng)文化傳承、數(shù)字化轉型等方面的工作進行了深入探討。t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          模型鏈接:t3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          https://github.com/Xunzi-LLM-of-Chinese-classics/XunziALLMt3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          https://modelscope.cn/models/Xunzillm4cc/Xunzi-Qwen-Chatt3m流量資訊——探索最新科技、每天知道多一點LLSUM.COM

          本文鏈接:與荀子對話:“古籍版ChatGPT”發(fā)布http://www.lensthegame.com/show-11-1682-0.html

          聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

          上一篇: 體會“變老”后,我們更加理解了老年護理

          下一篇: 曾無緣NOI的他兩次獲CSP認證滿分

          熱門資訊

          推薦資訊

          • 日榜
          • 周榜
          • 月榜
          主站蜘蛛池模板: 在线电影一区二区三区| 久久国产香蕉一区精品| 一区二区乱子伦在线播放| 色一情一乱一伦一区二区三欧美| 精品一区二区三区色花堂| 亚洲一区二区三区免费视频| 99久久精品国产高清一区二区| 夜精品a一区二区三区| 91精品国产一区二区三区左线| 亚洲熟女少妇一区二区| 国产激情一区二区三区成人91| 日韩精品一区二区三区在线观看| 国产精品资源一区二区| 无码人妻一区二区三区免费| 老熟妇仑乱一区二区视頻| 亚洲国产精品一区二区久久| 国产剧情国产精品一区| 熟女性饥渴一区二区三区| 香蕉视频一区二区| 国产免费播放一区二区| 国产日韩高清一区二区三区| 国产精品一区二区av不卡| 一区二区不卡视频在线观看| 无码欧精品亚洲日韩一区夜夜嗨| 日本精品一区二区三区在线视频| 国产精品久久亚洲一区二区| 国产亚洲福利精品一区二区| 精品一区二区91| 亚洲国产专区一区| 中文字幕一区二区三区在线不卡| 亚洲日韩国产精品第一页一区| 国产一区二区三区乱码| 久久国产精品亚洲一区二区| 无码人妻一区二区三区在线 | 国产乱码精品一区二区三区麻豆| 2018高清国产一区二区三区 | 女同一区二区在线观看| 日本一区中文字幕日本一二三区视频 | 成人精品一区二区电影| 色婷婷亚洲一区二区三区| 国产精品综合一区二区三区|