• <samp id="8qo88"><tbody id="8qo88"></tbody></samp><ul id="8qo88"><pre id="8qo88"></pre></ul>
    <kbd id="8qo88"></kbd>
    <samp id="8qo88"><tbody id="8qo88"></tbody></samp>
  • <strike id="8qo88"><s id="8qo88"></s></strike>
    環球微速訊:中文通用大模型基準測試發布,訊飛星火認知大模型國內第一
    2023-05-10 12:38:56 來源: 貝殼財經

    5月9日,中文通用大模型綜合性評測基準SuperCLUE正式發布。該基準測試主要關注以下問題:中文大模型在不同任務上的表現如何?與國際代表性模型相比,中文大模型的表現達到了何種程度?中文大模型與人類表現相比如何?

    該模型可通過多個層面,考研市面上主流的中文GPT大模型的能力:

    基礎能力:包括了常見的有代表性的模型能力,如語義理解、對話、邏輯推理、角色模擬、代碼、生成與創作等10項能力。


    (資料圖片僅供參考)

    專業能力:包括了中學、大學與專業考試,涵蓋了從數學、物理、地理到社會科學等50多項能力。

    中文特性能力:針對有中文特點的任務,包括了中文成語、詩歌、文學、字形等10多項能力。

    該機構利用SuperCLUE測試基準,對市面上主流的支持中文的通用大模型進行了評測與排名。從排名中我們可以看出,GPT-4一騎絕塵,已經非常接近人類的能力。國產大模型中科大訊飛研發的星火認知大模型總排名第三,國內排名第一。

    以下為該機構公布的各個子項目的具體得分。排行榜會定期更新,并于以下網站進行公示。www.CLUEbenchmarks.com/superclue.html

    總榜單

    基礎能力榜單

    中文特性榜單

    校對 劉軍

    關鍵詞:
    責任編輯:zN_1054
      亚洲成熟丰满熟妇高潮XXXXX| 国产精品亚洲成在人线| 亚洲午夜精品第一区二区8050| 亚洲欧美日韩综合久久久| 国产精品亚洲综合久久| 久久亚洲精品专区蓝色区| 亚洲制服丝袜一区二区三区| 亚洲国语在线视频手机在线| 亚洲大尺码专区影院| 亚洲一级免费视频| 99久久国产亚洲综合精品| 亚洲色大情网站www| 亚洲精品无码专区在线| 亚洲AV成人无码久久WWW| 久久亚洲AV成人无码国产最大| 久久精品国产亚洲AV未满十八 | 亚洲A∨精品一区二区三区下载| 亚洲av成人一区二区三区观看在线| 亚洲av日韩专区在线观看| 九月婷婷亚洲综合在线| 亚洲人午夜射精精品日韩| 亚洲人成网站在线观看青青 | 亚洲1234区乱码| 亚洲欧美成人综合久久久| 亚洲第一se情网站| 亚洲日韩在线观看免费视频| 亚洲色偷偷偷鲁综合| 亚洲欧洲免费视频| 亚洲国产成人超福利久久精品| 最新国产精品亚洲| 精品国产日韩亚洲一区在线| 亚洲综合色在线观看亚洲| 亚洲精品无码久久千人斩| 久久久久亚洲精品无码蜜桃| 亚洲不卡在线观看| 国产亚洲一卡2卡3卡4卡新区| 亚洲黄片手机免费观看| 亚洲成AV人片在线观看| 亚洲精品中文字幕无码AV| 亚洲中文字幕乱码AV波多JI| 亚洲 国产 图片|