设为首页 加入收藏 网站地图
现货平台
全国分站导航

中钢网

价格汇总
价格查询
价格走势
价格统计
中钢网新闻中心钢市纵横商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4

商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4

分享打印 2023-06-21 22:01 编辑:刘志笋     来源: 快科技     字体: [大][中][小]    

快科技6月21日消息,在AI大模型领域,OpenAI的ChatGPT成为当前最火的大模型,也是标杆性的,多个国产大模型都要对标它,今天商汤科技公布了自己的大模型测试结果,三个测试项目中都超越了ChatGPT。

商汤科技自研中文语言大模型名为“商量SenseChat 2.0”,日前公布的测试显示,MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。

根据评测结果,“商量SenseChat 2.0”在三个测试集中表现均领先ChatGPT,部分已十分接近GPT4的水平,实现了我国语言大模型研究的重要突破。

商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4

这三个测试分别如下:

由美国加州大学伯克利分校等高校构建的多任务考试评测集MMLU;

微软研究院推出的学科考试评测集AGIEval(含中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等);

由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval;

商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4

在MMLU测试中,“商量SenseChat 2.0”综合得分为68.6,远超GLM-130B(45.7分)的得分,同时还超过了ChatGPT(67.3分)、LLaMA-65B(63.5分)仅落后GPT-4(86.4分),位居第二。

在AGIEval测试中,“商量SenseChat 2.0”测出49.91的分数,遥遥领先GLM-130B(34.2分)、LLaMMA-65B(34.0分),并再次超越ChatGPT(42.9分),仅次于GPT-4的56.4分。

在其中的AGIEval(GK)评测子集中,“商量SenseChat 2.0”以58.5分全面领先,仅微弱差距落后GPT-4(58.8分)。

在C-Eval测试中,“商量SenseChat 2.0”拿到了66.1的分数,在参评的18个大模型中,仅次于GPT-4(68.7分),全面领先ChatGPT、Claude、Bloom、GLM-130B、LLaMA-65B等一众海内外大模型。

截至目前,已有近千家企业客户通过申请,应用和体验“商量SenseChat 2.0”超强的长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力,并且“商量SenseChat 2.0”还在服务客户过程中,持续实现着快速迭代和提升,以及知识的实时更新。

免责声明:本文所载信息仅供参考,不作为直接决策依据。以上内容如无意中侵犯您的合法权益,请及时联系删除处理。
QQ:153405099 电话:13783683896           刘先生

现货资源

品名规格材质厂家地区仓库价格 现货
螺纹钢12-32HRB400E长治市创发商贸有限公司首钢长钢(首钢长钢)0 详情
热轧卷板15.50×1500Q235B宁夏祥合明贸易有限公司包钢(银川市西夏区)0 详情
普碳中板14Q235B唐山沐翌供应链有限公司唐钢(金秋港)0 详情
低合金板35*2200*12000Q355B济南国泉钢材有限公司鄂钢(省库)4800 详情
无缝管12*220#山东东银金属材料有限公司聊城精密(东银库)5700 详情
圆钢20#Q235长葛市宝鼎钢材有限公司宝鼎钢铁(长葛市于井钢材交易市场)3950 详情
热轧卷3.0*1800*CQ235B上海盛钢联供应链管理有限公司万钢(泉安/长和隆)0 详情
高线Φ20*CQ355D上海北铭高强度钢材有限公司韶钢(川流富锦库)5540 详情

Copyright © 2005 - 2024 中钢网 All Rights Reserved

全国咨询/投诉电话:400-700-8508  豫ICP备2021034665号

豫公网安备 41010502005284号