当前位置：首页 > 热点资讯 > 正文

国内最大Llama开源社区发布首个预训练中文版Llama2

时间：2023-08-02 17:28:38 来源：哔哩哔哩

(资料图)

"7月31日，Llama中文社区率先完成了国内首个真正意义上的中文版Llama2-13B大模型，从模型底层实现了Llama2中文能力的大幅优化和提升。毋庸置疑，中文版Llama2一经发布将开启国内大模型新时代！

| 全球最强，但中文短板

Llama2是当前全球范围内最强的开源大模型，但其中文能力亟待提升Meta不负众望，于7月19日凌晨开源了第一代LLaMA的升级版：Llama2，7B、13B和70B三种大小的模型全开放并且可免费商用。作为AI领域最强大的开源大模型，Llama2基于2万亿token数据预训练，并在100万人类标记数据上微调得到对话模型。在包括推理、编程、对话和知识测试等许多基准测试中效果显著优于MPT、Falcon以及第一代LLaMA等开源大语言模型，也第一次媲美商用，在一众开源模型中独树一帜。虽然Llama2的预训练数据相对于第一代扩大了一倍，但是中文预训练数据的比例依然非常少，仅占0.13%，这也导致了原版Llama2的中文能力较弱。我们对于一些中文问题进行提问，发现大多数情况下Llama2都不能以中文回答，或者以中英文混杂的形式回答问题。因此，需要基于大规模中文数据对Llama2进行优化，使Llama2具备更好的中文能力。

为此国内顶尖高校大模型博士团队创办了Llama中文社区，开启了Llama2中文大模型训练征程。

| 最领先的Llama中文社区

Llama中文社区是国内最领先的开源大模型中文社区，Github在两周内即达到 star，由清华、交大以及浙大博士团队领衔，汇聚了60+AI领域高级工程师以及各行业2000+顶级人才。社区链接：/FlagAlpha/Llama2-Chinese

社区历程：

| 首个预训练中文版Llama2模型发布！

不是微调！而是基于200B中文语料预训练！

7月31日，Llama中文社区率先完成了国内首个真正意义上的中文版13B Llama2模型：Llama2-Chinese-13B，从模型底层实现了Llama2中文能力的大幅优化和提升。Llama2的中文化可以采用大致两种路线：1. 基于已有的中文指令数据集，对预训练模型进行指令微调，使得基座模型能够对齐中文问答能力。这种路线的优势在于成本较低，指令微调数据量小，需要的算力资源少，能够快速实现一个中文Llama的雏形。但缺点也显而易见，微调只能激发基座模型已有的中文能力，但由于Llama2的中文训练数据本身较少，所以能够激发的能力也有限，治标不治本，从根本上增强Llama2模型的中文能力还是需要从预训练做起。2. 基于大规模中文语料进行预训练。这种路线的缺点在于成本高！不仅需要大规模高质量的中文数据，也需要大规模的算力资源。但是优点也显而易见，就是能从模型底层优化中文能力，真正达到治本的效果，从内核为大模型注入强大的中文能力！为了从内核实现一个彻底的中文大模型，我们选择了第二条路线！我们汇集了一批高质量的中文语料数据集，从预训练开始优化Llama2大模型。部分预训练数据数据如下：类型描述网络数据互联网上公开的网络数据，挑选出去重后的高质量中文数据，涉及到百科、书籍、博客、新闻、公告、小说等高质量长文本数据Wikipedia中文Wikipedia的数据悟道中文悟道开源的200G数据ClueClue开放的中文预训练数据，进行清洗后的高质量中文长文本数据竞赛数据集近年来中文自然语言处理多任务竞赛数据集，约150个MNBVCMNBVC 中清洗出来的部分数据集首期 Llama2-Chinese-13B 模型的预训练数据包含 200B token，未来，我们将持续不断地迭代更新 Llama2-Chinese，逐步将预训练数据提升到1T token。除此以外，我们也将逐步开放70B模型的中文预训练版本，敬请期待！我们从通用知识、语言理解、创作能力、逻辑推理、代码编程、工作技能等不同方面提问大模型，得到了令人满意的效果！部分效果展示如下：通用知识语言理解创作能力逻辑推理代码编程工作技能

X 关闭

最新推荐

国内最大Llama开源社区发布首个预训练中文版Llama2

2023-08-02

8月2日山西高平能源糠醛报价平稳

2023-08-02

8月2日国缆检测涨停分析：超导概念，上海国企改革，国企改革概念热股

2023-08-02

泓淋电力：目前公司产品暂未涉及超导相关的技术

2023-08-02

小崧股份（002723）8月2日主力资金净卖出1334.18万元

2023-08-02

dnf光属性强化宝珠有哪些-光属性强化宝珠介绍

2023-08-02

郭明錤：常温超导将颠覆电子产品设计 iPhone 可匹敌量子计算机

2023-08-02

历时120天！国内最长地铁环线首个盾构区间顺利贯通

2023-08-02

金象大药房网上药店（关于金象大药房网上药店的基本详情介绍）

2023-08-02

理想汽车捐赠2000万元用于开展紧急救灾

2023-08-02

088期袁军师大乐透预测奖号：前区定位分析

2023-08-02

种上“黄金叶” 奔出“致富路”

2023-08-02

以数字技术创新赋能交通运输绿色低碳发展

2023-08-02

淘金币怎么关闭

2023-08-02

专家学者齐聚金城共话人文地理学转型发展

2023-08-02

抓好农业防灾减灾奋力争夺秋粮丰收

2023-08-02

图说大运｜重磅选手纷纷亮相大运比赛激战正酣

2023-08-02

蛋壳军团官网在哪下载最新官方下载安装地址

2023-08-02

唐王城神秘面纱渐次揭开

2023-08-02

荣耀Play7T 电池健康度多少换电池

2023-08-02

蔚来销量大涨104% 全新ES6破万！超理想是时间问题

2023-08-01

香港6月零售业销货价值同比升19.6% 连升7个月

2023-08-01

防汛进入关键时刻海河流域启用5个蓄滞洪区应对流域性洪水

2023-08-01

天地神兽金刚2之天神地兽全集（神兽金刚之天神地兽有几个神兽金刚）

2023-08-01

江西出台16条举措进一步促进和扩大消费

2023-08-01

晨曦航空：拟定增募资不超2.06亿元用于直升机研发中心项目

2023-08-01

降价3.7万威力巨大！大众ID.3 7月订单直接破万连德国人都吃醋了

2023-08-01

遗迹2怎么刷材料遗迹2无限刷物品教学

2023-08-01

现代汽车7月份销售1.96万辆电动汽车时隔5个月再次低于2万辆

2023-08-01

江化微：使用自有资金5亿元对子公司镇江江化微增资

2023-08-01

中消协提示：“剩菜盲盒”风险意识不可“盲”

2023-08-01

国内机票燃油附加费年内首次上涨！周六前订票能省钱

2023-08-01

无水硫代硫酸钠（大苏打）商品报价动态（2023-08-01）

2023-08-01

涨价了！机票燃油附加费今年首次上涨

2023-08-01

联合水务8月1日快速反弹

2023-08-01

【数读】现役“英超四大‘太子’”随着梅森·芒特离...

2023-08-01

2023癸卯年150克方形金币价格（2023年08月01日）

2023-08-01

韩国贸易部：7月半导体出口额骤降34%

2023-08-01

昆明理工大学建筑工程学院承办云南省土木建筑学会建筑结构专业委员会2023年度全体委员会议

2023-08-01

2023年8月份十二生肖运势

2023-08-01

51岁翟颖头发稀少发际线超高与男友人贴脸合影

2023-08-01

杜苏芮后是卡努:台风名字咋来的？台风卡努会比杜苏芮更强吗？

2023-08-01

财神社区组织儿童手绘迎八一长卷

2023-08-01

香港食安中心：荷兰弗雷佛兰省禽肉及禽类产品暂停进口

2023-08-01

王府井（600859）7月31日主力资金净卖出2862.52万元

2023-08-01

北京发布地质灾害气象风险红色预警

2023-08-01

中银证券给予万华化学买入评级

2023-08-01

四川省广安市邻水县：高竹互通工程正式通车

2023-08-01

一年中最热的“大暑”来了！看中医支招酷暑养生

2023-08-01

V观财报｜两大港口人事变动：重庆港董秘接任董事长，上港集团总裁辞职

2023-07-31

如何炒扇贝肉好吃又简单？教你这样炒，好吃超下饭

2023-07-31

工作推进报告ppt

2023-07-31

从业资格管理新规为货车司机带来便利

2023-07-31

南通支云官方：两名一线队员被要求配合调查，俱乐部已行使单方解约权

2023-07-31

浙商证券：实施权益分派期间“浙22转债”转股连续停牌

2023-07-31

国机精工拟投资1000万元设立精工测试子公司

2023-07-31

《行走大师》第一关怎么通关

2023-07-31

日本女足世界杯历史第2次小组全胜，近8次世界杯7次小组榜首出线

2023-07-31

稳增长政策陆续出台 7月制造业PMI延续回升

2023-07-31

洛轲智能市场营销总经理吴越跳槽了好几次这次是刚来不久

2023-07-31

英国电信希望使用电话亭作为电动汽车充电点

2023-07-31

2023大连梭鱼湾3号路交东方路铁路道口封闭绕行

2023-07-31

麦价震荡稳中走高　优质品种走势偏强

2023-07-31

7月31日抖音小店板块涨幅达2%

2023-07-31

房地产市场迎来利好，住建部明确，“认房不认贷”真要来了

2023-07-31

巨人网络《无主王座》将于8月初进行小规模技术测试

2023-07-31

鸣志电器：鸣志工业（越南）有限公司主要从事控制电机及其他相关产品的研发、制造、销售及出口

2023-07-31

楼市预期大变？需解决烂尾问题

2023-07-31

云南跑出新能源发展“加速度”

2023-07-31

高通侯明娟：生成式AI为数字娱乐创造新动能

2023-07-31

北京房山暴雨突发山洪！记者直击

2023-07-31

朝鲜阅兵亮出罕见新装备，韩媒很惊讶：这是哪来的？

2023-07-31

两市融资余额减少31.19亿元

2023-07-31

巴西西部发生坠机事故致2人死亡

2023-07-31

呼叫转移怎么设置一键重装系统呼叫转移怎么设置一键重装系统手机

2023-07-31

兵的拼音怎么写呀（鬈发的拼音）

2023-07-31

十方教育是不是骗子（卤三国到底怎么样啊是不是真实的还是个骗子！）

2023-07-30

筹办大运会助力成都建设世界赛事名城

2023-07-30

失之毫厘！李源一头球击中横梁弹出！

2023-07-30

首款DLC免费领取《法外枭雄：滚石城》武器包

2023-07-30

解锁“村超”丨一颗足球引发的“超”字号产业潜力释放

2023-07-30

“室温超导”又火了！业内学者存疑专家点评

2023-07-30

北京降雨已达暴雨量级这份出行提示请查收

2023-07-30

活力广东时尚湾区·赏粤[gf]246f[/gf]｜广东梅州：世界客都魅力梅州

2023-07-30

《中国海洋法治发展报告》今日发布

2023-07-30

女法官的工作日常是怎样的？看完这个视频你就知道了【湖南法院新媒体大赛一等奖作品】

2023-07-30

青春主场｜开门红！中国男排3比0完胜日本男排

2023-07-30

看完这些关于非官方补丁的视频后，我对恢复《血统》剪辑内容的模组制作者更加尊重

2023-07-30

不爱说话的凉皮摊主竟是身负命案的“高颜值逃犯”

2023-07-30

国华教育集团_国华教育

2023-07-30

国家自然博物馆7月30日、31日闭馆

2023-07-30

你伤害了我还一笑而过是什么歌_歌名我不是天使

2023-07-30

【成都大运会】小新看大运——成都大运村里的“成都心意”

2023-07-29

Guess what we're doing? Modern sports encounter Shu relics

2023-07-29

余秋雨经典语录（感悟经典之美）

2023-07-29

breadtalk门店 bread talk

2023-07-29

宁波尹球五金制造有限公司(关于宁波尹球五金制造有限公司简述)

2023-07-29

孟天宇(关于孟天宇简述)

2023-07-29

男子翻案潜逃10多年，经营足浴店被警方检查时，终落网

2023-07-29

好的父母，不需要太用力，而是需要用爱，更需要顺其自然的松弛感

2023-07-29

Copyright © 2015-2022 华中纸业网版权所有  备案号：京ICP备12018864号-26   联系邮箱：2 913 236 @qq.com