吉网

英伟达开源3400亿参数模型Nemotron-4 340B

导读 【英伟达开源3400亿参数模型Nemotron-4 340B】!!!今天受到全网的关注度非常高,那么具体的是什么情况呢,下面大家可以一起来看看具体都是...

【英伟达开源3400亿参数模型Nemotron-4 340B】!!!今天受到全网的关注度非常高,那么具体的是什么情况呢,下面大家可以一起来看看具体都是怎么回事吧!

1、【英伟达开源3400亿参数模型Nemotron-4 340B】当地时间6月14日,英伟达开源Nemotron-4 340B(3400亿参数)系列模型。

2、据英伟达介绍,开发人员可使用该系列模型生成合成数据,用于训练大型语言模型(LLM),用于医疗保健、金融、制造、零售和其他行业的商业应用。

3、Nemotron-4 340B包括基础模型Base、指令模型Instruct和奖励模型Reward。

4、英伟达使用了9万亿个token(文本单位)进行训练。

5、Nemotron-4 340B-Base在常识推理任务,如ARC-c、MMLU和BBH基准测试中,可以和Llama-3 70B、Mixtral 8x22B和Qwen-2 72B模型媲美。

以上就是关于【英伟达开源3400亿参数模型Nemotron-4 340B】的相关消息了,希望对大家有所帮助!