阿里云宣布Qwen2开源

科技IT 2024-06-08 user3242

  阿里云宣布,Qwen2今日开源,免费下载。

  阿里云表示,历经数月努力,很高兴迎来了Qwen系列模型从Qwen1.5到Qwen2的重大升级。

  这次升级包括:

  5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B;

  在中文英语的基础上,训练数据中增加了27种语言相关的高质量数据;

  多个评测基准上的领先表现;

  代码和数学能力显著提升;

  增大了上下文长度支持,最高达到128K tokens(Qwen2-72B-Instruct)。

  据悉,Qwen2-72B-Instruct能够完美处理128k上下文长度内的信息抽取任务;Qwen2-7B-Instruct几乎完美地处理长达128k的上下文;Qwen2-57B-A14B-Instruct则能处理64k的上下文长度;而该系列中的两个较小模型则支持32k的上下文长度。

  目前,上述Qwen2系列模型已在Hugging Face和ModelScope上同步开源。

  阿里云强调,此次采用不同的模型许可。除了Qwen2-72B依旧使用此前的Qianwen License外,其余模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B以及Qwen2-57B-A14B在内,均采用Apache 2.0的许可。

  阿里云希望本次开放程度的提升能够加速Qwen2在全球各地的落地及商业应用。

The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。

Copyright © 2099 搜索科技

苏ICP备2023036119号-10 |——:

|—— TXT地图 | 网站地图 |