6月7日,阿里云更新本事博客:重磅发布开源模子Qwen2-72B可以赢钱的游戏软件,性能跳动好意思国最强的开源模子Llama3-70B,也跳动繁密中国闭源大模子。通盘东说念主均可在魔搭社区和Hugging Face免费下载通义千问最新开源模子。
比拟2月推出的通义千问Qwen1.5,Qwen2结束了举座性能的代际飞跃。在巨擘模子测评榜单OpenCompass中,此前开源的Qwen1.5-110B已发轫于许多中国闭源模子。刚刚开源的Qwen2-72B,举座性能比拟Qwen1.5-110B又取得了大幅普及。
通义千问Qwen2系列模子大幅普及了代码、数学、推理、提示谨守、多言语意会等技艺。在MMLU、GPQA、HumanEval、GSM8K、BBH、MT-Bench、Arena Hard、LiveCodeBench等外洋巨擘测评中,Qwen2-72B一举斩获十几项寰球冠军,跳动好意思国的Llama3。
(图:Qwen2-72B在十多个巨擘测评中获取冠军,跳动好意思国的Llama3-70B模子)
通义千问团队在本事博客中涌现,Qwen2系列包含5个尺寸的预磨练和提示微调模子,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B为夹杂人人模子(MoE)。Qwen2通盘尺寸模子齐使用了GQA(分组查询把稳力)机制,以便让用户体验到GQA带来的推理加快和显存占用裁汰的上风。
(图:Qwen2系列包含5个尺寸的预磨练和提示微调模子)
在中英文以外,模子磨练数据中增多了27种言语有关的高质料数据,普及了模子的多言语技艺。Qwen2还增大了高下文长度接济,Qwen2-72B-Instruct未必好意思满搞定128k高下文长度内的信息抽取任务。
魔搭社区模子下载地址:
Qwen2-72B https://modelscope.cn/models/qwen/Qwen2-72B
Qwen2-72B-Instruct https://modelscope.cn/models/qwen/Qwen2-72B-Instruct
据悉,通义千问Qwen系列模子正在群众爆火,总下载量一个月内翻了一倍,已冲破1600万次。群众开源社区仍是出现了跳动1500款基于Qwen二次修复的模子。Qwen系列的72B、110B模子屡次登顶HuggingFace 的Open LLM Leaderboard开源模子榜单。
阿里云CTO周靖东说念主默示,“坚抓开源洞开是阿里云的热切战略,咱们但愿打造一朵AI时期最洞开的云,让算力更普惠、让AI更普及。”
(图:繁密开源平台和器用第一时辰接济Qwen2)
自2023年8月开源以来,通义千问在群众开源社区生态中已酿成热切影响力。6月7日,Qwen2系列模子的API第一时辰登陆阿里云百真金不怕火平台。TensorRT-LLM、OpenVINO、OpenCompass、XTuner、LLaMA-Factory、Firefly、OpenBuddy、vLLM、Ollama等繁密群众开源平台和器用,也第一时辰告示接济Qwen2最新款模子。除了好意思国Llama开源生态以外,通义千问已成为群众修复者的另一主流选项。
夕雯 小风可以赢钱的游戏软件