Qwen发布新一代大模型Qwen3:思深,行速
2025年4月29日,Qwen团队正式发布新一代大型语言模型系列——Qwen3。此次发布包括旗舰MoE模型Qwen3-235B-A22B(总参数超2350亿)和轻量版Qwen3-30B-A3B,以及六个Dense模型,全部开源并采用Apache 2.0许可。
Qwen3在代码、数学、通用推理等多个基准测试中表现优异,与DeepSeek、Grok、Gemini等顶尖模型竞争力十足。特别是小型模型Qwen3-4B,其性能已媲美前代Qwen2.5-72B模型。
核心亮点包括:
• 思考模式切换:支持深度推理或快速响应,用户可根据任务灵活控制推理预算。
• 多语言支持:覆盖119种语言与方言,进一步拓宽全球应用范围。
• 强化Agent能力:显著提升环境交互与工具调用效率,适配多种应用场景。
• 预训练升级:采用约36万亿token数据(比前代翻倍),涵盖更多学科、代码及长文本数据。
• 灵活部署:支持Hugging Face、ModelScope、Kaggle等平台,同时适配SGLang、vLLM、Ollama等开发框架。
Qwen团队表示,Qwen3标志着向通用人工智能(AGI)迈进的重要一步,未来将在数据规模、模型规模、推理深度、多模态集成等方面持续创新,致力于从训练大模型到训练智能Agent的转型。
Qwen3现已上线,用户可通过网页版或移动App体验全新能力。
该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub 开放,用户可访问 Qwen Chat 体验 Qwen3,并加入 Discord 参与讨论。
官方Blog: https://qwenlm.github.io/zh/blog/qwen3/
2025年4月29日,Qwen团队正式发布新一代大型语言模型系列——Qwen3。此次发布包括旗舰MoE模型Qwen3-235B-A22B(总参数超2350亿)和轻量版Qwen3-30B-A3B,以及六个Dense模型,全部开源并采用Apache 2.0许可。
Qwen3在代码、数学、通用推理等多个基准测试中表现优异,与DeepSeek、Grok、Gemini等顶尖模型竞争力十足。特别是小型模型Qwen3-4B,其性能已媲美前代Qwen2.5-72B模型。
核心亮点包括:
• 思考模式切换:支持深度推理或快速响应,用户可根据任务灵活控制推理预算。
• 多语言支持:覆盖119种语言与方言,进一步拓宽全球应用范围。
• 强化Agent能力:显著提升环境交互与工具调用效率,适配多种应用场景。
• 预训练升级:采用约36万亿token数据(比前代翻倍),涵盖更多学科、代码及长文本数据。
• 灵活部署:支持Hugging Face、ModelScope、Kaggle等平台,同时适配SGLang、vLLM、Ollama等开发框架。
Qwen团队表示,Qwen3标志着向通用人工智能(AGI)迈进的重要一步,未来将在数据规模、模型规模、推理深度、多模态集成等方面持续创新,致力于从训练大模型到训练智能Agent的转型。
Qwen3现已上线,用户可通过网页版或移动App体验全新能力。
该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub 开放,用户可访问 Qwen Chat 体验 Qwen3,并加入 Discord 参与讨论。
官方Blog: https://qwenlm.github.io/zh/blog/qwen3/
tg-me.com/ShareCentre/6953
Create:
Last Update:
Last Update:
Qwen发布新一代大模型Qwen3:思深,行速
2025年4月29日,Qwen团队正式发布新一代大型语言模型系列——Qwen3。此次发布包括旗舰MoE模型Qwen3-235B-A22B(总参数超2350亿)和轻量版Qwen3-30B-A3B,以及六个Dense模型,全部开源并采用Apache 2.0许可。
Qwen3在代码、数学、通用推理等多个基准测试中表现优异,与DeepSeek、Grok、Gemini等顶尖模型竞争力十足。特别是小型模型Qwen3-4B,其性能已媲美前代Qwen2.5-72B模型。
核心亮点包括:
• 思考模式切换:支持深度推理或快速响应,用户可根据任务灵活控制推理预算。
• 多语言支持:覆盖119种语言与方言,进一步拓宽全球应用范围。
• 强化Agent能力:显著提升环境交互与工具调用效率,适配多种应用场景。
• 预训练升级:采用约36万亿token数据(比前代翻倍),涵盖更多学科、代码及长文本数据。
• 灵活部署:支持Hugging Face、ModelScope、Kaggle等平台,同时适配SGLang、vLLM、Ollama等开发框架。
Qwen团队表示,Qwen3标志着向通用人工智能(AGI)迈进的重要一步,未来将在数据规模、模型规模、推理深度、多模态集成等方面持续创新,致力于从训练大模型到训练智能Agent的转型。
Qwen3现已上线,用户可通过网页版或移动App体验全新能力。
该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub 开放,用户可访问 Qwen Chat 体验 Qwen3,并加入 Discord 参与讨论。
官方Blog: https://qwenlm.github.io/zh/blog/qwen3/
2025年4月29日,Qwen团队正式发布新一代大型语言模型系列——Qwen3。此次发布包括旗舰MoE模型Qwen3-235B-A22B(总参数超2350亿)和轻量版Qwen3-30B-A3B,以及六个Dense模型,全部开源并采用Apache 2.0许可。
Qwen3在代码、数学、通用推理等多个基准测试中表现优异,与DeepSeek、Grok、Gemini等顶尖模型竞争力十足。特别是小型模型Qwen3-4B,其性能已媲美前代Qwen2.5-72B模型。
核心亮点包括:
• 思考模式切换:支持深度推理或快速响应,用户可根据任务灵活控制推理预算。
• 多语言支持:覆盖119种语言与方言,进一步拓宽全球应用范围。
• 强化Agent能力:显著提升环境交互与工具调用效率,适配多种应用场景。
• 预训练升级:采用约36万亿token数据(比前代翻倍),涵盖更多学科、代码及长文本数据。
• 灵活部署:支持Hugging Face、ModelScope、Kaggle等平台,同时适配SGLang、vLLM、Ollama等开发框架。
Qwen团队表示,Qwen3标志着向通用人工智能(AGI)迈进的重要一步,未来将在数据规模、模型规模、推理深度、多模态集成等方面持续创新,致力于从训练大模型到训练智能Agent的转型。
Qwen3现已上线,用户可通过网页版或移动App体验全新能力。
该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub 开放,用户可访问 Qwen Chat 体验 Qwen3,并加入 Discord 参与讨论。
官方Blog: https://qwenlm.github.io/zh/blog/qwen3/
BY AI一线|ShareCentre



Share with your friend now:
tg-me.com/ShareCentre/6953