阿里巴巴开源千问3模型 4张H20显卡即可部署“满血版”
华夏经济网4月29日消息,阿里巴巴集团宣布正式开源其大语言模型Qwen-72B(千问3),并强调该模型在性能与部署成本上取得突破。据官方介绍,用户仅需4张H20显卡(华为昇腾系列)即可部署完整版千问3,大幅降低了大规模AI模型的应用门槛。
千问3作为阿里云“通义千问”系列的最新一代模型,具备720亿参数,在语言理解、逻辑推理及多模态任务中表现优异。此次开源包含模型权重、推理代码及技术文档,支持企业及开发者进行商业化应用与二次开发。
阿里巴巴表示,通过深度优化算法与硬件适配,千问3在H20显卡上的推理效率提升40%,显存占用减少50%,使得中小机构也能低成本运行百亿级模型。这一举措被视为对国产AI生态的重要推动,或将加速行业在金融、教育、医疗等场景的落地创新。
目前,千问3已上线阿里云ModelScope社区及GitHub平台,提供免费下载。业内分析指出,阿里此次开源策略或进一步加剧全球大模型竞争,推动技术普惠化进程。