国家超算互联网平台 QwQ-32B API 接口服务上线,免费提供 100 万 Tokens

国家超算互联网平台昨日晚宣布本周上线阿里巴巴开源推理模型 QwQ-32B API 接口服务,用户可获得免费 100 万 Tokens

国家超算互联网平台 QwQ-32B API 接口服务上线,免费提供 100 万 Tokens

QwQ-32B 是阿里 Qwen 团队最新发布的推理模型,基于 Qwen2.5-32B + 强化学习构建。据官方公示的基准评测结果,在测试数学能力的 AIME24 评测集上,以及评估代码能力的 LiveCodeBench 中,QwQ-32B 表现与 DeepSeek-R1 相当,胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。

据介绍,超算互联网第一时间完成 QwQ-32B 全面适配,包括基于 vLLM、PyTorch 的推理适配,平台同步上线 QwQ-32B 模型镜像、模型文件,用户无需下载本地,可一键启动 Notebook 功能,在平台开发 QwQ-32B 模型,或引入专有数据进一步私有化部署。

目前,超算互联网除提供 QwQ-32B 模型 API 接口服务外,近期还上线有 DeepSeek-R1 全家桶、最高 671B 满血版的 API 部署与 AI Web 应用服务。IT之家附国家超算互联网平台 QwQ-32B API 调用服务步骤如下:

  • 用户在超算互联网商城首页中搜索 QwQ-32B,点击“QwQ-32B 接口服务”商品,购买完成后,点击“去使用”。

  • 进入 API 接口信息页面:点击“去使用”后会进入 API 接口信息页面。

  • 按需选择访问形式,有三种访问形式可选:使用 Postman、Apifox 等 http 工具访问;使用 python 代码访问;以及在终端页面直接访问。

目前超算互联网已连接国内 14 个省的 20 多家超算和智算中心。目前平台上已有各类算力商品超 6500 款,其中 AI 模型服务近 240 款,既有 DeepSeek、Qwen 等国内开源模型,也有 Llama、Stable Diffusion、Gemma 等国外 AI 开源模型。

免责声明:文章内容来自IT之家

本站不对其内容的真实性、完整性、准确性给予任何担保、明示、暗示和承诺,本文仅供读者参考!

数码迷尊重原作者的辛勤劳动并致力于保护原著版权以及相关的知识产权,所转载的文章,其版权归原作者所有。

如本文内容影响到您的合法权益(内容、图片等),请通过邮箱5937331#qq.com联系我们,我们将第一时间回复处理。

(0)
上一篇 2025年3月9日 下午6:23
下一篇 2025年3月9日 下午6:23

相关推荐