百川智能今日宣布推出全场景深度思考模型 Baichuan-M1-preview,聚齐三大核心推理能力。同时,百川智能还推出了行业首个开源医疗增强大模型 Baichuan-M1-14B。
据官方介绍,Baichuan-M1-preview 同时具备语言、视觉和搜索三大领域推理能力,在数学、代码等多个权威评测中的表现可对标 o1-preview。
IT之家注意到,它还解锁了“医疗循证模式”,实现了从证据检索到深度推理的完整端到端服务,能够快速、精准地回答医疗临床、科研问题。
Baichuan-M1-14B 则是 Baichuan-M1-preview 的小尺寸版本,同时也是行业首个开源的医疗增强大模型。据介绍,其医疗能力超越了更大参数量的 Qwen2.5-72B,与 o1-mini 相差无几。
-
Github:https:https//github.com/baichuan-inc/Baichuan-M1-14B
-
Huggingface(base):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base
-
Huggingface(Instruct):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct
-
NPU 版本支持 BF16 推理:https://modelers.cn/models/MindIE/Baichuan-M1-14B-Base
语言推理方面,其在 AIME 和 Math 等数学基准测试,以及 LiveCodeBench 代码任务上的成绩均超越了 o1-preview 等模型。
视觉推理能力方面,在 MMMU-val、MathVista 等权威评测中的成绩,超越了 GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview 等模型。
免责声明:文章内容来自IT之家
本站不对其内容的真实性、完整性、准确性给予任何担保、明示、暗示和承诺,本文仅供读者参考!
数码迷尊重原作者的辛勤劳动并致力于保护原著版权以及相关的知识产权,所转载的文章,其版权归原作者所有。
如本文内容影响到您的合法权益(内容、图片等),请通过邮箱5937331#qq.com联系我们,我们将第一时间回复处理。