推理
-
DeepSeek 团队新作:把代码变成思维链,大模型推理各种能力全面提升
用代码训练大模型思考,其他方面的推理能力也能提升。 DeepSeek 团队最新研究,利用 300 多万个实例,将代码转换成思考过程,构建出数据集 CODEI/O,对 Qwen、Ll…
-
DeepSeek R1 遇难题 142 次 "I give up",研究还称需增加推理时机控制机制
最新大语言模型推理测试引众议,DeepSeek R1 常常在提供错误答案前就“我放弃”了?? Cursor 刚刚参与了一项研究,他们基于 NPR 周日谜题挑战(The Sunday…
-
OpenAI 升级 o3-mini 模型思维链,提高 AI 推理透明度
OpenAI 公司今天(2 月 7 日)在 X 平台发布推文,宣布面向免费和付费用户更新 o3-mini 的思维链,并为付费用户更新 o3-mini-high 的思维链,更透明、更…
-
阿尔特曼暗示 OpenAI 明日发布 o3,新一代 AI 推理王者模型
OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altman)今天(12 月 20 日)在 X 平台发布推文,暗示将发布新一代推理 AI 模型 o3。 阿尔特曼在推文中写到“h…