推理-数码迷

AI

用代码训练大模型思考，其他方面的推理能力也能提升。 DeepSeek 团队最新研究，利用 300 多万个实例，将代码转换成思考过程，构建出数据集 CODEI/O，对 Qwen、Ll…

2025年2月18日

AI

最新大语言模型推理测试引众议，DeepSeek R1 常常在提供错误答案前就“我放弃”了？？ Cursor 刚刚参与了一项研究，他们基于 NPR 周日谜题挑战（The Sunday…

2025年2月15日

AI

OpenAI 公司今天（2 月 7 日）在 X 平台发布推文，宣布面向免费和付费用户更新 o3-mini 的思维链，并为付费用户更新 o3-mini-high 的思维链，更透明、更…

2025年2月7日

AI

OpenAI 公司首席执行官山姆・阿尔特曼（Sam Altman）今天（12 月 20 日）在 X 平台发布推文，暗示将发布新一代推理 AI 模型 o3。阿尔特曼在推文中写到“h…

2024年12月20日