中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。
该模型采用强化学习训练方法,结合探索和反思范式,显著提升了逻辑推理和数学推导的准确性。
在多项权威评测中,TeleAI-t1-preview表现优异,例如在美国数学竞赛AIME2024和MATH500测试中,分别获得60分和93.8分,大幅超越OpenAI的o1-preview和GPT-4o等标杆模型。
在研究生级别问答测试GPQA Diamond中,其得分也超过了GPT-4o,并与Claude3.5 Sonnet的性能相当。
TeleAI-t1-preview能够处理复杂的古文数学题,如《九章算术》中的题目。它先将文言文进行理解和简化,转换成现代汉语,再进行数学推导并给出答案。
这一过程展示了其在形象思维与抽象思维结合方面的能力,以及对古今单位换算的严谨处理。
TeleAI-t1-preview的发布标志着中国电信在人工智能领域的重大突破,为复杂推理任务提供了新的解决方案。
免责声明:文章内容来自快科技
本站不对其内容的真实性、完整性、准确性给予任何担保、明示、暗示和承诺,本文仅供读者参考!
数码迷尊重原作者的辛勤劳动并致力于保护原著版权以及相关的知识产权,所转载的文章,其版权归原作者所有。
如本文内容影响到您的合法权益(内容、图片等),请通过邮箱5937331#qq.com联系我们,我们将第一时间回复处理。