大模型
-
国产 AI 大模型加速迭代,厂商迈向开源、集聚化
据央视新闻报道,在上海举行的 2025 全球开发者先锋大会上,多家厂商展示了自家在 AI 大模型方面的落地应用,涉及“可跟随使用者的抚摸和语言随机互动的 AI 仿生宠物”、“城市节…
-
装电脑、选手机 DeepSeek领衔 五款大模型谁更靠谱
近几年AI大模型迎来了快速的发展,呈现出了多元化和加速化的特点,相比于初期各大厂商主要聚焦于推出参数量更大、能力更强的通用大模型,以彰显自身的技术实力不同,随着市场竞争加剧和技术逐…
-
迅雷:用户下载AI大模型 提供免费加速服务
为满足广大AI开发者、数据科学家及研究人员对海量数据和前沿模型的迫切需求,迅雷出手了。 迅雷宣布,将针对下载AI大模型及数据集文件的迅雷用户,提供批量下载服务,这一功能解决了长期困…
-
什么叫模型蒸馏
原文标题:《模型蒸馏:让学霸老师带出学神学生》 目前大模型的应用场景已经落地到我们生活的方方面面,然而,随着应用场景的不断拓展,人们逐渐意识到大模型在运行效率和资源消耗方面存在一定…
-
豆包提出全新稀疏模型架构 UltraMem,推理成本较 MoE 最高可降 83%
豆包大模型团队今日宣布,字节跳动豆包大模型团队提出了全新的稀疏模型架构 UltraMem,该架构有效解决了 MoE 推理时高额的访存问题,推理速度较 MoE 架构提升 2-6 倍,…
-
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。 最新研究揭示: 在遇到高难度问题时,推理大模型可能像“三心二意的学生&rdquo…
-
中国电信发布“复杂推理大模型”TeleAI-t1-preview:能解《九章算术》题目
IT之家从中国电信人工智能研究院获悉,其“复杂推理大模型”TeleAI-t1-preview 现已正式发布,即将上线天翼 AI 开放平台。TeleAI-t1-preview 使用了…
-
超越国际标准!中国电信AI大模型发布:解决九章算术难题
中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。 该模型采用强化学习训练方法,结合探索和反思范式…
-
智谱发布电脑智能体大模型GLM-PC:回车即用 协助完成各类电脑任务
智谱科技近日宣布其最新研发的电脑智能体GLM-PC正式开放体验。 这款基于智谱多模态大模型CogAgent的智能体,是全球首个面向公众开放的电脑智能体,能够模拟人类的“…
-
豆包大模型1.5 Pro正式发布:比GPT-4o更强
今天,豆包大模型1.5 Pro版本正式发布。 目前,该大模型已在豆包APP灰度上线,开发者也可在火山引擎直接调用API。 字节跳动表示,豆包大模型1.5 Pro增强了综合能力,在知…