腾讯混元自研深度思考模型 T1 发布:吐字快、能秒回,擅长超长文处理

腾讯混元自研深度思考模型 T1 发布:吐字快、能秒回,擅长超长文处理

作者: 发表时间:2025-12-12 11:40:29
株洲市残联app 阳泉市铁路管理app 淄博市第五高中app 嘉峪关市农业局app 百色市市场监督app 呼和浩特市暴雨监控中心app 连云港市公开信息app 韶关市电台广播中心app 防城港市社会求助app 南宁市警务app 承德市暴雨监控中心app 衡水市第二中学app 嘉兴市招标信息app 南京市第四小学app 张家口市台风监控中心app 汕头市防火app 肇庆市中心校app 海口市财政信息app 宜春市台风监控中心app 德州市最新新闻app 承德市第二高中app 钦州市工商局app 松原市论坛app 玉林市司法管理app 莆田市第六中学app 烟台市天气监控中心app 渭南市招标信息app 丹凤县第六中学app 武宁县住房保障app 稷山县粮食管理app 宜兰县公开信息app 易门县电台广播中心app 仙居县政要信息app 浚县专题专栏app 夏津县公益app 冕宁县消防局app 勃利县社会求助app 呼图壁县环境保护协会app 成县第五高中app 岳普湖县热点专题app 合浦县税务局app 抚松县公路管理app 石台县残联救助app 香河县景县第四中学app 德保县劳动局app 大田县水利app 当涂县审计公开app 前郭尔罗斯蒙古族自治县政要信息app

本站 3 月 21 日消息,本站从腾讯混元微信公众号获悉,今日腾讯混元正式推出自研深度思考模型混元 T1 正式版。

据官方介绍,「T1」吐字快、能秒回,还擅长超长文处理,是腾讯自研的强推理模型。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元 T1 正式版进一步提升了推理能力。

在体现推理模型基础能力的常见 benchmark 上,如大语言模型评估增强数据集 MMLU-PRO 中,混元 T1 取得 87.2 分,仅次于 o1。在 CEval、AIME、Zebra Logic 等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元 T1 的成绩也达到业界领先推理模型的水平。

「T1」还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

注:表格中,其它模型的评测指标来自官方评测结果,官方评测结果中没有的部分来自混元内部评测平台结果

官方称,混元 T1 正式版沿用了混元 Turbo S 的创新架构,采用 Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合 Mamba 架构无损应用于超大型推理模型。这一架构有效降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 的内存占用,从而显著降低了训练和推理成本。

官方还称,混元 T1 在超长文本推理领域也展现出独特优势。基于出色的长文捕捉能力,混元 T1 能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合 Mamba 架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗,在相近的激活参数量下,实现了解码速度提升 2 倍。

腾讯混元 T1 目前已经上线:https://llm.hunyuan.tencent.com/#/chat/ hy-t1

API 使用方面,混元 T1 已在腾讯云官网上线,输入价格为每百万 tokens 1 元,输出价格为每百万 tokens 4 元。

相关文章