当本领圈还在争论AI霸主花落谁家时,好意思团开源的5600亿参数模子LongCat-Flash-Chat 以“外卖公司”的标签横空出世,却在GitHub热榜霸屏。它不仅跑赢Claude4、DeepSeek等标杆,更以单卡推理100+ tokens/s、老本0.7好意思元/百万token 的服从刷新行业通晓。本文将深远拆解其本领架构、实战线路及好意思团AI盘算推算,联结泰斗实测数据与独家细节,为您呈现完好意思图景。
1. 零计算内行(Zero-computation Experts)—— 智能路由的极致优化
传统MoE模子虽能扩容,但冗余计算严重。LongCat在内行池中镶嵌“恒等映射通说念”,路由器通过动态评分机制(内行偏置+PID限度器)及时判断任务复杂度:
对简便任务(如类似教导、基础问答),径直跳过计算层,数据原样复返;对复杂任务,激活圭臬内行进行深度推理。这一联想类似“高速ETC通说念”,让40%的简便申请免于计算职守。
中枢上风:
激活参数机动支援(18.6B~31.3B),蒙眬服从晋升40%;竖立级负载平衡亏本函数,幸免内行级分派失衡。2. 跨层活水线本领(Cross-layer Pipelining)—— 突破GPU堵点
工程师拆解GPU层级依赖,杀青“计算-通讯无缝尽力”:
上一层的FFN计算未休止时,下一层的参数通讯已提前发起;通过Shortcut-connectedMoE结构,将dispatch/combine操作与计算并行。实测数据:考研速率晋升30%,20T token预考研仅需30天,且集群可用率高达98.48%。
3. 限制化考研黑科技为加快管制,团队领受“超参数迁徙+模子滋长动手化”策略:
用小模子掂量最优超参数(如学习率、批大小);将14层模子堆叠成28层checkpoint,幸免冷启动;引入笃定性计算套件,确保考研褂讪性。二、硬核实测:数学、编程与逻辑的全面碾压1. 高考数学压轴题:空间映射法破解圆锥弧线濒临2025世界高考一卷压轴题(圆锥弧线专题),LongCat展示教科书级推导:
第一问:通过离心率界说式快速代换,锁定函数最大值(如图);
第二问:联结射线标的向量构反水证矛盾,精确求解未知变量;
第三问:动态拆解圆心轨迹,空间映射锁定极值(如图);
最终全题谜底正确,治安逻辑严实度卓越DeepSeek-V3.1。
2. 编程实战:从小球动画到生化轮回小球氛围编程测试:LongCat生成代码运行显露,动态服从忘形专科诱骗:
卡尔文轮回矢量图:代码结构严谨,适应显着,输出布局堪比教科书:
改编版“薛定谔死猫悖论”测试:
题目:一只死猫与辐照安设同处密闭盒中,一天后猫是否存活?
LongCat直击实质:“题目已声明动手情状为物化,辐照无法起死复活——故猫弗成能存活。”
对比其他模子(如o3)仍堕入量子态分析:
心情随同App「Wow」:2024年上线,联结生成式AI提供个性化交互;
AI绘图器具「妙刷」:撑握文生图与作风迁徙,落地创意场景;
编程助手CatPaw:里面渗入率68%,日均减少范例员2000+次类似事业;
oCode平台:撑握小白生成前端、数据分析器具,强化本领民主化。
3. 计谋升级:从外卖到“零卖+科技”CEO王兴明确三层AI计谋:
AIatWork:晋升10万职工服从(如智能会议、文档助手);AIinProducts:鼎新现存业务(如无东说念主车配送、餐饮保举);BuildingLLM:握续迭代LongCat等自研模子。好意思团本领申诉被评“中国最详确”,在建模与Infra细节上卓越Kimi、GLM等竞品。
四、生态拓展:开源社区与行业影响1. 开源引爆诱骗者圈
GitHub仓库首日Star破万,HuggingFace下载量单周超5万;诱骗者实测反应:“代码生成速率如好意思团外卖——送啥齐快!”2. 行业启示
“本领深水区的竞争,实质是场景落地的干戈。好意思团用外卖数据养出的AI基建,正在反哺大模子。”
——量子位中枢不雅察
当Claude4还在拼参数时,LongCat以“零计算内行”讲明:高效才是AI的曩昔。而好意思团的千亿棋局,才刚刚开局。
数据起原:好意思团本领申诉 | 量子位实测 | GitHub社区反应
本文由 @大栗 原创发布于东说念主东说念主齐是产物司理。未经作家许可,辞谢转载
题图来自Unsplash开云「中国」Kaiyun官网登录入口,基于CC0条约