Ling-2.6-1T – 蚂蚁百灵开源的一款万亿参数级旗舰大模型
Ling-2.6-1T是蚂蚁集团百灵大模型团队开源的一款万亿参数级旗舰大模型。它最大的特点是不盲目追求“慢思考”式的长推理链,而是独创了“快思考”机制,旨在以极低的计算成本实现高效的复杂任务执行。其综...
FlashQLA – 通义千问团队开源的一个高性能线性注意力算子库
FlashQLA是通义千问团队(Qwen Team)正式开源的一个高性能线性注意力算子库。简单来说,它是专门为提升大语言模型(特别是Qwen3.5、Qwen3.6及后续系列)在处理超长文本时的训练和推...
豆包帮我写作怎么用(豆包写作保姆级教程)
豆包的“帮我写作”功能非常强大,它不仅能从零开始写文章,还能帮你润色、扩写、缩写,甚至直接生成PPT。为了让你最快上手,我为你编写了一份保姆级的使用教程,涵盖了从基础写作到进阶玩法的全流程。 一、 快...
女子被AI误导闯入响尾蛇窝:回忆起还是心惊胆战
近日,美国科罗拉多州丹佛市一名华人杨女士,初到当地生活闲来无事,居家倍感无聊烦闷。为打发时间、出门散心,她特意借助AI查询了家周边合适的徒步路线,挑选了一处距离较近的步道独自前往漫步。 徒步结束平安归...
Hy-MT1.5-1.8B-1.25bit – 腾讯混元开源的轻量化的离线翻译模型
Hy-MT1.5-1.8B-1.25bit是腾讯混元团队正式开源的一款极致轻量化的离线翻译模型。这款模型最大的亮点在于它通过先进的量化压缩技术,将原本需要数GB内存的翻译大模型压缩至440MB 左右...
模型架构是什么意思
模型架构(Model Architecture)通俗来说,就是人工智能模型的“设计蓝图”或“骨架结构”。 它定义了模型内部的组织方式:数据如何输入、经过哪些处理层、层与层之间如何连接、以及最终如何输出...
混合滑动窗口注意力工作原理
混合滑动窗口注意力(Hybrid Sliding Window Attention, Hybrid SWA) 是一种旨在解决大语言模型(LLM)处理超长文本时计算成本过高问题的先进架构设计。 简单来说...
原生全模态大模型是什么
“原生全模态大模型”是当前人工智能领域最前沿的技术方向之一。简单来说,它标志着AI从“拼凑感官”进化到了“拥有统一大脑”。 1. 什么是“原生全模态”? 要理解“原生全模态”,我们需要把它拆解为两个部...
MiMo-V2.5 – 小米于正式开源的原生全模态大模型
MiMo-V2.5是小米于正式开源的原生全模态大模型。与专注于复杂推理的Pro版本不同,MiMo-V2.5主打全能感知与高性价比,能够像人类一样同时“看、听、读”,并迅速做出反应。它被视为覆盖绝大多数...
MiMo-V2.5-Pro – 小米正式全球开源的旗舰级大语言模型
MiMo-V2.5-Pro小米正式全球开源的旗舰级大语言模型。作为小米迄今为止最强大的AI模型,它专为处理复杂长程任务(Agent)和高难度代码生成而设计,在多项权威评测中表现优异,性能已比肩全球顶尖...









