文明旁观者的头像

文明旁观者

帅气的我简直无法用语言描述!
Ling-2.6-1T – 蚂蚁百灵开源的一款万亿参数级旗舰大模型

Ling-2.6-1T – 蚂蚁百灵开源的一款万亿参数级旗舰大模型

Ling-2.6-1T是蚂蚁集团百灵大模型团队开源的一款万亿参数级旗舰大模型。它最大的特点是不盲目追求“慢思考”式的长推理链,而是独创了“快思考”机制,旨在以极低的计算成本实现高效的复杂任务执行。其综...
文明旁观者的头像1周前
0190
FlashQLA – 通义千问团队开源的一个高性能线性注意力算子库

FlashQLA – 通义千问团队开源的一个高性能线性注意力算子库

FlashQLA是通义千问团队(Qwen Team)正式开源的一个高性能线性注意力算子库。简单来说,它是专门为提升大语言模型(特别是Qwen3.5、Qwen3.6及后续系列)在处理超长文本时的训练和推...
文明旁观者的头像1周前
0210
豆包帮我写作怎么用(豆包写作保姆级教程)

豆包帮我写作怎么用(豆包写作保姆级教程)

豆包的“帮我写作”功能非常强大,它不仅能从零开始写文章,还能帮你润色、扩写、缩写,甚至直接生成PPT。为了让你最快上手,我为你编写了一份保姆级的使用教程,涵盖了从基础写作到进阶玩法的全流程。 一、 快...
文明旁观者的头像1周前
0310
女子被AI误导闯入响尾蛇窝:回忆起还是心惊胆战

女子被AI误导闯入响尾蛇窝:回忆起还是心惊胆战

近日,美国科罗拉多州丹佛市一名华人杨女士,初到当地生活闲来无事,居家倍感无聊烦闷。为打发时间、出门散心,她特意借助AI查询了家周边合适的徒步路线,挑选了一处距离较近的步道独自前往漫步。 徒步结束平安归...
文明旁观者的头像1周前
0210
Hy-MT1.5-1.8B-1.25bit – 腾讯混元开源的轻量化的离线翻译模型

Hy-MT1.5-1.8B-1.25bit – 腾讯混元开源的轻量化的离线翻译模型

Hy-MT1.5-1.8B-1.25bit是腾讯混元团队正式开源的一款极致轻量化的离线翻译模型。这款模型最大的亮点在于它通过先进的量化压缩技术,将原本需要数GB内存的翻译大模型压缩至440MB 左右...
文明旁观者的头像1周前
0270
模型架构是什么意思

模型架构是什么意思

模型架构(Model Architecture)通俗来说,就是人工智能模型的“设计蓝图”或“骨架结构”。 它定义了模型内部的组织方式:数据如何输入、经过哪些处理层、层与层之间如何连接、以及最终如何输出...
文明旁观者的头像1周前
0290
混合滑动窗口注意力工作原理

混合滑动窗口注意力工作原理

混合滑动窗口注意力(Hybrid Sliding Window Attention, Hybrid SWA) 是一种旨在解决大语言模型(LLM)处理超长文本时计算成本过高问题的先进架构设计。 简单来说...
文明旁观者的头像1周前
0240
原生全模态大模型是什么

原生全模态大模型是什么

“原生全模态大模型”是当前人工智能领域最前沿的技术方向之一。简单来说,它标志着AI从“拼凑感官”进化到了“拥有统一大脑”。 1. 什么是“原生全模态”? 要理解“原生全模态”,我们需要把它拆解为两个部...
文明旁观者的头像2周前
0220
MiMo-V2.5 – 小米于正式开源的原生全模态大模型

MiMo-V2.5 – 小米于正式开源的原生全模态大模型

MiMo-V2.5是小米于正式开源的原生全模态大模型。与专注于复杂推理的Pro版本不同,MiMo-V2.5主打全能感知与高性价比,能够像人类一样同时“看、听、读”,并迅速做出反应。它被视为覆盖绝大多数...
文明旁观者的头像2周前
0270
MiMo-V2.5-Pro – 小米正式全球开源的旗舰级大语言模型

MiMo-V2.5-Pro – 小米正式全球开源的旗舰级大语言模型

MiMo-V2.5-Pro小米正式全球开源的旗舰级大语言模型。作为小米迄今为止最强大的AI模型,它专为处理复杂长程任务(Agent)和高难度代码生成而设计,在多项权威评测中表现优异,性能已比肩全球顶尖...
文明旁观者的头像2周前
0330