文明旁观者的头像

文明旁观者

帅气的我简直无法用语言描述!
DiffusionGemma – 谷歌发布的实验性开源文本扩散模型

DiffusionGemma – 谷歌发布的实验性开源文本扩散模型

DiffusionGemma是谷歌发布的实验性开源文本扩散模型,基于Gemma 4架构构建,通过并行生成机制将本地推理速度提升至传统自回归模型的4倍。 它并非替代标准Gemma 4的生产模型,而是专为...
文明旁观者的头像2周前
0340
HiDream-O1-Image-1.5 – 智象未来推出的商用版图像生成模型

HiDream-O1-Image-1.5 – 智象未来推出的商用版图像生成模型

HiDream-O1-Image-1.5智象未来推出的商用版图像生成模型,在Artificial Analysis全球文生图榜单中评分1265ELO,位列中国第一、全球第二(仅次于OpenAI),采用...
文明旁观者的头像2周前
0380
MiMo-V2.5-ASR – 小米开源的语音识别模型

MiMo-V2.5-ASR – 小米开源的语音识别模型

MiMo-V2.5-ASR是小米开源的语音识别模型,作为全链路语音交互系统的听觉基座,复杂真实场景下的高鲁棒性语音转写。它无需预设语种标签即可精准处理中英混说、方言交织、强噪音干扰等环境,在多人会议...
文明旁观者的头像2周前
0390
MiMoCode V0.1.0 – 小米开源的终端原生AI编程助手

MiMoCode V0.1.0 – 小米开源的终端原生AI编程助手

MiMoCode V0.1.0是小米开源的终端原生AI编程助手,专为解决长周期编程任务中的信息丢失问题而设计,其核心突破在于通过独立Agent架构实现“越用越懂项目”的持续记忆能力,而非仅依赖模型自身...
文明旁观者的头像2周前
0390
Claude Opus 4.7 – Anthropic推出的旗舰级大语言模型

Claude Opus 4.7 – Anthropic推出的旗舰级大语言模型

Claude Opus 4.7是Anthropic推出的旗舰级大语言模型,作为当时公开可用的最强代码与多模态模型,将AI从“对话助手”升级为“可自主执行复杂任务的智能体”。Claude Opus 4...
文明旁观者的头像2周前
0300
MusaCoder – 摩尔线程推出的国产GPU全栈训练的代码大模型

MusaCoder – 摩尔线程推出的国产GPU全栈训练的代码大模型

MusaCoder是摩尔线程推出的全球首个基于国产全功能GPU全栈训练的代码大模型,专为自动生成高性能GPU底层算子(CUDA/MUSA原生Kernel代码) 而设计,其完整训练与验证流程均在国产MT...
文明旁观者的头像2周前
0330
North Mini Code – Cohere公司推出的开源智能体编程大模型

North Mini Code – Cohere公司推出的开源智能体编程大模型

North Mini Code是Cohere公司推出的开源智能体编程大模型,核心定位为高吞吐、低延迟的代码智能体底座,采用30B总参数量但仅激活3B参数的稀疏混合专家(MoE)架构,专为本地化部署与企...
文明旁观者的头像2周前
0270
Khala – 中央音乐学院与清华大学联合研发的音乐生成大模型

Khala – 中央音乐学院与清华大学联合研发的音乐生成大模型

Khala是中央音乐学院与清华大学联合研发的统一声学Token空间音乐生成大模型,解决AI音乐生成中结构连贯性与音质保真度的矛盾,通过构建跨模态对齐的声学表征体系,实现从深层音乐语义到高质量音频的端到...
文明旁观者的头像2周前
0340
Gemini 3.5 Live Translate – 谷歌发布的实时语音互译音频模型

Gemini 3.5 Live Translate – 谷歌发布的实时语音互译音频模型

Gemini 3.5 Live Translate是谷歌发布的实时语音互译音频模型,通过流式处理实现仅数秒延迟的连续语音翻译,同时保留说话者的原始语调、语速和情感特征,使跨语言对话接近真人同传体验。 ...
文明旁观者的头像2周前
0370
MiMo-V2.5-Pro-UltraSpeed – 小米推出的超高速推理模式

MiMo-V2.5-Pro-UltraSpeed – 小米推出的超高速推理模式

Xiaomi MiMo-V2.5-Pro-UltraSpeed是小米与TileRT团队联合推出的MiMo-V2.5-Pro模型的超高速推理模式,首次在通用GPU上实现万亿参数模型1000tokens...
文明旁观者的头像2天前
0380