Hy3 preview – 腾讯混元正式发布并开源的新一代语言模型Hy3 preview是腾讯混元(Hunyuan)团队正式发布并开源的一款新一代语言模型。 在经历底层基础设施“重建”后推出的首个成果,也是腾讯首席AI科学家姚顺雨(ReAct框架提出者)加盟后主导的...AI最新项目2周前0400
VoxCPM2 – OpenBMB团队开源的一款语音生成基座模型VoxCPM2 是由面壁智能(OpenBMB)团队开源的一款新一代语音生成基座模型。 如果说上一代 VoxCPM(0.5B)是以“小钢炮”著称的轻量化模型,那么 VoxCPM2 则是全面进化的“全能型...AI最新项目1个月前0380
StepAudio 2.5 ASR – 阶跃星辰发布的新一代自动语音识别模型StepAudio 2.5 ASR是阶跃星辰正式发布的新一代自动语音识别模型。该模型的核心突破在于率先将大语言模型的推理加速技术引入语音识别领域,通过架构创新,在大幅提升转写精度的同时,实现了推理速度...AI最新项目2周前0370
MiniMax Music 2.6 – MiniMax发布了新一代AI音乐生成模型MiniMax发布了其新一代AI音乐生成模型——Music 2.6. 这次更新被官方称为“全维度进化”,核心解决的是以往 AI 音乐“机械感强”、“不可控”和“生成慢”的三大痛点。简单来说,现在的Mu...AI最新项目4周前0370
MAI-Transcribe-1 – 微软最新推出的语音转文字模型MAI-Transcribe-1是微软最新推出的一款语音转文字模型。它是微软为了减少对外部供应商(如OpenAI)的依赖,由内部团队自主研发的三款基础AI模型之一。 这款模型主打“全球最高精度”和“高...AI最新项目1个月前0360
PrismAudio – 阿里通义实验室推出的AI视频环境音生成框架PrismAudio是阿里通义实验室推出的AI视频环境音生成框架,可根据画面自动生成逼真环境音效与动作音。它采用分解式思维链分析画面内容与发声时机,结合四维强化学习实现声画精准同步,兼顾语义匹配、时序...AI最新项目2个月前0360
Qwen3.6-Max-Preview – 阿里通义千问系列当前最强旗舰预览版Qwen3.6-Max-Preview(2026年4月20日发布)是阿里通义千问系列当前最强旗舰预览版,定位企业级与开发者高要求场景,在智能体编程、世界知识、指令遵循三大核心能力上全面超越Qwen3...AI最新项目3周前0350
MAI-Image-2-Efficient – 微软推出的一款文生图模型MAI-Image-2-Efficient是微软正式推出的一款低成本、高效率的文生图模型。它是微软旗舰模型 MAI-Image-2 的“轻量化”版本,专为大规模商业量产和严格成本控制的场景设计,旨在以...AI最新项目3周前0350
小米大模型miloco介绍小米的Xiaomi Miloco(全称Xiaomi Local Copilot,小米本地协同智能助手)是小米发布的一项智能家居未来探索方案。 简单来说,它不是单一的一款硬件,而是一套基于大模型驱动的全...AI最新项目1个月前0350
DeepSeek-V4 – 深度求索正式发布的新一代大模型系列预览版DeepSeek-V4是深度求索(DeepSeek)正式发布的新一代大模型系列预览版,标志着国产大模型在性能、成本和自主可控生态上迈出了关键一步。它并非单一模型,而是包含两个版本,并以其百万级上下文...AI最新项目2周前0340
Qwen3.6-FlashQwen3.6-Flash是阿里巴巴通义千问团队推出的轻量高效版大模型。 它的核心定位非常明确:在保持极高推理速度的同时,提供超越同尺寸模型的智能体编程与多模态能力。它是 Qwen3.6 系列中主打...AI最新项目3周前0340
HyperFrames – HeyGen开源的面向AI智能体视频渲染框架HyperFrames是由AI视频平台HeyGen在2026年4月开源的一个面向AI智能体(AI Agent)的视频渲染框架。 它的核心理念非常颠覆:“写HTML就能做视频”。 简单来说,它让开发者...AI最新项目3周前0340
Qwen3.5-Omni – 千问发布的端到端原生全模态大模型Qwen3.5-Omni是阿里巴巴通义千问正式发布的新一代端到端原生全模态大模型。 它打破了传统模型只能处理单一或特定组合模态的限制,实现了文本、图像、音频、视频四种模态的原生统一理解与生成,被誉为...AI最新项目3周前0340
QBotClaw – 腾讯发布的国内首个浏览器AI智能体QBotClaw(中文名:龙虾)是腾讯于正式发布的国内首个浏览器AI智能体(Agent)。 它不是传统意义上的浏览器插件,而是深度集成在QQ浏览器中的智能助手。它的核心突破在于将浏览器从一个“被动展示...AI最新项目4周前0340
MiMo-V2.5-Pro – 小米正式全球开源的旗舰级大语言模型MiMo-V2.5-Pro小米正式全球开源的旗舰级大语言模型。作为小米迄今为止最强大的AI模型,它专为处理复杂长程任务(Agent)和高难度代码生成而设计,在多项权威评测中表现优异,性能已比肩全球顶尖...AI最新项目2周前0330
FIPO – 阿里巴巴通义最新发布的大模型强化学习算法FIPO是阿里巴巴通义实验室(Qwen Team)最新发布的大模型强化学习算法。 它的全称是Future-KL Influenced Policy Optimization(未来KL散度影响策略优化...AI最新项目4周前0330
Qwen2.5-VL – 通义千问团队发布的旗舰级视觉语言模型Qwen2.5-VL 是阿里巴巴通义千问团队发布的旗舰级视觉语言模型(Vision-Language Model),它在多模态理解、精确目标定位、文档解析和长视频理解等方面实现了显著的技术飞跃。 核心...AI最新项目3周前0310
AgentScope Tuner – 为智能体应用打造的一站式自动优化引擎AgentScope Tuner是阿里通义实验室推出的、专为智能体(Agent)应用打造的一站式自动优化引擎。 它的核心目标是解决Agent开发中“训练效果好,但上线效果差”的难题,通过一个统一的平台...AI最新项目2周前0300
ERNIE-Image – 百度文心大模型团队开源的一款文生图模型ERNIE-Image是由百度文心大模型团队开发并正式开源的一款高性能文生图模型。它凭借出色的中文理解能力和高效的架构设计,在开源后迅速获得了广泛关注。 ERNIE-Image亮点与性能 在Super...AI最新项目3周前0300
LPM 1.0 – 米哈游蔡浩宇旗下Anuttacon发布的首个视频大模型LPM 1.0 是由米哈游创始人蔡浩宇旗下的AI公司Anuttacon发布的首个视频大模型,全称为Large Performance Model(大型表演模型)。 它的核心突破在于,不再仅仅是生成一段...AI最新项目4周前0300
小米XLA大模型 – 小米智能驾驶领域研发的一款端到端认知大模型小米XLA大模型是小米集团专为智能驾驶领域研发的一款端到端认知大模型,是其HAD(Hyper Autonomous Driving,小米超级智能驾驶)系统的核心技术升级。 它的核心突破在于首次将“辅助...AI最新项目1个月前0300
Marble 1.1 – 李飞飞World Labs公司推出3D世界生成模型系列Marble 1.1是由“AI教母”李飞飞创立的World Labs公司于2026年4月最新推出的3D世界生成模型系列。 它是业界首款商用世界模型Marble的升级版,核心突破在于能够仅凭一张图片,在...AI最新项目3周前0290
GPT Image 2 – OpenAI推出的新一代AI图像生成模型GPT Image 2是OpenAI于2026年4月推出的新一代AI图像生成模型,它标志着AI生图从“去噪”走向“推理”的范式转移。该模型具备“思考”能力,能够进行复杂的推理和规划,在图像质量、文字渲...AI最新项目2周前0280
Audio Flamingo Next – 深度解析NVIDIA开源的AF-Next架构与能力Audio Flamingo Next (AF-Next) 是由 NVIDIA(英伟达)与马里兰大学研究团队在2026年4月联合发布的最新开源大型音频语言模型(LALM)。 它是Audio Flami...AI最新项目3周前0280
Hy-MT1.5-1.8B-1.25bit – 腾讯混元开源的轻量化的离线翻译模型Hy-MT1.5-1.8B-1.25bit是腾讯混元团队正式开源的一款极致轻量化的离线翻译模型。这款模型最大的亮点在于它通过先进的量化压缩技术,将原本需要数GB内存的翻译大模型压缩至440MB 左右...AI最新项目1周前0270
MiMo-V2.5 – 小米于正式开源的原生全模态大模型MiMo-V2.5是小米于正式开源的原生全模态大模型。与专注于复杂推理的Pro版本不同,MiMo-V2.5主打全能感知与高性价比,能够像人类一样同时“看、听、读”,并迅速做出反应。它被视为覆盖绝大多数...AI最新项目2周前0270
新HeiMaClaw – 黑马程序员推出的一款生产级企业AI Agent平台HeiMaClaw是由黑马程序员推出的一款生产级企业AI Agent平台。与面向个人用户的助手不同,HeiMaClaw的定位非常明确:它是一个企业级基础设施,旨在通过工程化手段(Harness Eng...AI最新项目6天前0260
Kimi K2.6 – 月之暗面发布的最新旗舰级人工智能模型Kimi K2.6是月之暗面(Moonshot AI)发布的最新旗月之暗面舰级人工智能模型,并已在发布时同步开源。它在代码编写、长程任务执行及智能体(Agent)集群能力上实现了全面升级,旨在对标GP...AI最新项目2周前0250
JVS Crew – 阿里云推出的企业级AI智能体构建与托管平台JVS Crew是阿里云推出的企业级AI智能体(Agent)构建与托管平台。它旨在帮助企业解决在落地AI应用时面临的安全、合规、成本和管理等一系列复杂挑战。 简单来说,JVS Crew为企业提供了一个...AI最新项目2周前0240
LingBot-Map – 蚂蚁灵波科技开源的一款流式三维重建模型LingBot-Map是由蚂蚁灵波科技正式开源的一款流式三维重建模型。 它被誉为机器人领域的“白眼”(源自《火影忍者》中的瞳术,意指360度无死角的视觉感知),其核心突破在于仅使用一颗普通RGB摄像头...AI最新项目3周前0240