Qwen3.6-FlashQwen3.6-Flash是阿里巴巴通义千问团队推出的轻量高效版大模型。 它的核心定位非常明确:在保持极高推理速度的同时,提供超越同尺寸模型的智能体编程与多模态能力。它是 Qwen3.6 系列中主打...AI最新项目3周前0340
HyperFrames – HeyGen开源的面向AI智能体视频渲染框架HyperFrames是由AI视频平台HeyGen在2026年4月开源的一个面向AI智能体(AI Agent)的视频渲染框架。 它的核心理念非常颠覆:“写HTML就能做视频”。 简单来说,它让开发者...AI最新项目3周前0340
Qwen3.6-Max-Preview – 阿里通义千问系列当前最强旗舰预览版Qwen3.6-Max-Preview(2026年4月20日发布)是阿里通义千问系列当前最强旗舰预览版,定位企业级与开发者高要求场景,在智能体编程、世界知识、指令遵循三大核心能力上全面超越Qwen3...AI最新项目3周前0350
LingBot-Map – 蚂蚁灵波科技开源的一款流式三维重建模型LingBot-Map是由蚂蚁灵波科技正式开源的一款流式三维重建模型。 它被誉为机器人领域的“白眼”(源自《火影忍者》中的瞳术,意指360度无死角的视觉感知),其核心突破在于仅使用一颗普通RGB摄像头...AI最新项目3周前0240
Qwen3.6-35B-A3B – 阿里通义千问开源混合专家(MoE)模型Qwen3.6-35B-A3B是阿里巴巴通义千问团队于2026年4月16日正式开源的一款高性能混合专家(MoE)模型。 作为Qwen3.6系列的首个开源权重版本,它凭借“350 亿总参数、仅30亿激活...AI最新项目3周前0440
Audio Flamingo Next – 深度解析NVIDIA开源的AF-Next架构与能力Audio Flamingo Next (AF-Next) 是由 NVIDIA(英伟达)与马里兰大学研究团队在2026年4月联合发布的最新开源大型音频语言模型(LALM)。 它是Audio Flami...AI最新项目3周前0280
Qwen2.5-VL – 通义千问团队发布的旗舰级视觉语言模型Qwen2.5-VL 是阿里巴巴通义千问团队发布的旗舰级视觉语言模型(Vision-Language Model),它在多模态理解、精确目标定位、文档解析和长视频理解等方面实现了显著的技术飞跃。 核心...AI最新项目3周前0310
Qwen3.5-Omni – 千问发布的端到端原生全模态大模型Qwen3.5-Omni是阿里巴巴通义千问正式发布的新一代端到端原生全模态大模型。 它打破了传统模型只能处理单一或特定组合模态的限制,实现了文本、图像、音频、视频四种模态的原生统一理解与生成,被誉为...AI最新项目3周前0340
ERNIE-Image – 百度文心大模型团队开源的一款文生图模型ERNIE-Image是由百度文心大模型团队开发并正式开源的一款高性能文生图模型。它凭借出色的中文理解能力和高效的架构设计,在开源后迅速获得了广泛关注。 ERNIE-Image亮点与性能 在Super...AI最新项目3周前0300
Marble 1.1 – 李飞飞World Labs公司推出3D世界生成模型系列Marble 1.1是由“AI教母”李飞飞创立的World Labs公司于2026年4月最新推出的3D世界生成模型系列。 它是业界首款商用世界模型Marble的升级版,核心突破在于能够仅凭一张图片,在...AI最新项目3周前0290
MAI-Image-2-Efficient – 微软推出的一款文生图模型MAI-Image-2-Efficient是微软正式推出的一款低成本、高效率的文生图模型。它是微软旗舰模型 MAI-Image-2 的“轻量化”版本,专为大规模商业量产和严格成本控制的场景设计,旨在以...AI最新项目3周前0350
混元3D世界模型 2.0 – 腾讯混元3D世界模型2.0发布腾讯混元团队正式发布并开源了混元3D世界模型 2.0 (HY-World 2.0)。这是一个多模态大模型,能够根据文字、图片、视频等输入,自动生成、重建和模拟可交互的3D世界。 它的核心突破在于,不再...AI最新项目3周前0230
Sora 2 – OpenAI发布的新一代视频生成模型Sora 2是由OpenAI发布的新一代视频生成模型。它被官方誉为“视频领域的GPT-3.5时刻”,标志着AI视频生成技术从简单的“视频生成器”进化为能够模拟物理世界的“世界模拟器”。 Sora 2不...AI最新项目4周前0510
LPM 1.0 – 米哈游蔡浩宇旗下Anuttacon发布的首个视频大模型LPM 1.0 是由米哈游创始人蔡浩宇旗下的AI公司Anuttacon发布的首个视频大模型,全称为Large Performance Model(大型表演模型)。 它的核心突破在于,不再仅仅是生成一段...AI最新项目4周前0300
MiniMax Music 2.6 – MiniMax发布了新一代AI音乐生成模型MiniMax发布了其新一代AI音乐生成模型——Music 2.6. 这次更新被官方称为“全维度进化”,核心解决的是以往 AI 音乐“机械感强”、“不可控”和“生成慢”的三大痛点。简单来说,现在的Mu...AI最新项目4周前0370
FIPO – 阿里巴巴通义最新发布的大模型强化学习算法FIPO是阿里巴巴通义实验室(Qwen Team)最新发布的大模型强化学习算法。 它的全称是Future-KL Influenced Policy Optimization(未来KL散度影响策略优化...AI最新项目4周前0330
QBotClaw – 腾讯发布的国内首个浏览器AI智能体QBotClaw(中文名:龙虾)是腾讯于正式发布的国内首个浏览器AI智能体(Agent)。 它不是传统意义上的浏览器插件,而是深度集成在QQ浏览器中的智能助手。它的核心突破在于将浏览器从一个“被动展示...AI最新项目4周前0340
GO-2 – 智元机器人发布的新一代具身智能基座大模型GO-2(全称 Genie Operator-2)是智元机器人(Agibot)发布的新一代具身智能基座大模型。 简单来说,它是机器人的“超级大脑”,旨在解决机器人“脑子懂了但手没跟上”的难题,让机器人...AI最新项目4周前0460
Seeduplex – 字节跳动发布的原生全双工语音大模型Seeduplex是字节跳动Seed团队2026年4月9日发布的原生全双工语音大模型,已全量上线豆包、抖音App。它突破传统半双工“回合制问答”限制,实现“边听边说”的实时自然交互。通过语音语义联合建...AI最新项目1个月前0440
小米XLA大模型 – 小米智能驾驶领域研发的一款端到端认知大模型小米XLA大模型是小米集团专为智能驾驶领域研发的一款端到端认知大模型,是其HAD(Hyper Autonomous Driving,小米超级智能驾驶)系统的核心技术升级。 它的核心突破在于首次将“辅助...AI最新项目1个月前0300
VoxCPM2 – OpenBMB团队开源的一款语音生成基座模型VoxCPM2 是由面壁智能(OpenBMB)团队开源的一款新一代语音生成基座模型。 如果说上一代 VoxCPM(0.5B)是以“小钢炮”著称的轻量化模型,那么 VoxCPM2 则是全面进化的“全能型...AI最新项目1个月前0380
OpenHarness – 港大开源的一款轻量级AI智能体驾驭框架OpenHarness是由香港大学数据科学研究院(HKUDS)于2026年4月开源的一款轻量级AI智能体驾驭框架(Agent Harness)。 它的核心理念是“模型即智能体,代码即驾驭框架”,旨在为...AI最新项目1个月前0500
Wan2.7-Video – 阿里巴巴发布的一款视频生成系列模型Wan2.7-Video 是阿里巴巴发布的一款视频生成系列模型。它的核心特点是拥有全面的创作控制力,将 AI 的能力从单一的素材生成扩展至“生成、编辑、复刻、重塑”等创作全链路,实现了从被动“演绎”到...AI最新项目1个月前0420
MAI-Transcribe-1 – 微软最新推出的语音转文字模型MAI-Transcribe-1是微软最新推出的一款语音转文字模型。它是微软为了减少对外部供应商(如OpenAI)的依赖,由内部团队自主研发的三款基础AI模型之一。 这款模型主打“全球最高精度”和“高...AI最新项目1个月前0360
GLM-5V-Turbo – 智谱AI发布的首个原生多模态Coding基座模型GLM-5V-Turbo 是智谱AI于2026年4月2日发布的首个原生多模态 Coding 基座模型。 简单来说,它的核心突破在于“视觉原生”——它不仅能写代码,还能“看懂”设计稿、截图、网页甚至视频...AI最新项目1个月前0460
Qwen3.6-Plus – 详解阿里最强国产编程大模型Qwen3.6-Plus是阿里巴巴于2026年4月2日发布的新一代大语言模型,也是千问3.6系列的首款产品。它被官方定位为目前国产编程能力最强的模型,整体性能相较于上一代有显著跃升。 简单来说,Qwe...AI最新项目1个月前0420
Xiaomi MiMo-Embodied – 小米自主研发的一款具身开源大模型Xiaomi MiMo-Embodied是由小米公司自主研发的一款具身大模型(Embodied AI Model),于2025年11月21日正式发布并全面开源。 它是业界首个成功打通自动驾驶与具身智能...AI最新项目1个月前0470
SenseAudio – 商汤科技推出的一款AI语音开放平台SenseAudio是商汤科技(SenseTime)推出的一款AI语音开放平台。 简单来说,它不仅是一个能帮你“配音”的工具,更是一个集成了语音克隆、音频编辑甚至AI视频创作的全能音频工作站。它最大的...AI最新项目1个月前0500
混元Turbo S – 腾讯推出的一款旗舰级“快思考”大模型混元Turbo S是腾讯推出的一款旗舰级“快思考”大模型,也是混元家族中主打“速度”与“性价比”的核心主力。 简单来说,如果把大模型比作人脑,混元T1是负责深思熟虑的“慢思考”系统,而混元Turbo ...AI最新项目1个月前0470
腾讯混元大模型介绍腾讯混元大模型(Tencent Hunyuan)是腾讯公司全链路自研的通用人工智能大模型系列,于2023年9月正式发布。它不仅是腾讯AI战略的核心,也通过腾讯云向企业提供服务,并深度集成在腾讯会议、腾...AI最新项目1个月前0630