MiMo-V2.5-Pro-UltraSpeed – 小米推出的超高速推理模式Xiaomi MiMo-V2.5-Pro-UltraSpeed是小米与TileRT团队联合推出的MiMo-V2.5-Pro模型的超高速推理模式,首次在通用GPU上实现万亿参数模型1000tokens...AI最新项目2天前0380
getdesign.md – VoltAgent团队推出的设计规范库getdesign.md 是一个免费开源的大厂设计规范库,把66+知名品牌(Apple、Stripe、Figma、Linear 等) 的设计系统,整理成一份份标准化的DESIGN.md文件,供AI编程...AI最新项目3周前0380
Meoo CLI – 阿里云Meoo(秒悟)推出的开源命令行工具Meoo CLI是阿里云Meoo(秒悟)推出的开源命令行工具,核心作用是打通本地AI编程项目与云端部署的断层,使开发者能通过自然语言指令将Claude Code、Codex、Cursor等本地AI生成...AI最新项目2周前0370
Gemini 3.5 Live Translate – 谷歌发布的实时语音互译音频模型Gemini 3.5 Live Translate是谷歌发布的实时语音互译音频模型,通过流式处理实现仅数秒延迟的连续语音翻译,同时保留说话者的原始语调、语速和情感特征,使跨语言对话接近真人同传体验。 ...AI最新项目2周前0370
Kairos-HomeWorld – 大晓机器人发布的全屋三维可交互世界模型Kairos-HomeWorld是大晓机器人联合香港中文大学多媒体实验室、深圳河套学院发布的全球首个全屋三维可交互世界模型,仅需一句文本指令即可生成结构连贯、物理合理且支持物体级交互的完整中国家庭3D...AI最新项目2周前0370
Mellum2 – JetBrains推出的开源混合专家(MoE)模型Mellum2是JetBrains推出的120亿参数开源混合专家(MoE)模型,专为软件工程场景设计,核心目标是通过超低延迟推理与私有化部署能力,解决企业级AI工作流中的实时性与成本瓶颈。 Mellu...AI最新项目3周前0370
SenseNova-U1-8B-MoT-Infographic – 商汤科技开源的多模态大模型SenseNova-U1-8B-MoT-Infographic是商汤科技开源的专项增强版多模态大模型,基于原生统一架构 SenseNova-U1-8B-MoT针对信息图(infographic)生成场...AI最新项目3周前0370
PilotDeck – 清华大学联合面壁智能开源智能体操作系统PilotDeck是由清华大学THUNLP实验室联合面壁智能、OpenBMB及AI9stars团队开源的智能体操作系统,核心价值在于通过独立工作舱架构、白盒化记忆管理及子代理级智能路由技术,显著降低A...AI最新项目4周前0370
GPT-Realtime-2 – OpenAI推出的旗舰级实时语音模型GPT-Realtime-2是OpenAI推出的旗舰级实时语音模型。它最大的突破在于,首次将GPT-5级别的推理能力 引入了语音交互领域,让AI语音助手从简单的“问答机器”进化为能处理复杂任务的“智能...AI最新项目2个月前0370
SwarmFlow – openJiuwen推出的多智能体可控协同框架SwarmFlow是华为支持的开源社区openJiuwen推出的多智能体可控协同框架,通过将确定性协作流程脚本化,解决传统多Agent系统因依赖Leader临场调度导致的流程不稳定、结果不可复现问题...AI最新项目2周前0360
WBench – 首个面向交互式视频世界模型的系统性多轮评测基准WBench是美团LongCat团队与复旦大学联合发布的首个面向交互式视频世界模型的系统性多轮评测基准,首次实现对世界模型在连续交互、多维度能力上的统一量化评估,而非仅关注单次生成的视频质量。当前研究...AI最新项目2周前0360
PaddleOCR-VL-1.6 – 百度发布的轻量化多模态文档解析模型PaddleOCR-VL-1.6是百度发布的轻量化多模态文档解析模型,在权威评测集OmniDocBench v1.6中以96.33%的综合准确率刷新全球SOTA记录,超越Gemini-3-Pro、GP...AI最新项目3周前0360
Seedance 2.0 Mini – 火山引擎推出的轻量化视频生成模型Seedance 2.0 Mini是字节跳动火山引擎推出的Seedance 2.0系列轻量级视频生成模型,主打高性价比路线,单秒生成成本降至0.5元(720P规格),较标准版Seedance 2.0降...AI最新项目1周前0350
VitaBench 2.0 – LongCat推出的新一代大模型智能体评测基准VitaBench 2.0是美团LongCat团队联合多所高校推出的新一代大模型智能体评测基准,专注于评估智能体在长期、多轮次真实生活场景交互中的综合能力。 与早期版本相比,将评测维度从单次任务扩展至...AI最新项目2周前0350
Polar – 英伟达开源的强化学习训练框架Polar是英伟达(NVIDIA)开源的强化学习训练框架,专为解决代码智能体(如Codex、Claude Code、Qwen Code等)接入强化学习时的高成本与信号丢失问题而设计。 其核心突破在于无...AI最新项目3周前0350
MAI-Image-2.5 – 微软发布的最新文本生成图像模型MAI-Image-2.5是微软发布的最新文本生成图像模型,在权威评测平台Arena的文生图排行榜中以1254分位列全球第三,仅次于OpenAI的gpt-image-2. 该模型重点强化了文字渲染能力...AI最新项目4周前0350
新Xiaomi Miloco 2.0 – 小米发布的全屋智能AI开源方案Xiaomi Miloco 2.0是小米于2026年6月18日发布的全屋智能AI开源方案,基于自研MiMo大模型构建,以Agent形式接入OpenClaw框架,实现“能记忆、会识人、懂执行”的本地离线...AI最新项目6天前0340
Hojo-ASR-V1 – Hojo开源的语音识别(ASR)模型Hojo-ASR-V1是初创团队Hojo开源的语音识别(ASR)模型,采用Whisper特征提取器+Conformer适配层+Qwen3-4B语言模型的混合架构,在LibriSpeech Clean等...AI最新项目2周前0340
DiffusionGemma – 谷歌发布的实验性开源文本扩散模型DiffusionGemma是谷歌发布的实验性开源文本扩散模型,基于Gemma 4架构构建,通过并行生成机制将本地推理速度提升至传统自回归模型的4倍。 它并非替代标准Gemma 4的生产模型,而是专为...AI最新项目2周前0340
Khala – 中央音乐学院与清华大学联合研发的音乐生成大模型Khala是中央音乐学院与清华大学联合研发的统一声学Token空间音乐生成大模型,解决AI音乐生成中结构连贯性与音质保真度的矛盾,通过构建跨模态对齐的声学表征体系,实现从深层音乐语义到高质量音频的端到...AI最新项目2周前0340
BigSet – TinyFish开源的多智能体协同网络抓工具BigSet是TinyFish团队开源的多智能体协同网络抓取与数据集构建工具,通过集成搜索、抓取、推理和验证的自动化流程,支持用户用自然语言指令实时生成结构化高质量数据集。将传统数据采集从手动操作升级...AI最新项目2周前0340
MAI-Voice-2 – 微软发布的新一代自研多语言语音合成模型MAI-Voice-2是微软发布的新一代自研多语言语音合成模型,支持15种以上语言的高自然度语音生成,并首次实现复杂情感语调模拟与短样本声音克隆能力。 其核心突破在于通过端到端神经声学建模,在保证超低...AI最新项目3周前0340
新LOGOS – 阿里开源的跨学科统一科学基座大模型阿里开源的LOGOS(Language Of Generative Objects in Science)是国内首个跨学科统一科学基座大模型,由阿里ATH-Token Foundry联合中国人民大学高...AI最新项目6天前0330
新ACE-Ego – 大晓机器人携手港中文推出一脑多型开源VLA模型ACE-Ego是大晓机器人联合香港中文大学多媒体实验室(CUHK MMLab)于2026年6月17日发布的开源“一脑多型”具身操作视觉语言动作(VLA)模型,通过“以人为中心”的预训练范式,首次实现单...AI最新项目7天前0330
新微信支付AI专属卡微信支付AI专属卡是用户在微信零钱内为AI智能体(Agent)单独设立的“子钱包”,专用于授权AI在用户设定范围与手动确认下完成自动化消费。主账户资金完全隔离、额度由用户自主控制、每笔交易必须人工确认...AI最新项目7天前0330
AI版支付宝 – 用户通过文字或语音指令,即可一句话直达上万种服务AI版支付宝(命名为“阿宝”)是支付宝自2026年6月16日起推出的重大改版版本,将传统“陈列式”菜单交互升级为“对话式”服务模式。用户只需通过文字或语音指令,即可一句话直达上万种服务,无需手动跳转多...AI最新项目1周前0330
MusaCoder – 摩尔线程推出的国产GPU全栈训练的代码大模型MusaCoder是摩尔线程推出的全球首个基于国产全功能GPU全栈训练的代码大模型,专为自动生成高性能GPU底层算子(CUDA/MUSA原生Kernel代码) 而设计,其完整训练与验证流程均在国产MT...AI最新项目2周前0330
新DeepMind Genie 3 – 谷歌向公众开放的通用世界模型DeepMind Genie 3是谷歌向公众开放的通用世界模型(General World Model),能够通过文本提示实时生成可交互的3D虚拟环境,用户可直接操控角色在动态世界中探索(如WASD移...AI最新项目5天前0320
Tuanjie Cowork – Unity中国专为游戏开发者打造的AI编程智能体Tuanjie Cowork是Unity中国专为游戏开发者打造的AI编程智能体,深度集成Unity与团结引擎生态,核心能力在于直接读取完整项目上下文(包括场景结构、资源管线、编辑器状态等引擎特有数据...AI最新项目2周前0320
Compound Engineering – 这款插件让AI帮你写代码作为一名程序员,你有没有这种感觉——代码越写越多,但脑子越来越不够用? 刚写的代码,过俩月自己都看不懂了;修个bug吧,结果越修越乱;项目越来越大,新人入职完全无从下手……今天给各位介绍一个神器——C...AI最新项目4周前0320