JoyAI-Echo – 京东开源的长音视频生成框架JoyAI-Echo是京东开源的长音视频生成框架,首次系统性解决长视频生成的三大行业难题(角色一致性差、声音不稳定、生成效率低),通过跨模态记忆库、对话式编辑和7.5倍推理加速技术,实现5分钟级长视频...AI最新项目3周前0700
MAI-Code-1-Flash – 微软发布的首款自研轻量级代码生成模型MAI-Code-1-Flash是微软发布的首款自研轻量级代码生成模型,专为开发者日常编码场景设计,采用50亿参数的紧凑架构,通过自适应推理预算分配技术实现高效率与低成本的平衡。 其核心价值在于将Ag...AI最新项目3周前0780
MAI Transcribe-1.5 – 微软发布的升级版语音转文字(ASR)模型MAI-Transcribe-1.5是微软于2026年6月发布的升级版语音转文字(ASR)模型,作为MAI系列自研模型的重要迭代,在43种语言支持、专业术语识别精度和处理速度上实现突破性提升,批量转录...AI最新项目3周前0420
Bernini – 字节跳动开源的统一视频生成与编辑框架Bernini是字节跳动于2026年6月正式开源的统一视频生成与编辑框架,首创“语义规划+视觉渲染”的两阶段解耦架构,通过让AI先理解指令逻辑再生成画面,显著提升视频编辑的可控性与稳定性,解决传统模型...AI最新项目3周前0470
PaddleOCR-VL-1.6 – 百度发布的轻量化多模态文档解析模型PaddleOCR-VL-1.6是百度发布的轻量化多模态文档解析模型,在权威评测集OmniDocBench v1.6中以96.33%的综合准确率刷新全球SOTA记录,超越Gemini-3-Pro、GP...AI最新项目3周前0360
MAI-Voice-2 – 微软发布的新一代自研多语言语音合成模型MAI-Voice-2是微软发布的新一代自研多语言语音合成模型,支持15种以上语言的高自然度语音生成,并首次实现复杂情感语调模拟与短样本声音克隆能力。 其核心突破在于通过端到端神经声学建模,在保证超低...AI最新项目3周前0340
MAI-Thinking-1 – 微软发布的首款完全自研的高级推理AI模型MAI-Thinking-1是微软于2026年6月3日发布的首款完全自研的高级推理AI模型,采用350亿活跃参数的稀疏混合专家(MoE)架构,完全基于企业级合规数据从零训练,未使用任何第三方模型蒸馏数...AI最新项目3周前0420
Qwen2.5-7B – 阿里云通义千问系列开源大语言模型Qwen2.5-7B是阿里云通义千问系列推出的76.1亿参数开源大语言模型,核心特点为支持131.072 tokens超长上下文、原生结构化输出能力及显著提升的数学与编程性能,适用于需平衡推理成本与专...AI最新项目3周前0370
ECC – 开源的AI Agent性能优化系统ECC(Everything Claude Code)是一个开源的AI Agent性能优化系统,由Anthropic黑客松冠军Affaan Mustafa基于10个月高强度生产环境实践开发,核心目标是...AI最新项目3周前0450
OpenClacky – 李亚飞团队开源的低成本AI Agent框架OpenClacky是李亚飞团队开源的低成本AI Agent框架,核心目标是通过工程化优化将AI任务执行的Token消耗降至行业最低水平,使专业用户能全天候无负担地运行AI助手。 其关键突破在于通过缓...AI最新项目3周前0390
Mellum2 – JetBrains推出的开源混合专家(MoE)模型Mellum2是JetBrains推出的120亿参数开源混合专家(MoE)模型,专为软件工程场景设计,核心目标是通过超低延迟推理与私有化部署能力,解决企业级AI工作流中的实时性与成本瓶颈。 Mellu...AI最新项目3周前0370
Qwen3.7-Plus – 阿里巴巴发布的多模态智能体模型Qwen3.7-Plus是阿里巴巴于2026年6月2日正式发布的多模态智能体模型,定位为视觉与语言统一的智能体基座。它在Qwen3.7文本能力基础上深度融合视觉理解与行动能力,不仅能看懂图像/视频,还...AI最新项目3周前0520
语构 – 阿里达摩院上线的零代码AI原生应用开发平台语构是阿里达摩院于2026年6月2日正式上线的零代码AI原生应用开发平台,基于Vibe Coding技术实现“一句话生成完整应用”的能力,支持网页、小程序、互动工具等多元形态开发。 其核心突破在于彻底...AI最新项目3周前0390
Cosmos 3 – 英伟达发布的开源全模态物理AI基础大模型Cosmos 3是英伟达(NVIDIA)于2026年6月1日正式发布的全球首款全开源、全模态(Omni-Model)物理AI基础大模型。它被定义为一个“世界模型”,旨在赋予人工智能系统理解物理世界规律...AI最新项目3周前0490
Polar – 英伟达开源的强化学习训练框架Polar是英伟达(NVIDIA)开源的强化学习训练框架,专为解决代码智能体(如Codex、Claude Code、Qwen Code等)接入强化学习时的高成本与信号丢失问题而设计。 其核心突破在于无...AI最新项目3周前0350
Dubbing v2 – ElevenLabs推出的最新AI配音模型Dubbing v2是ElevenLabs推出的AI配音模型,首次实现 跨语言情感迁移,能够将原始语音中的语调、节奏、停顿、情绪起伏等表演细节完整保留并自然映射到目标语言中。 其核心突破在于 摒弃传统...AI最新项目3周前0430
Gamma-World – 英伟达与清华大学推出的多智能体世界模型Gamma-World是由英伟达与清华大学团队联合提出的多智能体世界模型,旨在解决传统单智能体世界模型无法模拟多主体在共享环境中交互的核心缺陷。 其核心突破在于通过身份对称性编码和稀疏通信架构,首次实...AI最新项目3周前0390
Music v2 – ElevenLabs发布的新一代专业级音乐生成模型Music v2是ElevenLabs发布的新一代专业级音乐生成模型,其核心突破在于将AI音乐创作从“抽卡式随机生成”推进到可精准编辑、支持商业落地的工业化阶段。 该模型基于完全授权的数据集训练,生成...AI最新项目3周前0450
Qwen-VLA – 阿里通义团队最新发布的通用机器人基础模型Qwen-VLA是阿里通义团队最新发布的通用机器人基础模型。 简单来说,如果之前的视觉模型是让AI拥有一双“眼睛”去理解世界,那么Qwen-VLA就是给这双眼睛配上了“灵活的手脚”,让AI不仅能看、能...AI最新项目3周前0450
Gemini 3.1 Pro – 谷歌发布的旗舰人工智能基础模型Gemini 3.1 Pro是谷歌(Google)发布的新一代旗舰人工智能基础模型。它定位为一款专为解决复杂问题而生的高阶推理工具,主打深度思考和复杂任务处理。 Gemini 3.1 Pro核心特点与...AI最新项目3周前0420
MiniMax M3 – MiniMax发布的新一代旗舰通用大模型MiniMax M3是国产大模型公司MiniMax正式发布的新一代旗舰通用大模型。MiniMax M3是国内首个同时集齐“前沿编程与智能体能力、百万级超长上下文、原生多模态”三大核心能力的模型,也是目...AI最新项目3周前0400
Webwright – 微软研究院开源的终端原生Web代理框架Webwright是微软研究院开源的终端原生Web代理框架,其核心突破在于 摒弃传统“逐次点击”操作模式,转而让AI模型直接在终端编写Playwright代码控制浏览器。该框架通过将代理与浏览器解耦...AI最新项目3周前0440
ControlFoley – 小米大模型开源可控视频音效生成模型ControlFoley是小米大模型应用团队与武汉大学联合开发的开源可控视频音效生成模型。其核心突破在于 首次实现"按意图配声音"的精准控制能力,解决了传统音效生成模型"只能根据画面自动猜声音"的局限...AI最新项目3周前0410
SenseNova-U1-8B-MoT-Infographic – 商汤科技开源的多模态大模型SenseNova-U1-8B-MoT-Infographic是商汤科技开源的专项增强版多模态大模型,基于原生统一架构 SenseNova-U1-8B-MoT针对信息图(infographic)生成场...AI最新项目3周前0370
getdesign.md – VoltAgent团队推出的设计规范库getdesign.md 是一个免费开源的大厂设计规范库,把66+知名品牌(Apple、Stripe、Figma、Linear 等) 的设计系统,整理成一份份标准化的DESIGN.md文件,供AI编程...AI最新项目3周前0380
美团GEO营销门户 – 美团推出的生成式引擎优化(GEO)平台美团GEO营销门户是美团推出的生成式引擎优化(GEO)平台,助力本地商家在豆包、DeepSeek等主流AI大模型对话中获得更多推荐与曝光。提供策略建议、AI内容生成、多平台监测、效果追踪四大核心能力...AI最新项目3周前0740
Taste-Skill – 专治AI生成的模板脸UI让AI帮你写个前端页面,它倒是写得挺快,但结果总是那种“标准的、毫无灵魂的”模板脸:居中排版、蓝色按钮、白色背景,要多无聊有多无聊 就像下面这种: 这也不能全怪AI,毕竟训练数据里这种“模板脸”太多了...AI最新项目3周前0530
Compound Engineering – 这款插件让AI帮你写代码作为一名程序员,你有没有这种感觉——代码越写越多,但脑子越来越不够用? 刚写的代码,过俩月自己都看不懂了;修个bug吧,结果越修越乱;项目越来越大,新人入职完全无从下手……今天给各位介绍一个神器——C...AI最新项目3周前0310
HeiMaClaw – 黑马程序员推出的一款生产级企业AI Agent平台HeiMaClaw是由黑马程序员推出的一款生产级企业AI Agent平台。与面向个人用户的助手不同,HeiMaClaw的定位非常明确:它是一个企业级基础设施,旨在通过工程化手段(Harness Eng...AI最新项目4周前01010
阿里云百炼 CLI – 阿里云开源的命令行工具,专为AI Agent设计阿里云百炼CLI是阿里云开源的命令行工具,专为AI Agent设计,一行命令即可接入百炼平台150+模型与全套能力。原生支持多种主流Agent框架,集成多模态调用、知识库、记忆库、联网搜索与文件处理...AI最新项目4周前0390