CopilotKit – 开源的前端智能体(Agent)应用开发框架CopilotKit是一个开源的前端智能体(Agent)应用开发框架,核心目标是让开发者能像搭积木一样快速构建深度集成AI能力的应用,而非仅添加一个聊天窗口。 通过 AG-UI 协议实现智能体与用户界...AI最新项目2周前0440
Dubbing v2 – ElevenLabs推出的最新AI配音模型Dubbing v2是ElevenLabs推出的AI配音模型,首次实现 跨语言情感迁移,能够将原始语音中的语调、节奏、停顿、情绪起伏等表演细节完整保留并自然映射到目标语言中。 其核心突破在于 摒弃传统...AI最新项目3周前0440
Webwright – 微软研究院开源的终端原生Web代理框架Webwright是微软研究院开源的终端原生Web代理框架,其核心突破在于 摒弃传统“逐次点击”操作模式,转而让AI模型直接在终端编写Playwright代码控制浏览器。该框架通过将代理与浏览器解耦...AI最新项目3周前0440
Microsoft Scout – 微软开发者大会上推出的首款个人AI同事Microsoft Scout是微软开发者大会上推出的首款"真正意义的个人AI同事",具备独立身份、能主动接管高频低价值职场任务的自治式智能体。 深度嵌入Microsoft 365生态,以Teams联...AI最新项目3周前0430
MAI Transcribe-1.5 – 微软发布的升级版语音转文字(ASR)模型MAI-Transcribe-1.5是微软于2026年6月发布的升级版语音转文字(ASR)模型,作为MAI系列自研模型的重要迭代,在43种语言支持、专业术语识别精度和处理速度上实现突破性提升,批量转录...AI最新项目3周前0430
SciDraw AI – 基于自然语言描述生成科研级科学插图的平台SciDraw AI是一个基于自然语言描述生成科研级科学插图的AI平台,通过AI技术将传统需数小时的手工绘图流程压缩至几分钟,无需专业设计基础即可快速生成符合期刊投稿标准的矢量图表,尤其适合跨学科科研...AI最新项目2周前0420
GitNexus – 专为AI智能体设计的代码库知识图谱构建工具GitNexus是专为AI智能体设计的代码库知识图谱构建工具,核心功能是将代码库的依赖关系、调用链和架构逻辑预计算为结构化知识图谱,使AI编程助手能精准理解代码上下文,避免盲目修改导致破坏性变更。 通...AI最新项目3周前0420
Ideogram 4 – Ideogram公司发布的开源文生图模型Ideogram 4.0是Ideogram公司于2026年6月3日发布的93亿参数开源文生图模型,最大突破在于通过单流架构实现像素级排版控制能力,使AI生图从随机“抽卡”转向可精准指定文字位置、对象布...AI最新项目3周前0420
MAI-Thinking-1 – 微软发布的首款完全自研的高级推理AI模型MAI-Thinking-1是微软于2026年6月3日发布的首款完全自研的高级推理AI模型,采用350亿活跃参数的稀疏混合专家(MoE)架构,完全基于企业级合规数据从零训练,未使用任何第三方模型蒸馏数...AI最新项目3周前0420
Gemini 3.1 Pro – 谷歌发布的旗舰人工智能基础模型Gemini 3.1 Pro是谷歌(Google)发布的新一代旗舰人工智能基础模型。它定位为一款专为解决复杂问题而生的高阶推理工具,主打深度思考和复杂任务处理。 Gemini 3.1 Pro核心特点与...AI最新项目3周前0420
Aholo Viewer – 群核科技开源的3D高斯浏览器Aholo Viewer是群核科技(Manycore)开源的3D高斯浏览器,其核心突破在于无需安装客户端,用户直接通过网页浏览器即可流畅浏览包含10亿级高斯点的城市级超大3D场景。 该技术通过Chun...AI最新项目4周前0420
Xiaomi Auto World Model – 小米发布的世界模型全新框架Xiaomi Auto World Model是小米汽车发布的世界模型全新框架,其核心突破在于首次将三维重建与视频生成深度耦合为一体化架构,以“重建锚定几何、生成填补想象”的新范式,推动辅助驾驶从“场...AI最新项目4周前0420
Dulus – 开源、免API密钥的命令行AI智能体项目Dulus是一个开源、免API密钥的命令行(CLI)AI智能体项目,由独立开发者KevRojo在GitHub上维护。其核心设计目标是让用户无需绑定信用卡或手动配置API密钥,即可通过自动化捕获浏览器会...AI最新项目4周前0420
GenflowAI – 多模态AI创意工作空间GenflowAI是面向创作者、电商与营销团队的多模态AI创意工作空间,主打无代码自动化工作流。聚合 GPT、Gemini、Seedance 2.0等顶尖模型,单一画布内完成文本、图像、视频、音频的生...AI最新项目2周前0410
ControlFoley – 小米大模型开源可控视频音效生成模型ControlFoley是小米大模型应用团队与武汉大学联合开发的开源可控视频音效生成模型。其核心突破在于 首次实现"按意图配声音"的精准控制能力,解决了传统音效生成模型"只能根据画面自动猜声音"的局限...AI最新项目3周前0410
Kimi Work – 月之暗面推出的本地桌面AI智能体Kimi Work是月之暗面推出的本地桌面AI智能体,依托Kimi Code引擎,适配Windows、Mac客户端。依托自然语言下达指令即可自动拆分任务、本地执行操作,支持网页抓取、文件管理、多格式文...AI最新项目3周前0400
MiniMax M3 – MiniMax发布的新一代旗舰通用大模型MiniMax M3是国产大模型公司MiniMax正式发布的新一代旗舰通用大模型。MiniMax M3是国内首个同时集齐“前沿编程与智能体能力、百万级超长上下文、原生多模态”三大核心能力的模型,也是目...AI最新项目3周前0400
Fara1.5 – 微软研究院发布的浏览器智能体模型系列Fara1.5是微软研究院AI Frontiers实验室发布的浏览器智能体模型系列,专为直接操作真实浏览器界面完成复杂任务而设计,不依赖网页DOM结构或无障碍树,仅通过视觉截图理解界面。 其核心突破在...AI最新项目4周前0400
Keye-VL-2.0-30B-A3B – 快手发布的30B级多模态大模型Keye-VL-2.0-30B-A3B是快手发布的30B级多模态大模型,其核心突破在于首次将DSA机制引入多模态领域,实现256K超长上下文的高效处理能力,并在长视频时序理解任务中达到接近无损的推理精...AI最新项目4周前0400
openPangu 2.0 – 华为发布的开源大模型系列最新版本openPangu 2.0是华为在HDC开发者大会上发布的开源大模型系列最新版本,为深度绑定昇腾算力与鸿蒙生态的产业级AI基础设施。通过稀疏MoE架构实现超高吞吐率与低时延,单卡推理性能达业界主流开源...AI最新项目2周前0390
MiMo-V2.5-ASR – 小米开源的语音识别模型MiMo-V2.5-ASR是小米开源的语音识别模型,作为全链路语音交互系统的听觉基座,复杂真实场景下的高鲁棒性语音转写。它无需预设语种标签即可精准处理中英混说、方言交织、强噪音干扰等环境,在多人会议...AI最新项目2周前0390
MiMoCode V0.1.0 – 小米开源的终端原生AI编程助手MiMoCode V0.1.0是小米开源的终端原生AI编程助手,专为解决长周期编程任务中的信息丢失问题而设计,其核心突破在于通过独立Agent架构实现“越用越懂项目”的持续记忆能力,而非仅依赖模型自身...AI最新项目2周前0390
新程Alpha – 明日新程公司推出的全球首个端侧认知模型新程Alpha是明日新程(Nextie)公司推出的全球首个端侧认知模型,参数量仅4B(40亿),通过将“知识记忆”与“思考能力”解耦,专注于泛化推理和抽象决策,在群体智能任务中表现等效于GPT-5.4...AI最新项目2周前0390
ABot-Earth0.5 – 高德地图发布全球首个3D原生城市世界模型ABot-Earth0.5是高德地图发布的全球首个3D原生城市世界模型,仅需单张卫星图像或文字描述,即可在10分钟内通过消费级GPU生成公里级可编辑3D城市场景。该模型将3D制图成本降至传统方式的百分...AI最新项目2周前0390
Qwen2.5-7B – 阿里云通义千问系列开源大语言模型Qwen2.5-7B是阿里云通义千问系列推出的76.1亿参数开源大语言模型,核心特点为支持131.072 tokens超长上下文、原生结构化输出能力及显著提升的数学与编程性能,适用于需平衡推理成本与专...AI最新项目3周前0390
OpenClacky – 李亚飞团队开源的低成本AI Agent框架OpenClacky是李亚飞团队开源的低成本AI Agent框架,核心目标是通过工程化优化将AI任务执行的Token消耗降至行业最低水平,使专业用户能全天候无负担地运行AI助手。 其关键突破在于通过缓...AI最新项目3周前0390
语构 – 阿里达摩院上线的零代码AI原生应用开发平台语构是阿里达摩院于2026年6月2日正式上线的零代码AI原生应用开发平台,基于Vibe Coding技术实现“一句话生成完整应用”的能力,支持网页、小程序、互动工具等多元形态开发。 其核心突破在于彻底...AI最新项目3周前0390
Gamma-World – 英伟达与清华大学推出的多智能体世界模型Gamma-World是由英伟达与清华大学团队联合提出的多智能体世界模型,旨在解决传统单智能体世界模型无法模拟多主体在共享环境中交互的核心缺陷。 其核心突破在于通过身份对称性编码和稀疏通信架构,首次实...AI最新项目3周前0390
阿里云百炼 CLI – 阿里云开源的命令行工具,专为AI Agent设计阿里云百炼CLI是阿里云开源的命令行工具,专为AI Agent设计,一行命令即可接入百炼平台150+模型与全套能力。原生支持多种主流Agent框架,集成多模态调用、知识库、记忆库、联网搜索与文件处理...AI最新项目4周前0390
MiMo-V2.5-Pro-UltraSpeed – 小米推出的超高速推理模式Xiaomi MiMo-V2.5-Pro-UltraSpeed是小米与TileRT团队联合推出的MiMo-V2.5-Pro模型的超高速推理模式,首次在通用GPU上实现万亿参数模型1000tokens...AI最新项目2天前0380