AI最新项目

共 288 篇文章

AI资讯 AI世界漫游指南 AI知识探索库 AI学习教程 AI最新项目

排序

发布更新浏览点赞

MiMo-V2.5-ASR – 小米开源的语音识别模型

MiMo-V2.5-ASR – 小米开源的语音识别模型

MiMo-V2.5-ASR是小米开源的语音识别模型，作为全链路语音交互系统的听觉基座，复杂真实场景下的高鲁棒性语音转写。它无需预设语种标签即可精准处理中英混说、方言交织、强噪音干扰等环境，在多人会议...

2周前

0380

MiMoCode V0.1.0 – 小米开源的终端原生AI编程助手

MiMoCode V0.1.0 – 小米开源的终端原生AI编程助手

MiMoCode V0.1.0是小米开源的终端原生AI编程助手，专为解决长周期编程任务中的信息丢失问题而设计，其核心突破在于通过独立Agent架构实现“越用越懂项目”的持续记忆能力，而非仅依赖模型自身...

2周前

0390

Claude Opus 4.7 – Anthropic推出的旗舰级大语言模型

Claude Opus 4.7 – Anthropic推出的旗舰级大语言模型

Claude Opus 4.7是Anthropic推出的旗舰级大语言模型，作为当时公开可用的最强代码与多模态模型，将AI从“对话助手”升级为“可自主执行复杂任务的智能体”。Claude Opus 4...

2周前

0300

MusaCoder – 摩尔线程推出的国产GPU全栈训练的代码大模型

MusaCoder – 摩尔线程推出的国产GPU全栈训练的代码大模型

MusaCoder是摩尔线程推出的全球首个基于国产全功能GPU全栈训练的代码大模型，专为自动生成高性能GPU底层算子(CUDA/MUSA原生Kernel代码) 而设计，其完整训练与验证流程均在国产MT...

2周前

0320

North Mini Code – Cohere公司推出的开源智能体编程大模型

North Mini Code – Cohere公司推出的开源智能体编程大模型

North Mini Code是Cohere公司推出的开源智能体编程大模型，核心定位为高吞吐、低延迟的代码智能体底座，采用30B总参数量但仅激活3B参数的稀疏混合专家(MoE)架构，专为本地化部署与企...

2周前

0270

Khala – 中央音乐学院与清华大学联合研发的音乐生成大模型

Khala – 中央音乐学院与清华大学联合研发的音乐生成大模型

Khala是中央音乐学院与清华大学联合研发的统一声学Token空间音乐生成大模型，解决AI音乐生成中结构连贯性与音质保真度的矛盾，通过构建跨模态对齐的声学表征体系，实现从深层音乐语义到高质量音频的端到...

2周前

0330

Gemini 3.5 Live Translate – 谷歌发布的实时语音互译音频模型

Gemini 3.5 Live Translate – 谷歌发布的实时语音互译音频模型

Gemini 3.5 Live Translate是谷歌发布的实时语音互译音频模型，通过流式处理实现仅数秒延迟的连续语音翻译，同时保留说话者的原始语调、语速和情感特征，使跨语言对话接近真人同传体验。 ...

2周前

0360

MiMo-V2.5-Pro-UltraSpeed – 小米推出的超高速推理模式

MiMo-V2.5-Pro-UltraSpeed – 小米推出的超高速推理模式

Xiaomi MiMo-V2.5-Pro-UltraSpeed是小米与TileRT团队联合推出的MiMo-V2.5-Pro模型的超高速推理模式，首次在通用GPU上实现万亿参数模型1000tokens...

2天前

0380

Claude Fable 5 – 首款面向公众开放的Mythos级大语言模型

Claude Fable 5 – 首款面向公众开放的Mythos级大语言模型

Claude Fable 5是Anthropic发布的首款面向公众开放的Mythos级大语言模型，与Claude Mythos 5共享同一底层架构，但通过安全机制限制高风险领域能力，使其成为目前公开可...

2周前

0450

新程Alpha – 明日新程公司推出的全球首个端侧认知模型

新程Alpha – 明日新程公司推出的全球首个端侧认知模型

新程Alpha是明日新程（Nextie）公司推出的全球首个端侧认知模型，参数量仅4B（40亿），通过将“知识记忆”与“思考能力”解耦，专注于泛化推理和抽象决策，在群体智能任务中表现等效于GPT-5.4...

2周前

0390

WBench – 首个面向交互式视频世界模型的系统性多轮评测基准

WBench – 首个面向交互式视频世界模型的系统性多轮评测基准

WBench是美团LongCat团队与复旦大学联合发布的首个面向交互式视频世界模型的系统性多轮评测基准，首次实现对世界模型在连续交互、多维度能力上的统一量化评估，而非仅关注单次生成的视频质量。当前研究...

2周前

0360

SciDraw AI – 基于自然语言描述生成科研级科学插图的平台

SciDraw AI – 基于自然语言描述生成科研级科学插图的平台

SciDraw AI是一个基于自然语言描述生成科研级科学插图的AI平台，通过AI技术将传统需数小时的手工绘图流程压缩至几分钟，无需专业设计基础即可快速生成符合期刊投稿标准的矢量图表，尤其适合跨学科科研...

2周前

0410

BigSet – TinyFish开源的多智能体协同网络抓工具

BigSet – TinyFish开源的多智能体协同网络抓工具

BigSet是TinyFish团队开源的多智能体协同网络抓取与数据集构建工具，通过集成搜索、抓取、推理和验证的自动化流程，支持用户用自然语言指令实时生成结构化高质量数据集。将传统数据采集从手动操作升级...

2周前

0340

VitaBench 2.0 – LongCat推出的新一代大模型智能体评测基准

VitaBench 2.0 – LongCat推出的新一代大模型智能体评测基准

VitaBench 2.0是美团LongCat团队联合多所高校推出的新一代大模型智能体评测基准，专注于评估智能体在长期、多轮次真实生活场景交互中的综合能力。与早期版本相比，将评测维度从单次任务扩展至...

2周前

0340

Kairos-HomeWorld – 大晓机器人发布的全屋三维可交互世界模型

Kairos-HomeWorld – 大晓机器人发布的全屋三维可交互世界模型

Kairos-HomeWorld是大晓机器人联合香港中文大学多媒体实验室、深圳河套学院发布的全球首个全屋三维可交互世界模型，仅需一句文本指令即可生成结构连贯、物理合理且支持物体级交互的完整中国家庭3D...

2周前

0370

ABot-Earth0.5 – 高德地图发布全球首个3D原生城市世界模型

ABot-Earth0.5 – 高德地图发布全球首个3D原生城市世界模型

ABot-Earth0.5是高德地图发布的全球首个3D原生城市世界模型，仅需单张卫星图像或文字描述，即可在10分钟内通过消费级GPU生成公里级可编辑3D城市场景。该模型将3D制图成本降至传统方式的百分...

2周前

0390

CopilotKit – 开源的前端智能体(Agent)应用开发框架

CopilotKit – 开源的前端智能体(Agent)应用开发框架

CopilotKit是一个开源的前端智能体(Agent)应用开发框架，核心目标是让开发者能像搭积木一样快速构建深度集成AI能力的应用，而非仅添加一个聊天窗口。通过 AG-UI 协议实现智能体与用户界...

2周前

0440

deepseek v4 flash – 深度求索发布的轻量化高效版大模型

deepseek v4 flash – 深度求索发布的轻量化高效版大模型

DeepSeek-V4-Flash是深度求索发布的轻量化高效版大模型，作为V4系列的“快速模式”版本，专为高频日常任务设计，在保持接近Pro版推理能力的同时，将响应速度和调用成本压缩至极致。以1/10...

2周前

0620

Open Code Review – 阿里巴巴开源的AI驱动代码审查工具

Open Code Review – 阿里巴巴开源的AI驱动代码审查工具

Open Code Review是阿里巴巴开源的AI驱动代码审查工具，专为解决通用AI代理在代码审查中的覆盖不完整、位置漂移、质量不稳定等核心痛点而设计。将确定性工程与AI代理动态结合，既通过严格规则...

2周前

0500

GenflowAI – 多模态AI创意工作空间

GenflowAI – 多模态AI创意工作空间

GenflowAI是面向创作者、电商与营销团队的多模态AI创意工作空间，主打无代码自动化工作流。聚合 GPT、Gemini、Seedance 2.0等顶尖模型，单一画布内完成文本、图像、视频、音频的生...

2周前

0390

PlanningBench – 腾讯混元等联合开源规划能力评测与训练框架

PlanningBench – 腾讯混元等联合开源规划能力评测与训练框架

PlanningBench是由中国人民大学高瓴人工智能学院与腾讯混元联合开发的开源大模型规划能力评测与训练框架，核心目标是系统化评估和提升AI模型在多约束、多步骤决策任务中的全局规划能力。其突破性在...

2周前

0450

PawBench – 通义实验室推出的开源通用智能体评测基准

PawBench – 通义实验室推出的开源通用智能体评测基准

PawBench是通义实验室于2026年6月推出的开源通用智能体评测基准，核心突破在于首次将底座模型、运行框架(Harness)与任务场景纳入同一交叉评测体系，而非仅对模型能力排名。通过系统性拆解智...

3周前

0620

html-video – Open Design团队开源的HyperFrames

html-video – Open Design团队开源的HyperFrames

Open Design团队开源的HyperFrames（常被称作 "HTML 版剪映"）是一个基于 HTML/CSS/JavaScript 的动态视频生成框架，核心目标是让开发者用前端技术栈直接生成...

3周前

0560

Magenta RealTime 2 – 谷歌Magenta开源实时音乐生成AI模型

Magenta RealTime 2 – 谷歌Magenta开源实时音乐生成AI模型

Magenta RealTime 2(MRT2)是谷歌Magenta团队发布的开源实时音乐生成AI模型，核心突破在于将音乐生成延迟从传统云端方案的秒级降至200毫秒以内，实现真正意义上的"人机即兴合奏...

3周前

0490

GitNexus – 专为AI智能体设计的代码库知识图谱构建工具

GitNexus – 专为AI智能体设计的代码库知识图谱构建工具

GitNexus是专为AI智能体设计的代码库知识图谱构建工具，核心功能是将代码库的依赖关系、调用链和架构逻辑预计算为结构化知识图谱，使AI编程助手能精准理解代码上下文，避免盲目修改导致破坏性变更。通...

3周前

0420

BrowserAct Skills – 专为AI智能体设计的浏览器自动化工具集

BrowserAct Skills – 专为AI智能体设计的浏览器自动化工具集

BrowserAct Skills是专为AI智能体设计的浏览器自动化工具集，核心能力是让AI像人类一样稳定操作真实网页环境。它通过隐身浏览器技术+AI动态决策解决传统自动化工具的致命缺陷——能自动绕过...

3周前

0510

Microsoft Scout – 微软开发者大会上推出的首款个人AI同事

Microsoft Scout – 微软开发者大会上推出的首款个人AI同事

Microsoft Scout是微软开发者大会上推出的首款"真正意义的个人AI同事"，具备独立身份、能主动接管高频低价值职场任务的自治式智能体。深度嵌入Microsoft 365生态，以Teams联...

3周前

0430

Ideogram 4 – Ideogram公司发布的开源文生图模型

Ideogram 4 – Ideogram公司发布的开源文生图模型

Ideogram 4.0是Ideogram公司于2026年6月3日发布的93亿参数开源文生图模型，最大突破在于通过单流架构实现像素级排版控制能力，使AI生图从随机“抽卡”转向可精准指定文字位置、对象布...

3周前

0410

Gemma 4 12B – 谷歌DeepMind发布的统一多模态模型

Gemma 4 12B – 谷歌DeepMind发布的统一多模态模型

Gemma 4 12B是谷歌DeepMind于2026年6月4日发布的120亿参数统一多模态模型，最大突破在于通过无编码器架构实现仅需16GB内存的消费级笔记本即可本地运行完整多模态AI能力(支持文本...

3周前

01200

Kimi Work – 月之暗面推出的本地桌面AI智能体

Kimi Work – 月之暗面推出的本地桌面AI智能体

Kimi Work是月之暗面推出的本地桌面AI智能体，依托Kimi Code引擎，适配Windows、Mac客户端。依托自然语言下达指令即可自动拆分任务、本地执行操作，支持网页抓取、文件管理、多格式文...

3周前

0400