Stable Audio3 – Stability AI正式发布的音频生成模型系列Stable Audio3.0是Stability AI正式发布的音频生成模型系列,最大突破是将专业级音乐生成时长提升至 6 分 20 秒,首次实现AI生成结构完整、旋律连贯的歌曲级内容,标志着 AI...AI最新项目1个月前0760
Hy-MT2 – 腾讯混元团队开源的新一代翻译大模型家族腾讯混元团队开源的Hy-MT2是新一代多语言翻译大模型家族,包含1.8B、7B、30B-A3B三种尺寸,支持33种语言互译及5种民族语言/方言翻译,核心突破在于通过1.25-bit极端量化技术将轻量级...AI最新项目1个月前0810
CloudDM – ClouGence开发的开源数据库统一管理平台CloudDM是由开云集致(ClouGence)开发的开源数据库统一管理平台,基于Apache 2.0协议全面开放所有功能,核心解决多源数据库的查询、变更审批与权限管控问题,支持 30+ 种数据源的统...AI最新项目1个月前0520
ZCube – 智谱联合清华大学开发的新型AI集群网络架构ZCube是由智谱联合清华大学、驭驯网络开发的新型AI集群网络架构,专为解决大模型推理场景中的结构性网络拥塞问题而设计。 其核心突破在于彻底重构网络拓扑,通过取消传统Clos架构的Spine层、采用扁...AI最新项目1个月前0530
HyperEyes – 小红书研究团队提出的并行多模态搜索智能体HyperEyes是由小红书研究团队提出的并行多模态搜索智能体,通过重构动作空间、数据合成与强化学习框架,解决了传统多模态搜索中“串行调用”导致的效率低下问题,实现了单次交互内对图片中多个目标的并发定...AI最新项目1个月前0590
Agora-1 – Odyssey发布的多人实时互动的AI世界模型Agora-1是由AI初创公司Odyssey发布的全球首个支持多人实时互动的AI世界模型,其核心突破在于实现了人类与 AI 智能体在同一个动态生成的虚拟环境中同步交互,而非传统单人体验的静态生成内容...AI最新项目1个月前0500
Lance – 字节跳动推出的原生统一的多模态模型Lance 是字节跳动推出的一个原生统一的多模态模型。它是一个参数量为 30亿(3B) 的研究性项目,旨在打破图像和视频在理解、生成、编辑任务上的壁垒。 与许多需要针对不同任务单独微调的模型不同,La...AI最新项目1个月前0880
HiDream-O1-Image-Pro – 智象未来发布的图像生成大模型HiDream-O1-Image-Pro是智象未来发布的超2000亿参数原生全模态图像生成大模型,采用全球首创的像素级统一Transformer(UiT)架构,彻底摒弃传统VAE压缩与独立文本编码器...AI最新项目1个月前0820
Qwen3.5-LiveTranslate – 阿里通义发布的实时语音翻译模型Qwen3.5-LiveTranslate是阿里通义千问发布的实时语音翻译模型,核心突破在于实现2.8秒端到端字均延迟、支持60种语言输入与29种语言语音输出,并通过多模态技术保留说话人原声音色与情绪...AI最新项目1个月前0630
Qwen3.7-Max – 阿里巴巴发布的千问系列新一代旗舰大模型Qwen3.7-Max是阿里巴巴发布的千问系列新一代旗舰大模型,核心定位为面向智能体(Agent)时代的全能基座模型,其最大突破在于无需人工干预即可自主完成超长周期复杂任务(如35小时连续工作、115...AI最新项目1个月前0640
Google Pics – 谷歌推出的AI驱动设计与图像生成工具Google Pics是谷歌推出的原生集成于Google Workspace的AI驱动设计与图像生成工具,核心目标是将图像生成与精细化编辑整合至同一工作流,让用户无需专业设计技能即可完成从创作到微调的...AI最新项目1个月前0590
Gemini Omni Flash – 面向视频创作的全模态对话式生成模型Gemini Omni Flash是谷歌于I/O开发者大会上发布的首款面向视频创作的全模态对话式生成模型,核心定位是通过自然语言实现多轮连贯的视频编辑,而非一次性生成。它并非单纯追求视频时长或画质,而...AI最新项目1个月前0750
Gemini Spark – 谷歌发布的首个全天候运行的个人AI智能体Gemini Spark是谷歌发布的首个全天候运行的个人AI智能体,其核心突破在于无需用户持续在线即可自主执行跨应用任务(如整理邮件、规划行程、监控账单),且任务在用户关闭设备后仍能在云端持续运行。与...AI最新项目1个月前0470
Gemini 3.5 Flash – 谷歌发布的轻量级AI模型Gemini 3.5 Flash是谷歌于2026年5月20日在I/O开发者大会上发布的轻量级AI模型,在保持Flash系列高速响应特性的同时,其智能体与编程能力已全面超越上一代旗舰Gemini 3.1...AI最新项目1个月前0610
Qwen3.7 Preview – 最新一代旗舰大模型预览版Qwen3.7 Preview(通义千问3.7预览版)是阿里巴巴在2026年5月19日深夜至20日阿里云峰会期间,正式对外亮相的最新一代旗舰大模型预览版。 这次发布采用了“双模型”策略,分别推出了主打...AI最新项目1个月前01130
ESP-Claw – 乐鑫推出的物联网AI智能体框架ESP-Claw(代号“龙虾”)是乐鑫在2026年4月至5月期间正式推出的物联网AI智能体框架。 简单来说,它彻底打破了传统物联网设备“只能被动执行指令”的局限,将AI智能体(Agent)直接部署到了...AI最新项目1个月前0580
Marvis – 腾讯应用宝团队推出的操作系统级AI助手Marvis(中文名:马维斯)是腾讯应用宝团队在2026年5月刚刚开启内测的一款操作系统级AI助手。 简单来说,它不仅仅是一个陪聊的AI,而是一个能真正接管并操控你电脑和手机的“个人数字秘书”。它的名...AI最新项目1个月前0540
hronicles-OCR – 腾讯混元发布首个古文字“七体”评测基准hronicles-OCR是由腾讯混元大模型联合中国科学院信息工程研究所、安阳师范学院、南开大学及故宫博物院等权威机构,共同推出的业界首个中国古文字感知评测基准。 简单来说,它是一套专门用来给当前顶尖...AI最新项目1个月前0490
Composer 2.5 – Cursor最新推出的自研Agentic编程模型Composer 2.5是AI编程工具Cursor最新推出的自研Agentic(代理式)编程模型。它在智能水平上已经能够对标当前业界最顶尖的Claude Opus 4.7和GPT-5.5但单次任务的成...AI最新项目1个月前0550
文心大模型系列文心大模型(ERNIE)是百度自主研发的产业级知识增强大模型。截至2026年5月,其最新版本为文心大模型5.1.刚刚在近期正式发布。 文心大模型 5.1 这是百度在2026年5月Create开发者大会...AI最新项目1个月前0650
Intern-S2-Preview – 开源的新一代书生科学大模型的预览版Intern-S2-Preview是上海人工智能实验室(上海AI实验室)最新开源的新一代书生科学大模型的预览版。 它最大的亮点在于“以小博大”:仅用 350亿(35B) 的参数规模,就在多个核心科学领...AI最新项目1个月前0540
PPT Master – 开源的AI生成PPT工作流PPT Master是一个开源的AI工作流(Skill),它的核心目标是解决传统AI生成PPT工具的最大痛点:生成的幻灯片是“一张图片”,无法二次编辑。 PPT Master通过一套标准化的本地工作流...AI最新项目1个月前0650
MemPrivacy – 荣耀联合同济发布端云协同AI隐私保护框架MemPrivacy是由记忆张量(MemTensor) 联合荣耀、同济大学开源的、面向端云协同AI智能体(Agent)的隐私保护框架与系列模型。 简单来说,MemPrivacy的核心作用是解决AI越来...AI最新项目1个月前0730
Higgs Avatar v1 – 面向语音智能体的实时数字人基础模型Higgs Avatar v1是由Boson AI团队发布的一款面向语音智能体的实时数字人基础模型。它的核心作用是为 AI 赋予逼真的“面容”和表情,使其在对话中具备极强的临场感。 Higgs Ava...AI最新项目1个月前0870
OpenHuman – 本地优先个人AI超级助手OpenHuman是一款真正懂你的“本地优先”个人AI超级助手。它和传统的聊天机器人最大的不同在于,它不是一个被动等待提问的工具,而是一个会主动感知你工作上下文、在后台持续学习和思考的AI智能体(Ag...AI最新项目1个月前0560
GPT2参数量汇总介绍GPT-2并不只有一个固定的参数量,它实际上包含四个不同规模的模型版本,参数量从约1.2 亿到15亿不等。 通常大家提到的“GPT-2 有15 亿参数”,指的是其中最大的那个版本(GPT-2 XL...AI最新项目1个月前0540
General365 – 美团LongCat团队开源通用推理新评测基准General365是由美团LongCat团队在2026年4月底发布,并于5月中旬正式开源的一个专注于评估大模型通用逻辑推理能力的全新评测基准。 简单来说,它是一套专门为 AI 设计的“高难度逻辑考卷...AI最新项目1个月前0760
TencentDB Agent Memor – 腾讯云团队开源的AI智能体记忆引擎TencentDB Agent Memory是腾讯云数据库团队在2026年4月发布,并于5月14日正式开源的一款AI 智能体(Agent)记忆引擎。 它的核心作用是为AI Agent装上一个“长期且有...AI最新项目1个月前0520
Kimi WebBridge – 月之暗面近期推出的一款AI浏览器插件Kimi WebBridge是月之暗面近期推出的一款AI浏览器插件,它的核心作用是让AI智能体(AI Agent)能够像人类一样,直接操控你的真实浏览器去完成各种复杂的网页任务。 简单来说,装上它之后...AI最新项目1个月前0510
InsForge – 专为AI编码智能体打造的一站式开源后端平台InsForge是一个专为AI编码智能体(AI Coding Agents)量身打造的一站式开源后端平台。InsForge的核心理念是“为智能体开发而构建的后端”,旨在解决当前AI辅助编程(如使用Cu...AI最新项目1个月前0500