MAI-Transcribe-1 – 微软最新推出的语音转文字模型MAI-Transcribe-1是微软最新推出的一款语音转文字模型。它是微软为了减少对外部供应商(如OpenAI)的依赖,由内部团队自主研发的三款基础AI模型之一。 这款模型主打“全球最高精度”和“高...AI最新项目3个月前0750
美团GEO营销门户 – 美团推出的生成式引擎优化(GEO)平台美团GEO营销门户是美团推出的生成式引擎优化(GEO)平台,助力本地商家在豆包、DeepSeek等主流AI大模型对话中获得更多推荐与曝光。提供策略建议、AI内容生成、多平台监测、效果追踪四大核心能力...AI最新项目3周前0740
camofox-browser – 专为 AI Agent打造的开源反检测浏览器camofox-browser是一款专为 AI Agent(智能体)量身打造的开源反检测浏览器。简单来说,它就像是给 AI爬虫穿上了一件“隐身衣”,让它在访问网页时能够完美伪装成真实的人类用户,从而轻...AI最新项目1个月前0740
StepAudio 2.5 Realtime – 阶跃星辰推出的新一代实时语音大模型StepAudio 2.5 Realtime是阶跃星辰推出的新一代实时语音大模型。StepAudio 2.5 Realtime的核心定位是打造极具“活人感”的实时语音交互。该模型不仅具备行业顶级的“副...AI最新项目1个月前0740
DeepSeek-TUI – 一款开源终端AI编程工具DeepSeek-TUI一款开源终端 AI 编程工具,被开发者社区誉为 “DeepSeek版的Claude Code”。它由美国独立开发者Hunter Bown使用 Rust 语言开发,专为DeepS...AI最新项目2个月前0740
AgentScope Tuner – 为智能体应用打造的一站式自动优化引擎AgentScope Tuner是阿里通义实验室推出的、专为智能体(Agent)应用打造的一站式自动优化引擎。 它的核心目标是解决Agent开发中“训练效果好,但上线效果差”的难题,通过一个统一的平台...AI最新项目2个月前0740
FIPO – 阿里巴巴通义最新发布的大模型强化学习算法FIPO是阿里巴巴通义实验室(Qwen Team)最新发布的大模型强化学习算法。 它的全称是Future-KL Influenced Policy Optimization(未来KL散度影响策略优化...AI最新项目2个月前0740
小米XLA大模型 – 小米智能驾驶领域研发的一款端到端认知大模型小米XLA大模型是小米集团专为智能驾驶领域研发的一款端到端认知大模型,是其HAD(Hyper Autonomous Driving,小米超级智能驾驶)系统的核心技术升级。 它的核心突破在于首次将“辅助...AI最新项目3个月前0740
小米大模型MiMo-V2-Pro技术详解MiMo-V2-Pro 是小米公司于2026年3月19日 正式发布的面向Agent(智能体)时代 的旗舰级基座大模型。该模型专为现实世界中高强度、复杂的智能体工作场景打造,在性能、架构和成本效益上均取...AI最新项目# MiMo-V23个月前0740
General365 – 美团LongCat团队开源通用推理新评测基准General365是由美团LongCat团队在2026年4月底发布,并于5月中旬正式开源的一个专注于评估大模型通用逻辑推理能力的全新评测基准。 简单来说,它是一套专门为 AI 设计的“高难度逻辑考卷...AI最新项目1个月前0730
Gemini Omni Flash – 面向视频创作的全模态对话式生成模型Gemini Omni Flash是谷歌于I/O开发者大会上发布的首款面向视频创作的全模态对话式生成模型,核心定位是通过自然语言实现多轮连贯的视频编辑,而非一次性生成。它并非单纯追求视频时长或画质,而...AI最新项目4周前0720
FlashQLA – 通义千问团队开源的一个高性能线性注意力算子库FlashQLA是通义千问团队(Qwen Team)正式开源的一个高性能线性注意力算子库。简单来说,它是专门为提升大语言模型(特别是Qwen3.5、Qwen3.6及后续系列)在处理超长文本时的训练和推...AI最新项目2个月前0720
MAI-Image-2-Efficient – 微软推出的一款文生图模型MAI-Image-2-Efficient是微软正式推出的一款低成本、高效率的文生图模型。它是微软旗舰模型 MAI-Image-2 的“轻量化”版本,专为大规模商业量产和严格成本控制的场景设计,旨在以...AI最新项目2个月前0720
混元3D世界模型 2.0 – 腾讯混元3D世界模型2.0发布腾讯混元团队正式发布并开源了混元3D世界模型 2.0 (HY-World 2.0)。这是一个多模态大模型,能够根据文字、图片、视频等输入,自动生成、重建和模拟可交互的3D世界。 它的核心突破在于,不再...AI最新项目2个月前0720
BoClaw-AI原生智能体平台(AI Agent Platform)BoClaw是博云科技推出的AI原生智能体平台,对标OpenClaw,主打极简部署、数据安全与全场景自动化。以“数据不出域、权限精细化、技能可定制”为核心,支持40+大模型与昇腾本地部署,内置36项技...AI最新项目3个月前0720
Guizang Social Card Skill – 归藏开源的AI图文排版工具Guizang Social Card Skill是由开发者 op7418(归藏)开源的AI图文排版工具,专为小红书、公众号等平台设计,核心目标是通过技术路径规避平台对 AI 生成内容的强制标识要求...AI最新项目4周前0710
Hogee – 百度智能云推出的一站式AI短剧创作平台Hogee是百度智能云推出的一站式 AI 短剧创作平台,依托OpenClaw数字员工体系,覆盖剧本、分镜、角色、配音到成片全流程。上传小说或剧本,AI自动拆解剧情、生成角色与场景图、合成视频,成本降 ...AI最新项目2个月前0710
LPM 1.0 – 米哈游蔡浩宇旗下Anuttacon发布的首个视频大模型LPM 1.0 是由米哈游创始人蔡浩宇旗下的AI公司Anuttacon发布的首个视频大模型,全称为Large Performance Model(大型表演模型)。 它的核心突破在于,不再仅仅是生成一段...AI最新项目2个月前0710
JoyAI-Echo – 京东开源的长音视频生成框架JoyAI-Echo是京东开源的长音视频生成框架,首次系统性解决长视频生成的三大行业难题(角色一致性差、声音不稳定、生成效率低),通过跨模态记忆库、对话式编辑和7.5倍推理加速技术,实现5分钟级长视频...AI最新项目3周前0700
Stable Audio3 – Stability AI正式发布的音频生成模型系列Stable Audio3.0是Stability AI正式发布的音频生成模型系列,最大突破是将专业级音乐生成时长提升至 6 分 20 秒,首次实现AI生成结构完整、旋律连贯的歌曲级内容,标志着 AI...AI最新项目1个月前0700
文心5.1 – 百度发布的新一代基础大模型文心5.1百度发布的新一代基础大模型。文心5.1核心定位是“极致效价比的搜索与智能体专家”。文心5.1在完整继承上一代(文心5.0)知识储备的基础上,通过多维弹性预训练技术,将预训练成本大幅降至业界同...AI最新项目1个月前0700
Doubao-Seed-2.0-lite – 字节豆包大模型首款全模态理解模型Doubao-Seed-2.0-lite字节跳动火山引擎推出的豆包大模型家族首款全模态理解模型。核心定位是“全模态理解与极致性价比”。不同于仅支持图文的模型,它原生支持视频、图像、音频、文本的统一理解...AI最新项目2个月前0700
Qwen3.5-0.8B – 千问团队开源的最小尺寸端侧大模型Qwen3.5-0.8B是阿里巴巴通义千问团队开源的最小尺寸端侧大模型,具备原生多模态能力,专为资源受限设备设计。 其核心价值在于以极低计算资源实现高智能密度,在移动端和边缘设备上可提供本地化、低延迟...AI最新项目4周前0690
OpenMontage – 全球首个开源由AI智能体驱动的视频制作系统OpenMontage是全球首个开源的、由AI智能体(Agentic AI)驱动的视频制作系统。简单来说,它就像一个不知疲倦的“AI 视频副导演”。它不是一个简单的“一键生成视频”的玩具,而是一个结构...AI最新项目1个月前0690
ELF – ELF及其MIT团队推出的首个连续扩散语言模型ELF(Embedded Language Flows,嵌入式语言流)是由计算机视觉领域顶级科学家何恺明及其MIT团队在2026年5月推出的首个连续扩散语言模型。 它打破了以GPT为代表的“预测下一个...AI最新项目1个月前0690
TypeNo – 专为macOS打造的开源免费中文语音输入法TypeNo是一款专为macOS打造的开源免费中文语音输入法。它主打极致隐私,所有识别均在本地完成,无需联网上传数据。操作极简,按住快捷键说话,松开即自动粘贴文字。无账号、无广告、低资源占用,是注重隐...AI最新项目3个月前0690
Cursor Composer2-下一代AI编程智能体Cursor Composer 2是2026年3月推出的AI编程智能体。它具备20万Token超大上下文,能自主拆解并执行全栈开发、重构等复杂多步任务,无需人工频繁干预。其性能接近顶尖模型,但价格大幅...AI最新项目3个月前0690
MemPrivacy – 荣耀联合同济发布端云协同AI隐私保护框架MemPrivacy是由记忆张量(MemTensor) 联合荣耀、同济大学开源的、面向端云协同AI智能体(Agent)的隐私保护框架与系列模型。 简单来说,MemPrivacy的核心作用是解决AI越来...AI最新项目1个月前0680
Ling-2.6-1T – 蚂蚁百灵开源的一款万亿参数级旗舰大模型Ling-2.6-1T是蚂蚁集团百灵大模型团队开源的一款万亿参数级旗舰大模型。它最大的特点是不盲目追求“慢思考”式的长推理链,而是独创了“快思考”机制,旨在以极低的计算成本实现高效的复杂任务执行。其综...AI最新项目2个月前0680
SenseNova-Skills – 商汤科技开源的办公场景AI工具库SenseNova-Skills是商汤科技(SenseTime)开源的一套面向高频办公场景的AI技能工具库。 简单来说,如果把大模型(LLM)比作一个聪明的“大脑”,那么SenseNova-Skill...AI最新项目1个月前0670