GitNexus – 专为AI智能体设计的代码库知识图谱构建工具
GitNexus是专为AI智能体设计的代码库知识图谱构建工具,核心功能是将代码库的依赖关系、调用链和架构逻辑预计算为结构化知识图谱,使AI编程助手能精准理解代码上下文,避免盲目修改导致破坏性变更。 通...
BrowserAct Skills – 专为AI智能体设计的浏览器自动化工具集
BrowserAct Skills是专为AI智能体设计的浏览器自动化工具集,核心能力是让AI像人类一样稳定操作真实网页环境。它通过隐身浏览器技术+AI动态决策解决传统自动化工具的致命缺陷——能自动绕过...
Microsoft Scout – 微软开发者大会上推出的首款个人AI同事
Microsoft Scout是微软开发者大会上推出的首款"真正意义的个人AI同事",具备独立身份、能主动接管高频低价值职场任务的自治式智能体。 深度嵌入Microsoft 365生态,以Teams联...
Ideogram 4 – Ideogram公司发布的开源文生图模型
Ideogram 4.0是Ideogram公司于2026年6月3日发布的93亿参数开源文生图模型,最大突破在于通过单流架构实现像素级排版控制能力,使AI生图从随机“抽卡”转向可精准指定文字位置、对象布...
Gemma 4 12B – 谷歌DeepMind发布的统一多模态模型
Gemma 4 12B是谷歌DeepMind于2026年6月4日发布的120亿参数统一多模态模型,最大突破在于通过无编码器架构实现仅需16GB内存的消费级笔记本即可本地运行完整多模态AI能力(支持文本...
Kimi Work – 月之暗面推出的本地桌面AI智能体
Kimi Work是月之暗面推出的本地桌面AI智能体,依托Kimi Code引擎,适配Windows、Mac客户端。依托自然语言下达指令即可自动拆分任务、本地执行操作,支持网页抓取、文件管理、多格式文...
JoyAI-Echo – 京东开源的长音视频生成框架
JoyAI-Echo是京东开源的长音视频生成框架,首次系统性解决长视频生成的三大行业难题(角色一致性差、声音不稳定、生成效率低),通过跨模态记忆库、对话式编辑和7.5倍推理加速技术,实现5分钟级长视频...
MAI-Code-1-Flash – 微软发布的首款自研轻量级代码生成模型
MAI-Code-1-Flash是微软发布的首款自研轻量级代码生成模型,专为开发者日常编码场景设计,采用50亿参数的紧凑架构,通过自适应推理预算分配技术实现高效率与低成本的平衡。 其核心价值在于将Ag...
MAI Transcribe-1.5 – 微软发布的升级版语音转文字(ASR)模型
MAI-Transcribe-1.5是微软于2026年6月发布的升级版语音转文字(ASR)模型,作为MAI系列自研模型的重要迭代,在43种语言支持、专业术语识别精度和处理速度上实现突破性提升,批量转录...
Bernini – 字节跳动开源的统一视频生成与编辑框架
Bernini是字节跳动于2026年6月正式开源的统一视频生成与编辑框架,首创“语义规划+视觉渲染”的两阶段解耦架构,通过让AI先理解指令逻辑再生成画面,显著提升视频编辑的可控性与稳定性,解决传统模型...









