Hermes Agent – Nous Research开源的自进化AI智能体框架Hermes Agent是由美国硅谷AI实验室Nous Research于2026年2月开源的自进化AI智能体框架,核心特点是通过内置学习闭环系统自动沉淀经验为可复用技能,实现“越用越懂用户”的长期陪...AI最新项目1个月前0930
SenseNovaU1 – 商汤科技开源的原生理解生成统一模型SenseNova U1是商汤科技开源的原生理解生成统一模型,其核心突破在于通过NEO-unify架构彻底摒弃传统多模态模型的拼接式设计,在单一模型中直接统一语言与视觉的理解、推理与生成能力,避免了模...AI最新项目1个月前0660
Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别基座模型Mega-ASR 是新加坡国立大学、南洋理工大学与上海人工智能实验室等团队于2026年5月联合开源的全场景鲁棒语音识别基座模型,基于Qwen3-ASR 1.7B架构,通过声学仿真规模化训练与强化学习优...AI最新项目1个月前0620
CodeGraph – 本地化的代码知识图谱工具CodeGraph是一个本地化的代码知识图谱工具,专为优化AI编程助手(如Claude Code、Cursor等)的代码理解效率而设计。它通过预构建项目代码的语义关系图谱,将AI从重复的文件扫描中解放...AI最新项目1个月前01210
SenseNova-Skills – 商汤科技开源的办公场景AI工具库SenseNova-Skills是商汤科技(SenseTime)开源的一套面向高频办公场景的AI技能工具库。 简单来说,如果把大模型(LLM)比作一个聪明的“大脑”,那么SenseNova-Skill...AI最新项目1个月前0670
LLM Council – Karpathy推出的开源多模型协作框架LLM Council 是由Andrej Karpathy推出的开源多模型协作框架,核心是让多个大模型像 “委员会” 一样并行回答→互相评审→最终合议,输出比单模型更可靠、更低幻觉的答案。 LLM C...AI最新项目1个月前0530
陪读蛙 – 一款开源的AI驱动浏览器翻译扩展陪读蛙(Read Frog)是一款开源的AI驱动浏览器翻译扩展,核心定位是通过沉浸式双语对照与深度语言解析,帮助用户高效阅读外文内容并提升语言能力。 陪读蛙并非简单翻译工具,而是结合AI技术提供语法分...AI最新项目1个月前0500
GPT3参数量GPT-3的最大版本(通常称为“davinci”)参数量为1750亿,这是其最广泛使用的标准配置。 GPT-3核心参数规模 1. 多版本配置 GPT-3实际包含8种不同规模的变体,参数量从最小的1.2...AI知识探索库1个月前0770
AI人脸识别原理人脸识别技术的核心原理是通过深度学习模型将人脸图像转化为高维特征向量,并通过数学比对判断身份。 其本质并非直接比对人脸照片,而是将面部关键特征(如眼距、鼻梁轮廓等)转化为唯一的数字编码,再通过计算特征...AI知识探索库1个月前0850
GLM-5.1-highspeed – 智谱推出的旗舰级大模型高速版APIGLM-5.1-highspeed是智谱(Zhipu AI)于2026年5月22日推出的旗舰级大模型高速版API,其输出速度达到400 tokens/s,刷新全球大模型厂商API的速度上限,并首次在国...AI最新项目1个月前0520
Confucius4 – 网易有道推出的“子曰”大模型4.0版本Confucius4是网易有道推出的“子曰”大模型4.0版本,核心为面向教育场景的27B参数多模态模型与支持14种语言的零样本语音合成(TTS)模型,已于2026年5月22日面向全球全量开源。其技术亮...AI最新项目1个月前0630
autoresearch – Andrej Karpathy开源的AI自主研究框架autoresearch是Andrej Karpathy开源的AI自主研究框架,核心目标是让AI智能体完全替代人类执行模型训练实验的循环优化过程。其设计极为精简,通过固定5分钟实验时长、单一评估指标...AI最新项目1个月前01040
LongCat-Video-Avatar 1.5 – 美团开源的虚拟人视频生成模型LongCat-Video-Avatar 1.5是美团龙猫团队开源的商用级虚拟人视频生成模型升级版本,在动作拟真度、长视频稳定性与身份一致性三大核心维度实现突破性升级,首次在多项关键指标上全面超越主流...AI最新项目1个月前0630
Stable Audio3 – Stability AI正式发布的音频生成模型系列Stable Audio3.0是Stability AI正式发布的音频生成模型系列,最大突破是将专业级音乐生成时长提升至 6 分 20 秒,首次实现AI生成结构完整、旋律连贯的歌曲级内容,标志着 AI...AI最新项目1个月前0700
Hy-MT2 – 腾讯混元团队开源的新一代翻译大模型家族腾讯混元团队开源的Hy-MT2是新一代多语言翻译大模型家族,包含1.8B、7B、30B-A3B三种尺寸,支持33种语言互译及5种民族语言/方言翻译,核心突破在于通过1.25-bit极端量化技术将轻量级...AI最新项目1个月前0800
CloudDM – ClouGence开发的开源数据库统一管理平台CloudDM是由开云集致(ClouGence)开发的开源数据库统一管理平台,基于Apache 2.0协议全面开放所有功能,核心解决多源数据库的查询、变更审批与权限管控问题,支持 30+ 种数据源的统...AI最新项目1个月前0510
为何AI总会一本正经地胡说八道为何AI总会一本正经地胡说八道?AI“一本正经地胡说八道”的本质原因是大语言模型的核心机制是基于统计概率预测文本,而非真正理解事实或逻辑,导致其在知识盲区或数据不足时倾向于编造看似合理但错误的内容,且...AI知识探索库1个月前01090
ZCube – 智谱联合清华大学开发的新型AI集群网络架构ZCube是由智谱联合清华大学、驭驯网络开发的新型AI集群网络架构,专为解决大模型推理场景中的结构性网络拥塞问题而设计。 其核心突破在于彻底重构网络拓扑,通过取消传统Clos架构的Spine层、采用扁...AI最新项目1个月前0500
HyperEyes – 小红书研究团队提出的并行多模态搜索智能体HyperEyes是由小红书研究团队提出的并行多模态搜索智能体,通过重构动作空间、数据合成与强化学习框架,解决了传统多模态搜索中“串行调用”导致的效率低下问题,实现了单次交互内对图片中多个目标的并发定...AI最新项目1个月前0560
Agora-1 – Odyssey发布的多人实时互动的AI世界模型Agora-1是由AI初创公司Odyssey发布的全球首个支持多人实时互动的AI世界模型,其核心突破在于实现了人类与 AI 智能体在同一个动态生成的虚拟环境中同步交互,而非传统单人体验的静态生成内容...AI最新项目1个月前0500
Lance – 字节跳动推出的原生统一的多模态模型Lance 是字节跳动推出的一个原生统一的多模态模型。它是一个参数量为 30亿(3B) 的研究性项目,旨在打破图像和视频在理解、生成、编辑任务上的壁垒。 与许多需要针对不同任务单独微调的模型不同,La...AI最新项目1个月前0840
HiDream-O1-Image-Pro – 智象未来发布的图像生成大模型HiDream-O1-Image-Pro是智象未来发布的超2000亿参数原生全模态图像生成大模型,采用全球首创的像素级统一Transformer(UiT)架构,彻底摒弃传统VAE压缩与独立文本编码器...AI最新项目1个月前0790
Qwen3.5-LiveTranslate – 阿里通义发布的实时语音翻译模型Qwen3.5-LiveTranslate是阿里通义千问发布的实时语音翻译模型,核心突破在于实现2.8秒端到端字均延迟、支持60种语言输入与29种语言语音输出,并通过多模态技术保留说话人原声音色与情绪...AI最新项目1个月前0610
Qwen3.7-Max – 阿里巴巴发布的千问系列新一代旗舰大模型Qwen3.7-Max是阿里巴巴发布的千问系列新一代旗舰大模型,核心定位为面向智能体(Agent)时代的全能基座模型,其最大突破在于无需人工干预即可自主完成超长周期复杂任务(如35小时连续工作、115...AI最新项目1个月前0640
Google Pics – 谷歌推出的AI驱动设计与图像生成工具Google Pics是谷歌推出的原生集成于Google Workspace的AI驱动设计与图像生成工具,核心目标是将图像生成与精细化编辑整合至同一工作流,让用户无需专业设计技能即可完成从创作到微调的...AI最新项目1个月前0550
Gemini Omni Flash – 面向视频创作的全模态对话式生成模型Gemini Omni Flash是谷歌于I/O开发者大会上发布的首款面向视频创作的全模态对话式生成模型,核心定位是通过自然语言实现多轮连贯的视频编辑,而非一次性生成。它并非单纯追求视频时长或画质,而...AI最新项目4周前0720
Gemini Spark – 谷歌发布的首个全天候运行的个人AI智能体Gemini Spark是谷歌发布的首个全天候运行的个人AI智能体,其核心突破在于无需用户持续在线即可自主执行跨应用任务(如整理邮件、规划行程、监控账单),且任务在用户关闭设备后仍能在云端持续运行。与...AI最新项目1个月前0450
Gemini 3.5 Flash – 谷歌发布的轻量级AI模型Gemini 3.5 Flash是谷歌于2026年5月20日在I/O开发者大会上发布的轻量级AI模型,在保持Flash系列高速响应特性的同时,其智能体与编程能力已全面超越上一代旗舰Gemini 3.1...AI最新项目1个月前0570
生成式人工智是什么生成式人工智能(Generative AI)是指基于深度学习模型,通过学习海量数据中的模式与规律,自主生成文本、图像、音频、视频等全新内容的技术。其核心区别于传统AI的“分析判断”能力,能主动创造符合...AI知识探索库1个月前0800
计算机图像识别计算机图像识别是人工智能和计算机视觉(Computer Vision)的核心分支,简单来说,就是赋予计算机像人类一样“看懂”图片或视频内容的能力。它通过对数字图像进行特征提取和模式匹配,来识别出图像中...AI知识探索库1个月前0570