AI最新项目-前沿AI产品功能特色全解析 - 第6页

AI资讯 AI世界漫游指南 AI知识探索库 AI学习教程 AI最新项目

排序

发布更新浏览点赞

FreeLLMAPI – 开源,OpenAI兼容的LLM聚合网关

FreeLLMAPI(简称 FreeLLM) 是一个开源、OpenAI兼容的LLM聚合网关，把多家免费大模型 API(Groq、Gemini、Mistral、Cerebras、NVIDIA NIM、C...

AI最新项目

4周前

01420

Octask – MagicLight团队推出的AI内容创作工作台

Octask是MagicLight团队推出的AI内容创作工作台，定位 “个人AI内容公司”，2026年5月启动内测。它聚合文案、作图、视频、排版、复盘等多角色数字员工，支持自定义人设、记忆与协作流程...

AI最新项目

4周前

0610

Qwen3-ASR-1.7B – 千问团队开源的多语言语音识别模型

Qwen3-ASR-1.7B是阿里云通义千问团队开源的17亿参数多语言语音识别模型，在中文、英文等52种语言及方言的识别任务中达到开源模型SOTA水平(中文词错率低至5.2%，显著优于Whisper...

AI最新项目

1个月前

0890

Hermes Agent – Nous Research开源的自进化AI智能体框架

Hermes Agent是由美国硅谷AI实验室Nous Research于2026年2月开源的自进化AI智能体框架，核心特点是通过内置学习闭环系统自动沉淀经验为可复用技能，实现“越用越懂用户”的长期陪...

AI最新项目

1个月前

0920

SenseNovaU1 – 商汤科技开源的原生理解生成统一模型

SenseNova U1是商汤科技开源的原生理解生成统一模型，其核心突破在于通过NEO-unify架构彻底摒弃传统多模态模型的拼接式设计，在单一模型中直接统一语言与视觉的理解、推理与生成能力，避免了模...

AI最新项目

1个月前

0660

Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别基座模型

Mega-ASR 是新加坡国立大学、南洋理工大学与上海人工智能实验室等团队于2026年5月联合开源的全场景鲁棒语音识别基座模型，基于Qwen3-ASR 1.7B架构，通过声学仿真规模化训练与强化学习优...

AI最新项目

1个月前

0620

CodeGraph – 本地化的代码知识图谱工具

CodeGraph是一个本地化的代码知识图谱工具，专为优化AI编程助手(如Claude Code、Cursor等)的代码理解效率而设计。它通过预构建项目代码的语义关系图谱，将AI从重复的文件扫描中解放...

AI最新项目

1个月前

01200

SenseNova-Skills – 商汤科技开源的办公场景AI工具库

SenseNova-Skills是商汤科技(SenseTime)开源的一套面向高频办公场景的AI技能工具库。简单来说，如果把大模型(LLM)比作一个聪明的“大脑”，那么SenseNova-Skill...

AI最新项目

1个月前

0670

LLM Council – Karpathy推出的开源多模型协作框架

LLM Council 是由Andrej Karpathy推出的开源多模型协作框架，核心是让多个大模型像 “委员会” 一样并行回答→互相评审→最终合议，输出比单模型更可靠、更低幻觉的答案。 LLM C...

AI最新项目

1个月前

0520

陪读蛙 – 一款开源的AI驱动浏览器翻译扩展

陪读蛙(Read Frog)是一款开源的AI驱动浏览器翻译扩展，核心定位是通过沉浸式双语对照与深度语言解析，帮助用户高效阅读外文内容并提升语言能力。陪读蛙并非简单翻译工具，而是结合AI技术提供语法分...

AI最新项目

1个月前

0500

GLM-5.1-highspeed – 智谱推出的旗舰级大模型高速版API

GLM-5.1-highspeed是智谱(Zhipu AI)于2026年5月22日推出的旗舰级大模型高速版API，其输出速度达到400 tokens/s，刷新全球大模型厂商API的速度上限，并首次在国...

AI最新项目

1个月前

0520

Confucius4 – 网易有道推出的“子曰”大模型4.0版本

Confucius4是网易有道推出的“子曰”大模型4.0版本，核心为面向教育场景的27B参数多模态模型与支持14种语言的零样本语音合成（TTS）模型，已于2026年5月22日面向全球全量开源。其技术亮...

AI最新项目

1个月前

0630

autoresearch – Andrej Karpathy开源的AI自主研究框架

autoresearch是Andrej Karpathy开源的AI自主研究框架，核心目标是让AI智能体完全替代人类执行模型训练实验的循环优化过程。其设计极为精简，通过固定5分钟实验时长、单一评估指标...

AI最新项目

1个月前

01040

LongCat-Video-Avatar 1.5 – 美团开源的虚拟人视频生成模型

LongCat-Video-Avatar 1.5是美团龙猫团队开源的商用级虚拟人视频生成模型升级版本，在动作拟真度、长视频稳定性与身份一致性三大核心维度实现突破性升级，首次在多项关键指标上全面超越主流...

AI最新项目

1个月前

0630

Stable Audio3 – Stability AI正式发布的音频生成模型系列

Stable Audio3.0是Stability AI正式发布的音频生成模型系列，最大突破是将专业级音乐生成时长提升至 6 分 20 秒，首次实现AI生成结构完整、旋律连贯的歌曲级内容，标志着 AI...

AI最新项目

1个月前

0700

Hy-MT2 – 腾讯混元团队开源的新一代翻译大模型家族

腾讯混元团队开源的Hy-MT2是新一代多语言翻译大模型家族，包含1.8B、7B、30B-A3B三种尺寸，支持33种语言互译及5种民族语言/方言翻译，核心突破在于通过1.25-bit极端量化技术将轻量级...

AI最新项目

1个月前

0790

CloudDM – ClouGence开发的开源数据库统一管理平台

CloudDM是由开云集致(ClouGence)开发的开源数据库统一管理平台，基于Apache 2.0协议全面开放所有功能，核心解决多源数据库的查询、变更审批与权限管控问题，支持 30+ 种数据源的统...

AI最新项目

1个月前

0500

ZCube – 智谱联合清华大学开发的新型AI集群网络架构

ZCube是由智谱联合清华大学、驭驯网络开发的新型AI集群网络架构，专为解决大模型推理场景中的结构性网络拥塞问题而设计。其核心突破在于彻底重构网络拓扑，通过取消传统Clos架构的Spine层、采用扁...

AI最新项目

1个月前

0500

HyperEyes – 小红书研究团队提出的并行多模态搜索智能体

HyperEyes是由小红书研究团队提出的并行多模态搜索智能体，通过重构动作空间、数据合成与强化学习框架，解决了传统多模态搜索中“串行调用”导致的效率低下问题，实现了单次交互内对图片中多个目标的并发定...

AI最新项目

1个月前

0560

Agora-1 – Odyssey发布的多人实时互动的AI世界模型

Agora-1是由AI初创公司Odyssey发布的全球首个支持多人实时互动的AI世界模型，其核心突破在于实现了人类与 AI 智能体在同一个动态生成的虚拟环境中同步交互，而非传统单人体验的静态生成内容...

AI最新项目

1个月前

0500

Lance – 字节跳动推出的原生统一的多模态模型

Lance 是字节跳动推出的一个原生统一的多模态模型。它是一个参数量为 30亿（3B）的研究性项目，旨在打破图像和视频在理解、生成、编辑任务上的壁垒。与许多需要针对不同任务单独微调的模型不同，La...

AI最新项目

1个月前

0840

HiDream-O1-Image-Pro – 智象未来发布的图像生成大模型

HiDream-O1-Image-Pro是智象未来发布的超2000亿参数原生全模态图像生成大模型，采用全球首创的像素级统一Transformer(UiT)架构，彻底摒弃传统VAE压缩与独立文本编码器...

AI最新项目

1个月前

0790

Qwen3.5-LiveTranslate – 阿里通义发布的实时语音翻译模型

Qwen3.5-LiveTranslate是阿里通义千问发布的实时语音翻译模型，核心突破在于实现2.8秒端到端字均延迟、支持60种语言输入与29种语言语音输出，并通过多模态技术保留说话人原声音色与情绪...

AI最新项目

1个月前

0610

Qwen3.7-Max – 阿里巴巴发布的千问系列新一代旗舰大模型

Qwen3.7-Max是阿里巴巴发布的千问系列新一代旗舰大模型，核心定位为面向智能体（Agent）时代的全能基座模型，其最大突破在于无需人工干预即可自主完成超长周期复杂任务(如35小时连续工作、115...

AI最新项目

1个月前

0640

Google Pics – 谷歌推出的AI驱动设计与图像生成工具

Google Pics是谷歌推出的原生集成于Google Workspace的AI驱动设计与图像生成工具，核心目标是将图像生成与精细化编辑整合至同一工作流，让用户无需专业设计技能即可完成从创作到微调的...

AI最新项目

1个月前

0550

Gemini Omni Flash – 面向视频创作的全模态对话式生成模型

Gemini Omni Flash是谷歌于I/O开发者大会上发布的首款面向视频创作的全模态对话式生成模型，核心定位是通过自然语言实现多轮连贯的视频编辑，而非一次性生成。它并非单纯追求视频时长或画质，而...

AI最新项目

4周前

0720

Gemini Spark – 谷歌发布的首个全天候运行的个人AI智能体

Gemini Spark是谷歌发布的首个全天候运行的个人AI智能体，其核心突破在于无需用户持续在线即可自主执行跨应用任务(如整理邮件、规划行程、监控账单)，且任务在用户关闭设备后仍能在云端持续运行。与...

AI最新项目

1个月前

0450

Gemini 3.5 Flash – 谷歌发布的轻量级AI模型

Gemini 3.5 Flash是谷歌于2026年5月20日在I/O开发者大会上发布的轻量级AI模型，在保持Flash系列高速响应特性的同时，其智能体与编程能力已全面超越上一代旗舰Gemini 3.1...

AI最新项目

1个月前

0560

Qwen3.7 Preview – 最新一代旗舰大模型预览版

Qwen3.7 Preview(通义千问3.7预览版)是阿里巴巴在2026年5月19日深夜至20日阿里云峰会期间，正式对外亮相的最新一代旗舰大模型预览版。这次发布采用了“双模型”策略，分别推出了主打...

AI最新项目

1个月前

0990

ESP-Claw – 乐鑫推出的物联网AI智能体框架

ESP-Claw(代号“龙虾”)是乐鑫在2026年4月至5月期间正式推出的物联网AI智能体框架。简单来说，它彻底打破了传统物联网设备“只能被动执行指令”的局限，将AI智能体(Agent)直接部署到了...

AI最新项目

1个月前

0530

加载更多