AI深识站
  • AI软件
  • AI资讯
  • AI世界漫游指南
    • AI知识探索库
    • AI学习教程
  • AI最新项目
  • 排行榜
      • 未登录
        登录后即可体验更多功能
    • AI软件
    • AI资讯
    • AI世界漫游指南
      • AI知识探索库
      • AI学习教程
    • AI最新项目
    • 排行榜
    未登录
    登录后即可体验更多功能

    AI最新项目

    共 288 篇文章
    AI资讯AI世界漫游指南AI知识探索库AI学习教程AI最新项目
    排序
    发布更新浏览点赞
    FreeLLMAPI – 开源,OpenAI兼容的LLM聚合网关

    FreeLLMAPI – 开源,OpenAI兼容的LLM聚合网关

    FreeLLMAPI(简称 FreeLLM) 是一个开源、OpenAI兼容的LLM聚合网关,把多家免费大模型 API(Groq、Gemini、Mistral、Cerebras、NVIDIA NIM、C...
    AI最新项目
    文明旁观者的头像4周前
    01420
    Octask – MagicLight团队推出的AI内容创作工作台

    Octask – MagicLight团队推出的AI内容创作工作台

    Octask是MagicLight团队推出的AI内容创作工作台,定位 “个人AI内容公司”,2026年5月启动内测。它聚合文案、作图、视频、排版、复盘等多角色数字员工,支持自定义人设、记忆与协作流程...
    AI最新项目
    文明旁观者的头像4周前
    0610
    Qwen3-ASR-1.7B – 千问团队开源的多语言语音识别模型

    Qwen3-ASR-1.7B – 千问团队开源的多语言语音识别模型

    Qwen3-ASR-1.7B是阿里云通义千问团队开源的17亿参数多语言语音识别模型,在中文、英文等52种语言及方言的识别任务中达到开源模型SOTA水平(中文词错率低至5.2%,显著优于Whisper...
    AI最新项目
    文明旁观者的头像1个月前
    0890
    Hermes Agent – Nous Research开源的自进化AI智能体框架

    Hermes Agent – Nous Research开源的自进化AI智能体框架

    Hermes Agent是由美国硅谷AI实验室Nous Research于2026年2月开源的自进化AI智能体框架,核心特点是通过内置学习闭环系统自动沉淀经验为可复用技能,实现“越用越懂用户”的长期陪...
    AI最新项目
    文明旁观者的头像1个月前
    0920
    SenseNovaU1 – 商汤科技开源的原生理解生成统一模型

    SenseNovaU1 – 商汤科技开源的原生理解生成统一模型

    SenseNova U1是商汤科技开源的原生理解生成统一模型,其核心突破在于通过NEO-unify架构彻底摒弃传统多模态模型的拼接式设计,在单一模型中直接统一语言与视觉的理解、推理与生成能力,避免了模...
    AI最新项目
    文明旁观者的头像1个月前
    0660
    Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别基座模型

    Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别基座模型

    Mega-ASR 是新加坡国立大学、南洋理工大学与上海人工智能实验室等团队于2026年5月联合开源的全场景鲁棒语音识别基座模型,基于Qwen3-ASR 1.7B架构,通过声学仿真规模化训练与强化学习优...
    AI最新项目
    文明旁观者的头像1个月前
    0620
    CodeGraph – 本地化的代码知识图谱工具

    CodeGraph – 本地化的代码知识图谱工具

    CodeGraph是一个本地化的代码知识图谱工具,专为优化AI编程助手(如Claude Code、Cursor等)的代码理解效率而设计。它通过预构建项目代码的语义关系图谱,将AI从重复的文件扫描中解放...
    AI最新项目
    文明旁观者的头像1个月前
    01200
    SenseNova-Skills – 商汤科技开源的办公场景AI工具库

    SenseNova-Skills – 商汤科技开源的办公场景AI工具库

    SenseNova-Skills是商汤科技(SenseTime)开源的一套面向高频办公场景的AI技能工具库。 简单来说,如果把大模型(LLM)比作一个聪明的“大脑”,那么SenseNova-Skill...
    AI最新项目
    文明旁观者的头像1个月前
    0670
    LLM Council – Karpathy推出的开源多模型协作框架

    LLM Council – Karpathy推出的开源多模型协作框架

    LLM Council 是由Andrej Karpathy推出的开源多模型协作框架,核心是让多个大模型像 “委员会” 一样并行回答→互相评审→最终合议,输出比单模型更可靠、更低幻觉的答案。 LLM C...
    AI最新项目
    文明旁观者的头像1个月前
    0520
    陪读蛙 – 一款开源的AI驱动浏览器翻译扩展

    陪读蛙 – 一款开源的AI驱动浏览器翻译扩展

    陪读蛙(Read Frog)是一款开源的AI驱动浏览器翻译扩展,核心定位是通过沉浸式双语对照与深度语言解析,帮助用户高效阅读外文内容并提升语言能力。 陪读蛙并非简单翻译工具,而是结合AI技术提供语法分...
    AI最新项目
    文明旁观者的头像1个月前
    0500
    GLM-5.1-highspeed – 智谱推出的旗舰级大模型高速版API

    GLM-5.1-highspeed – 智谱推出的旗舰级大模型高速版API

    GLM-5.1-highspeed是智谱(Zhipu AI)于2026年5月22日推出的旗舰级大模型高速版API,其输出速度达到400 tokens/s,刷新全球大模型厂商API的速度上限,并首次在国...
    AI最新项目
    文明旁观者的头像1个月前
    0520
    Confucius4 – 网易有道推出的“子曰”大模型4.0版本

    Confucius4 – 网易有道推出的“子曰”大模型4.0版本

    Confucius4是网易有道推出的“子曰”大模型4.0版本,核心为面向教育场景的27B参数多模态模型与支持14种语言的零样本语音合成(TTS)模型,已于2026年5月22日面向全球全量开源。其技术亮...
    AI最新项目
    文明旁观者的头像1个月前
    0630
    autoresearch – Andrej Karpathy开源的AI自主研究框架

    autoresearch – Andrej Karpathy开源的AI自主研究框架

    autoresearch是Andrej Karpathy开源的AI自主研究框架,核心目标是让AI智能体完全替代人类执行模型训练实验的循环优化过程。其设计极为精简,通过固定5分钟实验时长、单一评估指标...
    AI最新项目
    文明旁观者的头像1个月前
    01040
    LongCat-Video-Avatar 1.5 – 美团开源的虚拟人视频生成模型

    LongCat-Video-Avatar 1.5 – 美团开源的虚拟人视频生成模型

    LongCat-Video-Avatar 1.5是美团龙猫团队开源的商用级虚拟人视频生成模型升级版本,在动作拟真度、长视频稳定性与身份一致性三大核心维度实现突破性升级,首次在多项关键指标上全面超越主流...
    AI最新项目
    文明旁观者的头像1个月前
    0630
    Stable Audio3 – Stability AI正式发布的音频生成模型系列

    Stable Audio3 – Stability AI正式发布的音频生成模型系列

    Stable Audio3.0是Stability AI正式发布的音频生成模型系列,最大突破是将专业级音乐生成时长提升至 6 分 20 秒,首次实现AI生成结构完整、旋律连贯的歌曲级内容,标志着 AI...
    AI最新项目
    文明旁观者的头像1个月前
    0700
    Hy-MT2 – 腾讯混元团队开源的新一代翻译大模型家族

    Hy-MT2 – 腾讯混元团队开源的新一代翻译大模型家族

    腾讯混元团队开源的Hy-MT2是新一代多语言翻译大模型家族,包含1.8B、7B、30B-A3B三种尺寸,支持33种语言互译及5种民族语言/方言翻译,核心突破在于通过1.25-bit极端量化技术将轻量级...
    AI最新项目
    文明旁观者的头像1个月前
    0790
    CloudDM – ClouGence开发的开源数据库统一管理平台

    CloudDM – ClouGence开发的开源数据库统一管理平台

    CloudDM是由开云集致(ClouGence)开发的开源数据库统一管理平台,基于Apache 2.0协议全面开放所有功能,核心解决多源数据库的查询、变更审批与权限管控问题,支持 30+ 种数据源的统...
    AI最新项目
    文明旁观者的头像1个月前
    0500
    ZCube – 智谱联合清华大学开发的新型AI集群网络架构

    ZCube – 智谱联合清华大学开发的新型AI集群网络架构

    ZCube是由智谱联合清华大学、驭驯网络开发的新型AI集群网络架构,专为解决大模型推理场景中的结构性网络拥塞问题而设计。 其核心突破在于彻底重构网络拓扑,通过取消传统Clos架构的Spine层、采用扁...
    AI最新项目
    文明旁观者的头像1个月前
    0500
    HyperEyes – 小红书研究团队提出的并行多模态搜索智能体

    HyperEyes – 小红书研究团队提出的并行多模态搜索智能体

    HyperEyes是由小红书研究团队提出的并行多模态搜索智能体,通过重构动作空间、数据合成与强化学习框架,解决了传统多模态搜索中“串行调用”导致的效率低下问题,实现了单次交互内对图片中多个目标的并发定...
    AI最新项目
    文明旁观者的头像1个月前
    0560
    Agora-1 – Odyssey发布的多人实时互动的AI世界模型

    Agora-1 – Odyssey发布的多人实时互动的AI世界模型

    Agora-1是由AI初创公司Odyssey发布的全球首个支持多人实时互动的AI世界模型,其核心突破在于实现了人类与 AI 智能体在同一个动态生成的虚拟环境中同步交互,而非传统单人体验的静态生成内容...
    AI最新项目
    文明旁观者的头像1个月前
    0500
    Lance – 字节跳动推出的原生统一的多模态模型

    Lance – 字节跳动推出的原生统一的多模态模型

    Lance 是字节跳动推出的一个原生统一的多模态模型。它是一个参数量为 30亿(3B) 的研究性项目,旨在打破图像和视频在理解、生成、编辑任务上的壁垒。 与许多需要针对不同任务单独微调的模型不同,La...
    AI最新项目
    文明旁观者的头像1个月前
    0840
    HiDream-O1-Image-Pro – 智象未来发布的图像生成大模型

    HiDream-O1-Image-Pro – 智象未来发布的图像生成大模型

    HiDream-O1-Image-Pro是智象未来发布的超2000亿参数原生全模态图像生成大模型,采用全球首创的像素级统一Transformer(UiT)架构,彻底摒弃传统VAE压缩与独立文本编码器...
    AI最新项目
    文明旁观者的头像1个月前
    0790
    Qwen3.5-LiveTranslate – 阿里通义发布的实时语音翻译模型

    Qwen3.5-LiveTranslate – 阿里通义发布的实时语音翻译模型

    Qwen3.5-LiveTranslate是阿里通义千问发布的实时语音翻译模型,核心突破在于实现2.8秒端到端字均延迟、支持60种语言输入与29种语言语音输出,并通过多模态技术保留说话人原声音色与情绪...
    AI最新项目
    文明旁观者的头像1个月前
    0610
    Qwen3.7-Max – 阿里巴巴发布的千问系列新一代旗舰大模型

    Qwen3.7-Max – 阿里巴巴发布的千问系列新一代旗舰大模型

    Qwen3.7-Max是阿里巴巴发布的千问系列新一代旗舰大模型,核心定位为面向智能体(Agent)时代的全能基座模型,其最大突破在于无需人工干预即可自主完成超长周期复杂任务(如35小时连续工作、115...
    AI最新项目
    文明旁观者的头像1个月前
    0640
    Google Pics – 谷歌推出的AI驱动设计与图像生成工具

    Google Pics – 谷歌推出的AI驱动设计与图像生成工具

    Google Pics是谷歌推出的原生集成于Google Workspace的AI驱动设计与图像生成工具,核心目标是将图像生成与精细化编辑整合至同一工作流,让用户无需专业设计技能即可完成从创作到微调的...
    AI最新项目
    文明旁观者的头像1个月前
    0550
    Gemini Omni Flash – 面向视频创作的全模态对话式生成模型

    Gemini Omni Flash – 面向视频创作的全模态对话式生成模型

    Gemini Omni Flash是谷歌于I/O开发者大会上发布的首款面向视频创作的全模态对话式生成模型,核心定位是通过自然语言实现多轮连贯的视频编辑,而非一次性生成。它并非单纯追求视频时长或画质,而...
    AI最新项目
    文明旁观者的头像4周前
    0720
    Gemini Spark – 谷歌发布的首个全天候运行的个人AI智能体

    Gemini Spark – 谷歌发布的首个全天候运行的个人AI智能体

    Gemini Spark是谷歌发布的首个全天候运行的个人AI智能体,其核心突破在于无需用户持续在线即可自主执行跨应用任务(如整理邮件、规划行程、监控账单),且任务在用户关闭设备后仍能在云端持续运行。与...
    AI最新项目
    文明旁观者的头像1个月前
    0450
    Gemini 3.5 Flash – 谷歌发布的轻量级AI模型

    Gemini 3.5 Flash – 谷歌发布的轻量级AI模型

    Gemini 3.5 Flash是谷歌于2026年5月20日在I/O开发者大会上发布的轻量级AI模型,在保持Flash系列高速响应特性的同时,其智能体与编程能力已全面超越上一代旗舰Gemini 3.1...
    AI最新项目
    文明旁观者的头像1个月前
    0560
    Qwen3.7 Preview – 最新一代旗舰大模型预览版

    Qwen3.7 Preview – 最新一代旗舰大模型预览版

    Qwen3.7 Preview(通义千问3.7预览版)是阿里巴巴在2026年5月19日深夜至20日阿里云峰会期间,正式对外亮相的最新一代旗舰大模型预览版。 这次发布采用了“双模型”策略,分别推出了主打...
    AI最新项目
    文明旁观者的头像1个月前
    0990
    ESP-Claw – 乐鑫推出的物联网AI智能体框架

    ESP-Claw – 乐鑫推出的物联网AI智能体框架

    ESP-Claw(代号“龙虾”)是乐鑫在2026年4月至5月期间正式推出的物联网AI智能体框架。 简单来说,它彻底打破了传统物联网设备“只能被动执行指令”的局限,将AI智能体(Agent)直接部署到了...
    AI最新项目
    文明旁观者的头像1个月前
    0530
    加载更多
    AI深识站
    AI深识站——国内外优质AI工具导航平台,收录AI写作、绘画、办公、音视频等热门工具,配套AI资讯与教程,每日更新,助你高效工作、玩转AI生活!用AI,学AI,从这里开始。Ctrl + D 或 ⌘ + D 添加书签,随时探索AI新世界。

    关于我们广告合作免责声明

    Copyright © 2026 AI深识站 赣ICP备2026009722号-1 
    网址
    网址文章软件
    热门搜索
    元宝豆包DeepSeek千问翻译