文明旁观者

帅气的我简直无法用语言描述！

文章825 网址448 书籍0 软件13 评论0

已发布825

PaddleOCR-VL-1.6 – 百度发布的轻量化多模态文档解析模型

PaddleOCR-VL-1.6是百度发布的轻量化多模态文档解析模型，在权威评测集OmniDocBench v1.6中以96.33%的综合准确率刷新全球SOTA记录，超越Gemini-3-Pro、GP...

AI最新项目

3周前

0370

MAI-Voice-2 – 微软发布的新一代自研多语言语音合成模型

MAI-Voice-2是微软发布的新一代自研多语言语音合成模型，支持15种以上语言的高自然度语音生成，并首次实现复杂情感语调模拟与短样本声音克隆能力。其核心突破在于通过端到端神经声学建模，在保证超低...

AI最新项目

3周前

0350

MAI-Thinking-1 – 微软发布的首款完全自研的高级推理AI模型

MAI-Thinking-1是微软于2026年6月3日发布的首款完全自研的高级推理AI模型，采用350亿活跃参数的稀疏混合专家(MoE)架构，完全基于企业级合规数据从零训练，未使用任何第三方模型蒸馏数...

AI最新项目

3周前

0420

好用的ai配音软件有哪些免费

目前市面上真正完全免费且无强制水印、广告或导出限制的AI配音工具较少，多数提供“基础功能免费+高级功能付费”模式。根据2026年实测数据，以下5款工具在免费额度、核心功能开放度及实用性上表现突出，适合...

AI知识探索库

3周前

0820

Qwen2.5-7B – 阿里云通义千问系列开源大语言模型

Qwen2.5-7B是阿里云通义千问系列推出的76.1亿参数开源大语言模型，核心特点为支持131.072 tokens超长上下文、原生结构化输出能力及显著提升的数学与编程性能，适用于需平衡推理成本与专...

AI最新项目

3周前

0400

ECC – 开源的AI Agent性能优化系统

ECC(Everything Claude Code)是一个开源的AI Agent性能优化系统，由Anthropic黑客松冠军Affaan Mustafa基于10个月高强度生产环境实践开发，核心目标是...

AI最新项目

3周前

0460

OpenClacky – 李亚飞团队开源的低成本AI Agent框架

OpenClacky是李亚飞团队开源的低成本AI Agent框架，核心目标是通过工程化优化将AI任务执行的Token消耗降至行业最低水平，使专业用户能全天候无负担地运行AI助手。其关键突破在于通过缓...

AI最新项目

3周前

0390

Mellum2 – JetBrains推出的开源混合专家(MoE)模型

Mellum2是JetBrains推出的120亿参数开源混合专家(MoE)模型，专为软件工程场景设计，核心目标是通过超低延迟推理与私有化部署能力，解决企业级AI工作流中的实时性与成本瓶颈。 Mellu...

AI最新项目

3周前

0370

多模态智能体模型

多模态智能体模型是能够同时感知、理解并操作多种数据模态(如文本、图像、音频、视频等)，且具备自主决策与行动能力的AI系统。它不仅像传统模型一样“看懂”或“听懂”信息，更能主动调用工具、执行任务、验证结...

AI知识探索库

3周前

0610

Qwen3.7-Plus – 阿里巴巴发布的多模态智能体模型

Qwen3.7-Plus是阿里巴巴于2026年6月2日正式发布的多模态智能体模型，定位为视觉与语言统一的智能体基座。它在Qwen3.7文本能力基础上深度融合视觉理解与行动能力，不仅能看懂图像/视频，还...

AI最新项目

3周前

0550

加载更多