Models.dev是一个由社区驱动的开源AI模型数据库,你可以把它理解为AI开发者的“中央情报局”或“万能字典”。
它的核心目的是解决当前AI模型信息分散、更新过快的问题。它将OpenAI、Anthropic、Google等各大厂商的模型信息(如价格、参数限制、功能支持等)统一整理成标准化的格式,让开发者不再需要去各个官网反复查找和对比。

Models.dev核心亮点
- 一站式信息聚合
它汇集了主流AI模型的详细规格。无论是GPT-5、Claude系列还是Google的最新模型,你都能在这里找到统一的定价(输入/输出成本)、上下文窗口限制、知识截止时间以及支持的功能(如是否支持工具调用、图像输入等)。 - 开发者友好的 API
对于开发者来说,最实用的功能是它提供的开放 API。你可以通过简单的请求直接获取所有模型的JSON数据,轻松集成到自己的工具或仪表盘中进行动态选择。- API 示例:
curl https://models.dev/api.json - 获取 Logo: 甚至可以通过
https://models.dev/logos/{provider}.svg获取厂商的 Logo。
- API 示例:
- 社区驱动,实时更新
由于 AI 领域更新极快,Models.dev采用社区协作模式(类似 GitHub 的开源项目)。这意味着每当有新模型发布,社区贡献者会迅速更新TOML配置文件,确保数据库的时效性。 - 完全免费开源
该项目由OpenCode团队发起,完全开源且免费,没有商业门槛。所有数据都以清晰的目录结构(providers/)存储在代码仓库中。
Models.dev的关键信息和使用要求
- 环境:Python + PyTorch;Flash Attention 2需CUDA与编译工具链。
- 分词器:使用
openai/gpt-oss-20b分词器。 - 精度:H100/A100推荐bfloat16,旧GPU使用float16 + GradScaler。
- 训练配置:AdamW优化器,线性warmup 2000步后余弦衰减,目标约30B tokens。
- 规模覆盖:从1B实验模型到1T理论配置均有预定义参数。
Models.dev如何使用
- 在线查询: 你可以直接访问其官网 models.dev 浏览和对比不同模型的能力。
- 代码集成: 在你的项目中调用其 API 获取数据,避免在代码中硬编码模型价格或参数。
- 参与贡献: 如果你发现某个模型信息缺失或过时,可以通过GitHub提交Pull Request (PR) 来更新数据,帮助社区完善数据库。
简而言之,Models.dev是一个基础设施级的工具,它帮你节省了搜集信息的时间,让你能更专注于业务逻辑的开发。
Models.dev的项目地址
- 项目官网:https://models.dev/
- GitHub仓库:https://github.com/anomalyco/models.dev
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



