准确来说,DeepSeek(深度求索)既是一家研发大模型的公司,也是其旗下大语言模型系列的总称。
1. 作为一家公司
DeepSeek(杭州深度求索人工智能基础技术研究有限公司) 是一家专注于大模型技术研发的公司。它成立于2023年,由知名量化资管巨头幻方量化创立。这家公司以“高性价比”和“开源”著称,在AI圈内被称为“价格屠夫”和开源界的“黑马”。
2. 作为大语言模型系列
| 模型名称 | 核心定位 | 特点 |
|---|---|---|
| DeepSeek LLM | 初代基石 | 发布于2024年初,基于Transformer架构,是其后续所有模型的基础。 |
| DeepSeek Coder | 代码专家 | 专注于代码生成和理解,在编程领域的表现非常出色,完全开源。 |
| DeepSeek V2/V3 | 全能主力 | 采用混合专家(MoE)架构。V3版本性能对标GPT-4o,但训练和使用成本极低。 |
| DeepSeek R1 | 推理专家 | 专注于复杂的逻辑推理、数学和科学问题,性能比肩OpenAI的o1模型。 |
概括来说: 当你提到“DeepSeek”时,你指的通常是这家公司,或者是它推出的这些大语言模型产品。它们以极高的性价比和强大的开源生态,在全球AI领域占据了重要地位。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



