deepseek是大语言模型吗

准确来说，DeepSeek(深度求索)既是一家研发大模型的公司，也是其旗下大语言模型系列的总称。

DeepSeek(杭州深度求索人工智能基础技术研究有限公司) 是一家专注于大模型技术研发的公司。它成立于2023年，由知名量化资管巨头幻方量化创立。这家公司以“高性价比”和“开源”著称，在AI圈内被称为“价格屠夫”和开源界的“黑马”。

DeepSeek推出了一系列大语言模型(LLM)，这些模型才是你直接使用的“产品”。它们涵盖了从通用对话到代码编写、数学推理等不同领域。

以下是DeepSeek旗下几个最核心的大语言模型：

表格

模型名称	核心定位	特点
DeepSeek LLM	初代基石	发布于2024年初，基于Transformer架构，是其后续所有模型的基础。
DeepSeek Coder	代码专家	专注于代码生成和理解，在编程领域的表现非常出色，完全开源。
DeepSeek V2/V3	全能主力	采用混合专家（MoE）架构。V3版本性能对标GPT-4o，但训练和使用成本极低。
DeepSeek R1	推理专家	专注于复杂的逻辑推理、数学和科学问题，性能比肩OpenAI的o1模型。