DeepSeek

227 0 1

开源大模型平台

收录时间：

2024-07-14

打开网站手机查看

AI大模型聊天对话 # DeepSeek # 大语言模型 # 开源AI

DeepSeek

打开网站

DeepSeek 是一家专注于通用人工智能底层技术研发的团队，自2023年成立以来，持续推动大语言模型的技术边界。依托自研训练框架、自建智算集群及大规模算力资源，DeepSeek 在短时间内开源了多个高性能大模型，涵盖通用对话、代码生成与复杂推理等方向。

DeepSeek官网入口网址：https://www.deepseek.com

其核心产品 DeepSeek-V3 于2024年12月正式开源，参数总量达671B，激活参数为37B，并在14.8T高质量语料上完成预训练。该模型在多项公开基准测试中表现领先，综合能力达到当前开源模型的前沿水平。技术架构上，DeepSeek 采用基于 Transformer 的混合专家（MoE）设计，在保障推理效率的同时显著降低计算开销，尤其适合处理长上下文和高复杂度任务。

除通用模型外，DeepSeek 还推出多个垂直优化版本：DeepSeek-Coder 专精代码生成与理解，在主流编程语言支持和代码补全准确性方面表现突出；DeepSeek-R1-Lite 则聚焦数学与逻辑推理，在相关评测中展现出接近顶尖闭源模型的能力。

在应用层面，用户可通过网页端平台直接与最新模型交互，开发者亦可调用其 API 接入系统。DeepSeek 的 API 定价策略具有明显成本优势，例如 DeepSeek-V2 的输入价格为每百万 tokens 1元，输出为2元，大幅降低大模型的使用门槛。

凭借扎实的技术积累、开放的开源策略以及对实际应用场景的深入适配，DeepSeek 已成为国内外开发者和研究者广泛采用的大模型之一，相关信息可通过千流导航获取。

DeepSeek

相关导航

稿定AI对话

Luca面壁露卡

商汤商量拟人大模型

通义千问

生数科技

左医医疗大语言模型

MiniMind

Chat Memo