- N +

DeepSeek发布V2模型 GPT-4的性能白菜的价格

DeepSeek发布V2模型 GPT-4的性能白菜的价格原标题:DeepSeek发布V2模型 GPT-4的性能白菜的价格

导读:

月日网易自研无限出金掠夺射击手游萤火突击公测冲刺阶段正式于点开启计费测试同步开启本次更新还带来了全新的宣传资料片暗萤携手战斗一触即发月日消息在开源模型领域取得了重要进展继今年月...

3月29日,网易自研无限出金掠夺射击手游《萤火突击》“公测冲刺阶段”正式于11点开启,计费测试同步开启。本次更新还带来了全新的宣传资料片,暗萤携手,战斗一触即发!

5月7日 消息:在开源MoE(Mixture of Experts)模型领域取得了重要进展,继今年1月份开源国内首个MoE模型后,现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现,与GPT-4等闭源模型竞争,同时在成本效益上具有显著优势。

模型权重下载:

体验地址:https://chat.deepseek.com/sign_in

DeepSeek-V2在主流模型评测榜单中表现卓越,尤其在中文综合能力(AlignBench)和英文综合能力(MT-Bench)上,与顶尖闭源模型并驾齐驱。此外,在知识、数学、推理、编程等专业榜单上,DeepSeek-V2也取得了领先位置。

DeepSeek发布V2模型 GPT-4的性能白菜的价格

DeepSeek-V2采用了创新的模型结构,提出了MLA(Multi-head Latent Attention)架构,该架构在减少计算量和推理显存方面有显著优势。结合自研的Sparse结构DeepSeekMoE,模型在保持性能的同时,将计算量降至最低。

DeepSeek-V2以较低的显存消耗实现了高性能,其每token成本大幅降低,使得实际部署在8卡H800机器上的输入吞吐量超过每秒10万tokens,输出超过每秒5万tokens。API定价为每百万tokens输入1元、输出2元,价格极具竞争力。

DeepSeek秉持开源精神,将DeepSeek-V2模型和相关论文完全开源,免费商用,无需申请。模型权重可在Hugging Face平台获取,技术报告则发布在GitHub上。

DeepSeek提供了对话 和开放平台,用户可以在chat.deepseek.com免费开启对话,而DeepSeek API开放平台则提供注册即赠送大量tokens的优惠,以支持优质项目的发展。

返回列表
上一篇:
下一篇: