近日,人工智能推理系统DeepSeek发布了一篇全面揭示其V3/R1推理系统关键秘密的文章。文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,DeepSeek V3和R1的所有服务均使用H800 GPU,并采用与训练一致的精度,以保证服务效果。同时,DeepSeek实现了昼夜资源调配,以最大化硬件利用率。
根据统计,假设GPU租赁成本为2美元/小时,DeepSeek一天的总成本为87072美元。如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元,成本利润率高达545%。然而,实际收入并未达到这个数字,因为V3的定价更低,收费服务只占了一部分,夜间还有折扣。
DeepSeek的高利润率源于其创新的推理系统设计,包括大规模跨节点专家并行(EP)、计算通信重叠与负载均衡优化三大技术支柱。此外,DeepSeek在工程层面进一步压缩成本,白天高峰时段全力支持推理服务,夜间闲置节点转用于研发训练。
综合看来,DeepSeek通过创新的技术设计和精细的资源调配,实现了高效的运行效率和显著的利润率,展示出了其在人工智能推理系统领域的强大实力。