漫步远方,心荡神往

DeepSeek 开源周活动

在2025年2月24日至28日的DeepSeek开源周期间,DeepSeek集中发布了五大核心开源项目,全面覆盖AI基础设施中的计算优化、通信效率与存储加速等关键领域,构建起一套面向大规模人工智能的高性能技术底座。

1. DeepSeek 开源周 DeepSeek 在开源了 DeepSeek-R1 与 DeepSeek-V3 模型权重后,DeepSeek-V3 技术报告 《DeepSeek-V3 Technical Report》 中提到的很多核心技术,相继在 “DeepSeek 开

双机2*H20(8*96GiB)部署满血DeepSeek-R1(fp8)验证过程

双机2*H20(8*96GiB)部署满血DeepSeek-R1(fp8)验证过程、vllm 与 sglang 双机测试与性能对比

环境信息 机器配置 OS:CentOS Linux release 7.6 (Final) Kernel:4.19.0-1.0.0.9 驱动: Driver Version: 535.216.03 CUDA Version: 12.2 GPU:NVIDIA H20 vLLM:htt

单机H20(8*96GiB)部署满血DeepSeek-R1(fp8)验证过程

单机H20(8*96GiB)部署满血DeepSeek-R1(fp8)验证过程、vllm 验证过程、sglang 验证过程

环境信息 机器配置 OS:CentOS Linux release 7.6 (Final) Kernel:4.19.0-1.0.0.9 驱动: Driver Version: 535.216.03 CUDA Version: 12.2 GPU:NVIDIA H20 vLLM:htt

单台 H20 机器 DeepSeek R1 (FP8)、DeepSeek-R1-Block-INT8 精度测试与性能测试过程

测试下 DeepSeek R1(FP8)、DeepSeek-R1-Block-INT8 使用单台 H20 机器在 aime、math500、gpqa (使用开源工具 evalscope) 数据集下进行精度测试;给定输入、输出等参数,性能压测;

测试目标 测试下 DeepSeek R1(FP8) 使用单台 H20 机器在 aime、math500、gpqa (使用开源工具 evalscope) 数据集下进行精度测试; 给定输入、输出等参数,

深度剖析 DeepSeek R1 论文

深度剖析 DeepSeek R1 论文,从论文中提炼出关键信息,并分享自己的理解与思考

论文介绍了 R1 整个算法、训练流程和结果,但最核心的应该是数据,包括用于 R1-Zero 的数据是什么,数据量有多大,生成的 60w 数据具体是什么样的,标注的 20w 文科数据是什么,这是决定模型效果比较核心的因素。DeepSeek 的中文效果出圈,猜测很大程度还是标注的 20w 文科数据质量高,这些数据没有公开,要复刻出 DeepSeek 的效果没那么容易。开源社区有很多想要去复现 R1 和 R1-Zero 的研究,比较出名的是 huggingface 的 open-r1、R1-Zero 的开源项目 TinyZero