前言总览：版图,模拟,数字, Fpga,驱动

PCIe SerDes 全流程实战

前言-总览：版图,模拟,数字,FPGA,驱动

2019 年左右第一次接触AI，深度学习仍被视作机器学习的一个分支，传统算法包括决策树、支持向量机和 Boosting Tree 等。彼时深度学习主要应用在图像检测（如 YOLO）、图像分类等领域，自然语言处理（NLP）尚处早期阶段，多聚焦于词性分析、情感分类和知识图谱等基础任务。

2022 年底，ChatGPT 面世，彻底改变了 NLP 与 AI 的发展路线。 2025 年初，DeepSeek 开源五个项目，其中专门的通信库覆盖 NVLink 及 CX7 InfiniBand 400 Gb/s RDMA 网卡（对应 PCIe Gen 5）。

在可预见的未来，大模型 AI 将继续推动科技演进，而 GPGPU/NPU/TPU 等分布式并行计算架构将成为其核心驱动力。与之相比，CPU 单核性能已趋于瓶颈（主频长期停留在 4–5 GHz 区间），高度依赖分支预测、多级流水线以及多层 Cache 来弥补内存延迟与带宽不足。

通信
- 片内：AXI 总线
- PCB 层：PCIe / CXL / NVLink
- 跨设备：基于 RDMA 的高速互连
存储与缓存
由 SSD 固态硬盘、高速显存（GDDR / HBM）及片内 SRAM Cache 组成的分级存储体系。
控制与算法
GPGPU 既不同于具备高度灵活控制逻辑的 CPU，也不同于可烧录新逻辑的 FPGA。芯片设计阶段必须为软件算法留足操作空间，在保证硬件效率的同时，与上层神经网络算子紧密协同。

本项目以 PCIe 协议为范例，横跨模拟 SerDes 层、数字协议层及软件驱动层，最终实现端到端演示。成果包含：

可提供 SerDes 仿真、版图、VCS 数字仿真以及联合 FPGA + 驱动代码的实机矩阵加法演示，项目代码和开发环境。(文章仅包含重点讲解，细节需要自行通过虚拟机的开发环境学习掌握)