Skip to content

2025 第一届 CCF 智算网络挑战赛(英伟达赛道)

License

Notifications You must be signed in to change notification settings

MineQihang/ACNC2025-public

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

第一届 CCF 智算网络挑战赛(集合通信)

本仓库为英伟达赛道“再吃一颗苹果”赛队的解决方案。

  • docs中包括本次赛题的文档。
  • patch中为需要对msccl-tools库进行的修改。
  • slides中为我们队的决赛答辩slides,其中对我们的解决方案进行了阐述。
  • src中为生成xml的源代码。
  • xmls中为上榜的最终代码。

复现指南

克隆当前仓库并进入:

git clone https://github.com/MineQihang/ACNC2025-public.git
cd ACNC2025-public

下载msccl-tools源码:

git clone https://github.com/Azure/msccl-tools.git

将patch拷贝到里面并应用:

cp patch/msccl-tools.patch msccl-tools/msccl-tools.patch
cd msccl-tools
patch -p1 < msccl-tools.patch 

patch主要是让msccl-tools具有合并相同send-recv-channel tuple thread block的功能。

安装msccl-tools:

pip install .

在完成上述步骤后,msccl-tools及其补丁就安装好了,下面是复现的指令:

注:由于MSCCL-tools的问题,生成的tb内nop顺序可能发生变化,与xmls文件夹中的提交版有所不同。

  1. AllGather算子(小数据量,8M)

    cd src/allgather
    python allgather_8m.py > allgather_8m.xml
  2. AllGather算子(中大数据量,512M/8G)

    cd src/allgather
    python allgather_512m.py > allgather_512m_8g.xml
  3. AlltoAll算子

    cd src/alltoall
    python alltoall.py > alltoall.xml
  4. AlltoAllv算子

    cd src/alltoallv
    python alltoallv.py > alltoallv.xml

方案阐述

请参见我们的slides

About

2025 第一届 CCF 智算网络挑战赛(英伟达赛道)

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages