starcrown001

starcrown001

Achievements

xhy-flash-attention xhy-flash-attention Public

Forked from PaddlePaddle/flash-attention

Fast and memory-efficient exact attention

C++
Paddle Paddle Public

Forked from PaddlePaddle/Paddle

PArallel Distributed Deep LEarning: Machine Learning Framework from Industrial Practice （『飞桨』核心框架，深度学习&机器学习高性能单机、分布式训练和跨平台部署）

C++
paddle-blog paddle-blog Public

Forked from PFCCLab/blog

PFCC 社区博客

Vue
LeetCUDA LeetCUDA Public

Forked from xlite-dev/LeetCUDA

📚LeetCUDA: Modern CUDA Learn Notes with PyTorch for Beginners🐑, 200+ CUDA Kernels, Tensor Cores, HGEMM, FA-2 MMA.🎉

Cuda
CUDA_Kernel_Samples CUDA_Kernel_Samples Public

Forked from Tongkaio/CUDA_Kernel_Samples

CUDA 算子手撕与面试指南

Cuda
test_flashmask test_flashmask Public

Forked from umiswing/test_flashmask

Python