 单机多卡训练时,跑完10个epochs后代码卡住了,查看gpu情况,只有一个gpu利用率100,第二个GPU停止了