fix format. test=develop

heavengate · heavengate · commit 061733531cd3 · 2022-09-20T13:22:49.000Z
diff --git a/paddle/fluid/framework/ir/fused_multi_transformer_decoder_pass.cc b/paddle/fluid/framework/ir/fused_multi_transformer_decoder_pass.cc
@@ -98,7 +98,7 @@ PDNode* FusedMultiTransformerDecoderPattern::operator()() {
                                    ->assert_is_op_output("transpose2")
                                    ->AsIntermediate()
                                    ->assert_is_op_input("matmul", "X");
-  
+
   // Q path Links
   matmul0->LinksFrom({layer_norm_out_var, matmul0_w_var}).LinksTo({matmul0_out_var});
   eltadd0->LinksFrom({matmul0_out_var, eltadd0_b_var}).LinksTo({eltadd0_out_var});
diff --git a/paddle/fluid/framework/ir/fused_multi_transformer_decoder_pass.h b/paddle/fluid/framework/ir/fused_multi_transformer_decoder_pass.h
@@ -138,7 +138,7 @@ struct FusedMultiTransformerDecoderPattern : public PatternBase {
   PATTERN_DECL_NODE(ffn_eltadd1_out);
   PATTERN_DECL_NODE(ffn_dropout);
   PATTERN_DECL_NODE(ffn_dropout_out);
-  
+
   // output elementwise_add
   PATTERN_DECL_NODE(ffn_eltadd_out)
   PATTERN_DECL_NODE(ffn_output);
@@ -238,7 +238,7 @@ struct FusedMultiTransformerDecoderFuseQKVPattern : public PatternBase {
   PATTERN_DECL_NODE(ffn_eltadd1_out);
   PATTERN_DECL_NODE(ffn_dropout);
   PATTERN_DECL_NODE(ffn_dropout_out);
-  
+
   // output elementwise_add
   PATTERN_DECL_NODE(ffn_eltadd_out)
   PATTERN_DECL_NODE(ffn_output);
diff --git a/paddle/fluid/framework/ir/fused_multi_transformer_decoder_pass_tester.cc b/paddle/fluid/framework/ir/fused_multi_transformer_decoder_pass_tester.cc
@@ -78,20 +78,20 @@ TEST(FusedMultiTransformerDecoderPass, basic) {
   // (reshape_0)                      transpose2       -> transpose_0
   // (reshape_1)                      transpose2       -> transpose_1
   // (reshape_2)                      transpose2       -> transpose_2
-  // (transpose_1)                    concat           -> concat_0 
-  // (transpose_2)                    concat           -> concat_2 
-  // (concat_0)                       assign           -> assign_0 
-  // (concat_1)                       assign           -> assign_2 
+  // (transpose_1)                    concat           -> concat_0
+  // (transpose_2)                    concat           -> concat_2
+  // (concat_0)                       assign           -> assign_0
+  // (concat_1)                       assign           -> assign_2
   // (transpose_0, transpose_1)       matmul           -> matmul_qk
   // (matmul_qk, bias_qk)             elementwise_add  -> eltadd_qk
   // (eltadd_qk)                      softmax          -> softmax_qk
-  // (softmax_qk)                     dropout          -> dropout_qk 
+  // (softmax_qk)                     dropout          -> dropout_qk
   // (dropout_qk, transpose_2)        matmul_v2        -> matmul_qkv
   // (matmul_qkv)                     transpose        -> transpose_qkv
   // (transpose_qkv)                  reshape          -> reshape_qkv
   // (reshape_qkv)                    matmul_v2        -> matmul_linear
   // (matmul_linear)                  elementwise_add  -> eltadd_linear
-  // (eltadd_linear)                  dropout          -> dropout_linear 
+  // (eltadd_linear)                  dropout          -> dropout_linear
   // (eltadd_out)                     elementwise_add  -> attention_out
   //
   // (attention_out, scale, bias)     layer_norm       -> ffn_layer_norm_out
@@ -100,11 +100,11 @@ TEST(FusedMultiTransformerDecoderPass, basic) {
   // (ffn_eltadd0)                    gelu             -> ffn_gelu
   // (ffn_gelu)                       matmul_v2        -> ffn_matmul1
   // (ffn_matmul1, ffn_bias1)         elementwise_add  -> ffn_eltadd1
-  // (ffn_eltadd1)                    dropout          -> ffn_dropout 
+  // (ffn_eltadd1)                    dropout          -> ffn_dropout
   // (attention_out, ffn_dropout)     elementwise_add  -> ffn_output
 
   Layers layers;
-  // MHA: pre LayerNorm 
+  // MHA: pre LayerNorm
   auto* x = layers.data("x", {1, 128, 1024});
   auto* ln_scale = layers.data("ln_scale", {1024}, true);
   auto* ln_bias = layers.data("ln_bias", {1024}, true);
@@ -229,21 +229,21 @@ TEST(FusedMultiTransformerDecoderFuseQKVPass, basic) {
   // (matmul_out0, bias_0)            elementwise_add  -> eltadd_0
   // (eltadd_0)                       reshape2         -> reshape_0
   // (reshape_0)                      transpose2       -> transpose_0
-  // (transpose_0)                    split            -> split_q, split_k, split_v 
-  // (split_k)                        concat           -> concat_k 
-  // (split_v)                        concat           -> concat_v 
-  // (concat_k)                       assign           -> assign_k 
-  // (concat_v)                       assign           -> assign_v 
+  // (transpose_0)                    split            -> split_q, split_k, split_v
+  // (split_k)                        concat           -> concat_k
+  // (split_v)                        concat           -> concat_v
+  // (concat_k)                       assign           -> assign_k
+  // (concat_v)                       assign           -> assign_v
   // (split_q, split_k)               matmul           -> matmul_qk
   // (matmul_qk, bias_qk)             elementwise_add  -> eltadd_qk
   // (eltadd_qk)                      softmax          -> softmax_qk
-  // (softmax_qk)                     dropout          -> dropout_qk 
+  // (softmax_qk)                     dropout          -> dropout_qk
   // (dropout_qk, transpose_2)        matmul_v2        -> matmul_qkv
   // (matmul_qkv)                     transpose        -> transpose_qkv
   // (transpose_qkv)                  reshape          -> reshape_qkv
   // (reshape_qkv)                    matmul_v2        -> matmul_linear
   // (matmul_linear)                  elementwise_add  -> eltadd_linear
-  // (eltadd_linear)                  dropout          -> dropout_linear 
+  // (eltadd_linear)                  dropout          -> dropout_linear
   // (eltadd_out)                     elementwise_add  -> attention_out
   //
   // (attention_out, scale, bias)     layer_norm       -> ffn_layer_norm_out
@@ -252,13 +252,13 @@ TEST(FusedMultiTransformerDecoderFuseQKVPass, basic) {
   // (ffn_eltadd0)                    gelu             -> ffn_gelu
   // (ffn_gelu)                       matmul_v2        -> ffn_matmul1
   // (ffn_matmul1, ffn_bias1)         elementwise_add  -> ffn_eltadd1
-  // (ffn_eltadd1)                    dropout          -> ffn_dropout 
+  // (ffn_eltadd1)                    dropout          -> ffn_dropout
   // (attention_out, ffn_dropout)     elementwise_add  -> ffn_output
   //
   // (transpose_1, transpose_2)       while            -> decoder block
 
   Layers layers;
-  // MHA: pre LayerNorm 
+  // MHA: pre LayerNorm
   auto* x = layers.data("x", {1, 128, 1024});
   auto* ln_scale = layers.data("ln_scale", {1024}, true);
   auto* ln_bias = layers.data("ln_bias", {1024}, true);
diff --git a/paddle/fluid/framework/ir/fused_multi_transformer_encoder_pass.cc b/paddle/fluid/framework/ir/fused_multi_transformer_encoder_pass.cc
@@ -98,7 +98,7 @@ PDNode* FusedMultiTransformerEncoderPattern::operator()() {
                                    ->assert_is_op_output("transpose2")
                                    ->AsIntermediate()
                                    ->assert_is_op_input("matmul", "X");
-  
+
   // Q path Links
   matmul0->LinksFrom({layer_norm_out_var, matmul0_w_var}).LinksTo({matmul0_out_var});
   eltadd0->LinksFrom({matmul0_out_var, eltadd0_b_var}).LinksTo({eltadd0_out_var});
@@ -838,7 +838,7 @@ inline void QKVWeightsProcessFuseQKV(Tensor* qkv_w_tensor,
     for (int j = 0; j < num_head; j++) {
       for (int k = 0; k < dim_head; k++) {
         int out_idx = i * num_head * dim_head \
-                      + j * dim_head + k; 
+                      + j * dim_head + k;
         int in_idx = j * 3 * dim_head \
                      + i * dim_head + k;
         tmp_transpose_b_data[out_idx] = qkv_b_data[in_idx];
@@ -955,7 +955,7 @@ int FusedMultiTransformerEncoderPass::BuildFusion(Graph* graph, const std::strin
     fused_multi_transformer_op_desc.SetInput("QKVW", {matmul0_w->Name()});
     fused_multi_transformer_op_desc.SetInput("QKVBias", {eltadd0_b->Name()});
     fused_multi_transformer_op_desc.SetInput("SrcMask", {eltadd_qk_b->Name()});
-    
+
     // CacheKV input
     VarDesc cache_kv_desc("cache_kv" + std::to_string(layer_idx));
     // FIXME: only support batch_size = 1, and max_seq_len <= 1024
@@ -1467,7 +1467,7 @@ int FusedMultiTransformerEncoderFuseQKVPass::BuildFusion(Graph* graph, const std
     fused_multi_transformer_op_desc.SetInput("QKVW", {matmul0_w->Name()});
     fused_multi_transformer_op_desc.SetInput("QKVBias", {eltadd0_b->Name()});
     fused_multi_transformer_op_desc.SetInput("SrcMask", {eltadd_qk_b->Name()});
-    
+
     // CacheKV input
     VarDesc cache_kv_desc("cache_kv" + std::to_string(layer_idx));
     // FIXME: only support batch_size = 1, and max_seq_len <= 1024
@@ -1519,7 +1519,7 @@ int FusedMultiTransformerEncoderFuseQKVPass::BuildFusion(Graph* graph, const std
     IR_NODE_LINK_TO(eltadd_qk_b, fused_multi_transformer);
 
     IR_NODE_LINK_TO(fused_multi_transformer, ffn_output);
-    
+
     // rewrite while OP input
     //  1. delete k, v
     //  2. delete matmul1/2_w eltadd1/2_w
diff --git a/paddle/fluid/framework/ir/fused_multi_transformer_encoder_pass.h b/paddle/fluid/framework/ir/fused_multi_transformer_encoder_pass.h
@@ -129,7 +129,7 @@ struct FusedMultiTransformerEncoderPattern : public PatternBase {
   PATTERN_DECL_NODE(ffn_eltadd1_out);
   PATTERN_DECL_NODE(ffn_dropout);
   PATTERN_DECL_NODE(ffn_dropout_out);
-  
+
   // output elementwise_add
   PATTERN_DECL_NODE(ffn_eltadd_out)
   PATTERN_DECL_NODE(ffn_output);
@@ -224,7 +224,7 @@ struct FusedMultiTransformerEncoderFuseQKVPattern : public PatternBase {
   PATTERN_DECL_NODE(ffn_eltadd1_out);
   PATTERN_DECL_NODE(ffn_dropout);
   PATTERN_DECL_NODE(ffn_dropout_out);
-  
+
   // output elementwise_add
   PATTERN_DECL_NODE(ffn_eltadd_out)
   PATTERN_DECL_NODE(ffn_output);
diff --git a/paddle/fluid/framework/ir/fused_multi_transformer_encoder_pass_tester.cc b/paddle/fluid/framework/ir/fused_multi_transformer_encoder_pass_tester.cc
@@ -81,13 +81,13 @@ TEST(FusedMultiTransformerEncoderPass, basic) {
   // (transpose_0, transpose_1)       matmul           -> matmul_qk
   // (matmul_qk, bias_qk)             elementwise_add  -> eltadd_qk
   // (eltadd_qk)                      softmax          -> softmax_qk
-  // (softmax_qk)                     dropout          -> dropout_qk 
+  // (softmax_qk)                     dropout          -> dropout_qk
   // (dropout_qk, transpose_2)        matmul_v2        -> matmul_qkv
   // (matmul_qkv)                     transpose        -> transpose_qkv
   // (transpose_qkv)                  reshape          -> reshape_qkv
   // (reshape_qkv)                    matmul_v2        -> matmul_linear
   // (matmul_linear)                  elementwise_add  -> eltadd_linear
-  // (eltadd_linear)                  dropout          -> dropout_linear 
+  // (eltadd_linear)                  dropout          -> dropout_linear
   // (eltadd_out)                     elementwise_add  -> attention_out
   //
   // (attention_out, scale, bias)     layer_norm       -> ffn_layer_norm_out
@@ -96,13 +96,13 @@ TEST(FusedMultiTransformerEncoderPass, basic) {
   // (ffn_eltadd0)                    gelu             -> ffn_gelu
   // (ffn_gelu)                       matmul_v2        -> ffn_matmul1
   // (ffn_matmul1, ffn_bias1)         elementwise_add  -> ffn_eltadd1
-  // (ffn_eltadd1)                    dropout          -> ffn_dropout 
+  // (ffn_eltadd1)                    dropout          -> ffn_dropout
   // (attention_out, ffn_dropout)     elementwise_add  -> ffn_output
   //
   // (transpose_1, transpose_2)       while            -> decoder block
 
   Layers layers;
-  // MHA: pre LayerNorm 
+  // MHA: pre LayerNorm
   auto* x = layers.data("x", {1, 128, 1024});
   auto* ln_scale = layers.data("ln_scale", {1024}, true);
   auto* ln_bias = layers.data("ln_bias", {1024}, true);
@@ -223,19 +223,19 @@ TEST(FusedMultiTransformerEncoderFuseQKVPass, basic) {
   // (matmul_out0, bias_0)            elementwise_add  -> eltadd_0
   // (eltadd_0)                       reshape2         -> reshape_0
   // (reshape_0)                      transpose2       -> transpose_0
-  // (transpose_0)                    split            -> split_q, split_k, split_v 
-  // (split_k)                        assign           -> assign_k 
-  // (split_v)                        assign           -> assign_v 
+  // (transpose_0)                    split            -> split_q, split_k, split_v
+  // (split_k)                        assign           -> assign_k
+  // (split_v)                        assign           -> assign_v
   // (split_q, split_k)               matmul           -> matmul_qk
   // (matmul_qk, bias_qk)             elementwise_add  -> eltadd_qk
   // (eltadd_qk)                      softmax          -> softmax_qk
-  // (softmax_qk)                     dropout          -> dropout_qk 
+  // (softmax_qk)                     dropout          -> dropout_qk
   // (dropout_qk, transpose_2)        matmul_v2        -> matmul_qkv
   // (matmul_qkv)                     transpose        -> transpose_qkv
   // (transpose_qkv)                  reshape          -> reshape_qkv
   // (reshape_qkv)                    matmul_v2        -> matmul_linear
   // (matmul_linear)                  elementwise_add  -> eltadd_linear
-  // (eltadd_linear)                  dropout          -> dropout_linear 
+  // (eltadd_linear)                  dropout          -> dropout_linear
   // (eltadd_out)                     elementwise_add  -> attention_out
   //
   // (attention_out, scale, bias)     layer_norm       -> ffn_layer_norm_out
@@ -244,13 +244,13 @@ TEST(FusedMultiTransformerEncoderFuseQKVPass, basic) {
   // (ffn_eltadd0)                    gelu             -> ffn_gelu
   // (ffn_gelu)                       matmul_v2        -> ffn_matmul1
   // (ffn_matmul1, ffn_bias1)         elementwise_add  -> ffn_eltadd1
-  // (ffn_eltadd1)                    dropout          -> ffn_dropout 
+  // (ffn_eltadd1)                    dropout          -> ffn_dropout
   // (attention_out, ffn_dropout)     elementwise_add  -> ffn_output
   //
   // (transpose_1, transpose_2)       while            -> decoder block
 
   Layers layers;
-  // MHA: pre LayerNorm 
+  // MHA: pre LayerNorm
   auto* x = layers.data("x", {1, 128, 1024});
   auto* ln_scale = layers.data("ln_scale", {1024}, true);
   auto* ln_bias = layers.data("ln_bias", {1024}, true);
diff --git a/paddle/fluid/framework/ir/fused_multi_transformer_pass.cc b/paddle/fluid/framework/ir/fused_multi_transformer_pass.cc
@@ -98,7 +98,7 @@ PDNode* FusedMultiTransformerPattern::operator()() {
                                    ->assert_is_op_output("transpose2")
                                    ->AsIntermediate()
                                    ->assert_is_op_input("matmul", "X");
-  
+
   // Q path Links
   matmul0->LinksFrom({layer_norm_out_var, matmul0_w_var}).LinksTo({matmul0_out_var});
   eltadd0->LinksFrom({matmul0_out_var, eltadd0_b_var}).LinksTo({eltadd0_out_var});
@@ -566,7 +566,7 @@ int FusedMultiTransformerPass::BuildFusion(Graph* graph, const std::string& name
     fused_multi_transformer_op_desc.SetInput("QKVW", {matmul0_w->Name()});
     fused_multi_transformer_op_desc.SetInput("QKVBias", {eltadd0_b->Name()});
     fused_multi_transformer_op_desc.SetInput("SrcMask", {eltadd_qk_b->Name()});
-    
+
     // CacheKV input
     VarDesc cache_kv_desc(
         patterns::PDNodeName("cache_kv", layer_norm->Name()));
@@ -631,7 +631,7 @@ int FusedMultiTransformerPass::BuildFusion(Graph* graph, const std::string& name
     IR_NODE_LINK_TO(eltadd_qk_b, fused_multi_transformer);
 
     IR_NODE_LINK_TO(fused_multi_transformer, ffn_output);
-    
+
     // // // link CacheKV to while
     // // IR_NODE_LINK_TO(cache_kv, while0)
     // // unlink origin KV output to while
diff --git a/paddle/fluid/framework/ir/fused_multi_transformer_pass.h b/paddle/fluid/framework/ir/fused_multi_transformer_pass.h
@@ -129,7 +129,7 @@ struct FusedMultiTransformerPattern : public PatternBase {
   PATTERN_DECL_NODE(ffn_eltadd1_out);
   PATTERN_DECL_NODE(ffn_dropout);
   PATTERN_DECL_NODE(ffn_dropout_out);
-  
+
   // output elementwise_add
   PATTERN_DECL_NODE(ffn_eltadd_out)
   PATTERN_DECL_NODE(ffn_output);
diff --git a/paddle/fluid/framework/ir/graph_helper.cc b/paddle/fluid/framework/ir/graph_helper.cc
@@ -767,8 +767,9 @@ void GraphToProgram(const Graph &graph,
         block->set_idx(idx);
         block->set_parent_idx(kRootBlockIndex);
       }
-      
-      GraphToBlock(*graph.GetSubGraph(idx), block, sort_kind);
+
+      GraphToBlock(*graph.GetSubGraph(idx), block, sort_kind,
+                   graph.GetBlockId());
     }
   } else {
     GraphToBlock(graph, block, sort_kind, graph.GetBlockId());

Original file line number	Diff line number	Diff line change
`@@ -767,8 +767,9 @@ void GraphToProgram(const Graph &graph,`
`767`	`767`	`block->set_idx(idx);`
`768`	`768`	`block->set_parent_idx(kRootBlockIndex);`
`769`	`769`	`}`
`770`		`-`
`771`		`- GraphToBlock(*graph.GetSubGraph(idx), block, sort_kind);`
	`770`	`+`
	`771`	`+ GraphToBlock(*graph.GetSubGraph(idx), block, sort_kind,`
	`772`	`+ graph.GetBlockId());`
`772`	`773`	`}`
`773`	`774`	`} else {`
`774`	`775`	`GraphToBlock(graph, block, sort_kind, graph.GetBlockId());`