From fb4018343a648b2d53726dac40e75bf860a0e8f2 Mon Sep 17 00:00:00 2001
From: zhanganduo <zhanganduo@aobi.com>
Date: Thu, 7 Dec 2023 15:41:55 +0800
Subject: [PATCH 1/5] add docs

---
 .../FusedBiasDropoutResidualLayerNorm_cn.rst  | 37 ++++++++++++++++
 ...ed_bias_dropout_residual_layer_norm_cn.rst | 43 +++++++++++++++++++
 2 files changed, 80 insertions(+)
 create mode 100644 docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst
 create mode 100644 docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst

diff --git a/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst b/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst
new file mode 100644
index 00000000000..1a98b063f12
--- /dev/null
+++ b/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst
@@ -0,0 +1,37 @@
+.. _cn_api_paddle_incubate_nn_FusedBiasDropoutResidualLayerNorm:
+
+FusedBiasDropoutResidualLayerNorm
+-------------------------------
+
+.. py:class:: paddle.incubate.nn.FusedBiasDropoutResidualLayerNorm(embed_dim, dropout_rate=0.5, weight_attr=None, bias_attr=None, epsilon=1e-05, name=None)
+
+应用融合偏置、Dropout 和残差层归一化操作。
+
+参数
+::::::::::::
+    - **embed_dim** (int) - 输入和输出中预期的特征大小。
+    - **dropout_rate** (float，可选) - 在注意力权重上使用的 Dropout 概率，用于在注意力后的 Dropout 过程中丢弃一些注意力目标。0 表示无 Dropout。默认为 0.5。
+    - **bias_attr** (ParamAttr|bool，可选) - 指定偏置参数的属性。默认为 None，意味着使用默认的偏置参数属性。如果设置为 False，则该层不会有可训练的偏置参数。具体用法请参见 :ref:`cn_api_paddle_ParamAttr` 。
+    - **epsilon** (float，可选) - 添加到方差中的小值，以防止除零。默认为 1e-05。
+
+代码示例
+::::::::::::
+
+COPY-FROM: paddle.incubate.nn.FusedBiasDropoutResidualLayerNorm
+
+forward(src, src_mask=None, cache=None)
+::::::::::::
+应用融合偏置、Dropout 和残差层归一化操作。
+
+参数
+::::::::::::
+    - **x** (Tensor) - 输入张量。它是一个形状为 `[batch_size, seq_len, embed_dim]` 的张量。数据类型应为 float32 或 float64。
+    - **residual** (Tensor，可选) - 残差张量。它是一个形状为 `[batch_size, value_length, vdim]` 的张量。数据类型应为 float32 或 float64。
+
+返回
+::::::::::::
+Tensor|tuple：数据类型与 ``x`` 一样。
+
+extra_repr()
+::::::::::::
+返回当前层的额外信息。
diff --git a/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
new file mode 100644
index 00000000000..41e50302baf
--- /dev/null
+++ b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
@@ -0,0 +1,43 @@
+.. _cn_api_paddle_incubate_nn_functional_fused_bias_dropout_residual_layer_norm:
+
+fused_bias_dropout_residual_layer_norm
+-------------------------------
+
+.. py:function:: paddle.incubate.nn.functional.fused_bias_dropout_residual_layer_norm(x, residual, bias=None, ln_scale=None, ln_bias=None, dropout_rate=0.5, ln_epsilon=1e-05, training=True, mode='upscale_in_train', name=None)
+
+融合偏置、Dropout 和残差层归一化操作符。其伪代码如下：
+
+.. code-block:: text
+
+    >>> y = layer_norm(residual + dropout(bias + x))
+
+参数
+::::::::::::
+    - **x** (Tensor) - 输入张量。其形状为 `[*, embed_dim]`。
+    - **residual** (Tensor) - 残差张量。其形状与 x 相同。
+    - **bias** (Tensor，可选) - 线性的偏置。其形状为 `[embed_dim]`。默认为 None。
+    - **ln_scale** (Tensor，可选) - 层归一化的权重张量。其形状为 `[embed_dim]`。默认为 None。
+    - **ln_bias** (Tensor，可选) - 层归一化的偏置张量。其形状为 `[embed_dim]`。默认为 None。
+    - **dropout_rate** (float，可选) - 在注意力权重上使用的 Dropout 概率，用于在注意力后的 Dropout 过程中丢弃一些注意力目标。0 表示无 Dropout。默认为 0.5。
+    - **ln_epsilon** (float，可选) - 在层归一化的分母中添加的小浮点数，用于避免除以零。默认为 1e-5。
+    - **training** (bool，可选) - 表示是否处于训练阶段的标志。默认为 True。
+    - **mode** (str，可选) - ['upscale_in_train'(默认) | 'downscale_in_infer']，有两种模式：
+
+                                 1. upscale_in_train(默认)，在训练时上调输出
+                                    - 训练：out = input * mask / (1.0 - p)
+                                    - 推理：out = input
+
+                                 2. downscale_in_infer，在推理时下调输出
+                                    - 训练：out = input * mask
+                                    - 推理：out = input * (1.0 - p)
+    - **name** (str，可选) - 操作的名称（可选，默认为 None）。更多信息，请参考：ref:`api_guide_Name`。
+
+返回
+::::::::::::
+    - Tensor，输出张量，数据类型和形状与 `x` 相同。
+
+
+代码示例
+::::::::::::
+
+COPY-FROM: paddle.incubate.nn.functional.fused_bias_dropout_residual_layer_norm

From 358b214be5ccd94d472ff07fece31d2bb7930136 Mon Sep 17 00:00:00 2001
From: zhanganduo <zhanganduo@aobi.com>
Date: Wed, 17 Jan 2024 14:24:48 +0800
Subject: [PATCH 2/5] fix doc issues

---
 .../nn/FusedBiasDropoutResidualLayerNorm_cn.rst        | 10 +++++-----
 .../fused_bias_dropout_residual_layer_norm_cn.rst      |  8 +++++---
 2 files changed, 10 insertions(+), 8 deletions(-)

diff --git a/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst b/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst
index 1a98b063f12..0687433736b 100644
--- a/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst
+++ b/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst
@@ -5,7 +5,7 @@ FusedBiasDropoutResidualLayerNorm
 
 .. py:class:: paddle.incubate.nn.FusedBiasDropoutResidualLayerNorm(embed_dim, dropout_rate=0.5, weight_attr=None, bias_attr=None, epsilon=1e-05, name=None)
 
-应用融合偏置、Dropout 和残差层归一化操作。
+应用 fused_bias_dropout_residual_layer_norm 操作符，包含融合偏置、Dropout 和残差层归一化操作。
 
 参数
 ::::::::::::
@@ -19,9 +19,9 @@ FusedBiasDropoutResidualLayerNorm
 
 COPY-FROM: paddle.incubate.nn.FusedBiasDropoutResidualLayerNorm
 
-forward(src, src_mask=None, cache=None)
+forward(x, residual)
 ::::::::::::
-应用融合偏置、Dropout 和残差层归一化操作。
+应用 fused_bias_dropout_residual_layer_norm 操作符，包含融合偏置、Dropout 和残差层归一化操作。
 
 参数
 ::::::::::::
@@ -30,8 +30,8 @@ forward(src, src_mask=None, cache=None)
 
 返回
 ::::::::::::
-Tensor|tuple：数据类型与 ``x`` 一样。
+Tensor|tuple：与 `x` 具有相同数据类型和形状的张量
 
 extra_repr()
 ::::::::::::
-返回当前层的额外信息。
+当前层的额外表示，您可以自定义实现自己的层。
diff --git a/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
index 41e50302baf..b96b3149c5f 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
@@ -5,7 +5,9 @@ fused_bias_dropout_residual_layer_norm
 
 .. py:function:: paddle.incubate.nn.functional.fused_bias_dropout_residual_layer_norm(x, residual, bias=None, ln_scale=None, ln_bias=None, dropout_rate=0.5, ln_epsilon=1e-05, training=True, mode='upscale_in_train', name=None)
 
-融合偏置、Dropout 和残差层归一化操作符。其伪代码如下：
+fused_bias_dropout_residual_layer_norm 操作符，包含融合偏置、Dropout 和残差层归一化。
+
+其伪代码如下：
 
 .. code-block:: text
 
@@ -21,7 +23,7 @@ fused_bias_dropout_residual_layer_norm
     - **dropout_rate** (float，可选) - 在注意力权重上使用的 Dropout 概率，用于在注意力后的 Dropout 过程中丢弃一些注意力目标。0 表示无 Dropout。默认为 0.5。
     - **ln_epsilon** (float，可选) - 在层归一化的分母中添加的小浮点数，用于避免除以零。默认为 1e-5。
     - **training** (bool，可选) - 表示是否处于训练阶段的标志。默认为 True。
-    - **mode** (str，可选) - ['upscale_in_train'(默认) | 'downscale_in_infer']，有两种模式：
+    - **mode** (str，可选) - ['upscale_in_train'(默认) | 'downscale_in_infer']，两种模式分别为：
 
                                  1. upscale_in_train(默认)，在训练时上调输出
                                     - 训练：out = input * mask / (1.0 - p)
@@ -30,7 +32,7 @@ fused_bias_dropout_residual_layer_norm
                                  2. downscale_in_infer，在推理时下调输出
                                     - 训练：out = input * mask
                                     - 推理：out = input * (1.0 - p)
-    - **name** (str，可选) - 操作的名称（可选，默认为 None）。更多信息，请参考：ref:`api_guide_Name`。
+    - **name** (str，可选) - 操作的名称（可选，默认为 None）。具体用法请参见 :ref:`api_guide_Name`。
 
 返回
 ::::::::::::

From 1f88fa8755a2a4513aefd552b9cdc7d975b79be2 Mon Sep 17 00:00:00 2001
From: Android zhang <53324261+zade23@users.noreply.github.com>
Date: Wed, 17 Jan 2024 15:14:08 +0800
Subject: [PATCH 3/5] Update
 docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst

Co-authored-by: zachary sun <70642955+sunzhongkai588@users.noreply.github.com>
---
 .../nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst  | 1 +
 1 file changed, 1 insertion(+)

diff --git a/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
index b96b3149c5f..43515435d94 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
@@ -26,6 +26,7 @@ fused_bias_dropout_residual_layer_norm 操作符，包含融合偏置、Dropout
     - **mode** (str，可选) - ['upscale_in_train'(默认) | 'downscale_in_infer']，两种模式分别为：
 
                                  1. upscale_in_train(默认)，在训练时上调输出
+                                 
                                     - 训练：out = input * mask / (1.0 - p)
                                     - 推理：out = input
 

From 3f8be7eb5cdc86c30d29ea2402a4fdfb58f797d7 Mon Sep 17 00:00:00 2001
From: Android zhang <53324261+zade23@users.noreply.github.com>
Date: Wed, 17 Jan 2024 15:14:22 +0800
Subject: [PATCH 4/5] Update
 docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst

Co-authored-by: zachary sun <70642955+sunzhongkai588@users.noreply.github.com>
---
 .../nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst  | 1 +
 1 file changed, 1 insertion(+)

diff --git a/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
index 43515435d94..316ea28886a 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
@@ -31,6 +31,7 @@ fused_bias_dropout_residual_layer_norm 操作符，包含融合偏置、Dropout
                                     - 推理：out = input
 
                                  2. downscale_in_infer，在推理时下调输出
+                                 
                                     - 训练：out = input * mask
                                     - 推理：out = input * (1.0 - p)
     - **name** (str，可选) - 操作的名称（可选，默认为 None）。具体用法请参见 :ref:`api_guide_Name`。

From 6c6f0cff002437cc9a56216977dc03898fa2468b Mon Sep 17 00:00:00 2001
From: zhanganduo <zhanganduo@aobi.com>
Date: Wed, 17 Jan 2024 15:55:47 +0800
Subject: [PATCH 5/5] rerun pre-commit

---
 .../incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst    | 2 +-
 .../fused_bias_dropout_residual_layer_norm_cn.rst           | 6 +++---
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst b/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst
index 0687433736b..85d3db7aad3 100644
--- a/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst
+++ b/docs/api/paddle/incubate/nn/FusedBiasDropoutResidualLayerNorm_cn.rst
@@ -25,7 +25,7 @@ forward(x, residual)
 
 参数
 ::::::::::::
-    - **x** (Tensor) - 输入张量。它是一个形状为 `[batch_size, seq_len, embed_dim]` 的张量。数据类型应为 float32 或 float64。
+    - **x** (Tensor) - 输入张量。它是一个形状为 `[batch_size, seq_len, embed_dim]` 的张量。数据类型应为 float32 或 float64 。
     - **residual** (Tensor，可选) - 残差张量。它是一个形状为 `[batch_size, value_length, vdim]` 的张量。数据类型应为 float32 或 float64。
 
 返回
diff --git a/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
index 316ea28886a..1bb35db4b6c 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_bias_dropout_residual_layer_norm_cn.rst
@@ -20,18 +20,18 @@ fused_bias_dropout_residual_layer_norm 操作符，包含融合偏置、Dropout
     - **bias** (Tensor，可选) - 线性的偏置。其形状为 `[embed_dim]`。默认为 None。
     - **ln_scale** (Tensor，可选) - 层归一化的权重张量。其形状为 `[embed_dim]`。默认为 None。
     - **ln_bias** (Tensor，可选) - 层归一化的偏置张量。其形状为 `[embed_dim]`。默认为 None。
-    - **dropout_rate** (float，可选) - 在注意力权重上使用的 Dropout 概率，用于在注意力后的 Dropout 过程中丢弃一些注意力目标。0 表示无 Dropout。默认为 0.5。
+    - **dropout_rate** (float，可选) - 在注意力权重上使用的 Dropout 概率，用于在注意力后的 Dropout 过程中丢弃一些注意力目标。0 表示无 Dropout。默认为 0.5 。
     - **ln_epsilon** (float，可选) - 在层归一化的分母中添加的小浮点数，用于避免除以零。默认为 1e-5。
     - **training** (bool，可选) - 表示是否处于训练阶段的标志。默认为 True。
     - **mode** (str，可选) - ['upscale_in_train'(默认) | 'downscale_in_infer']，两种模式分别为：
 
                                  1. upscale_in_train(默认)，在训练时上调输出
-                                 
+
                                     - 训练：out = input * mask / (1.0 - p)
                                     - 推理：out = input
 
                                  2. downscale_in_infer，在推理时下调输出
-                                 
+
                                     - 训练：out = input * mask
                                     - 推理：out = input * (1.0 - p)
     - **name** (str，可选) - 操作的名称（可选，默认为 None）。具体用法请参见 :ref:`api_guide_Name`。