From 99432d8ade9523cde8238dd98f960e4c4b089121 Mon Sep 17 00:00:00 2001
From: zhanganduo <zhanganduo@aobi.com>
Date: Mon, 25 Sep 2023 16:52:03 +0800
Subject: [PATCH 1/8] fix zh_doc_6061

---
 .../nn/functional/fused_layer_norm_cn.rst     | 41 +++++++++++++++++++
 .../nn/functional/fused_rms_norm_cn.rst       | 40 ++++++++++++++++++
 2 files changed, 81 insertions(+)
 create mode 100644 docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
 create mode 100644 docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst

diff --git a/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
new file mode 100644
index 00000000000..19630017a4c
--- /dev/null
+++ b/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
@@ -0,0 +1,41 @@
+.. _cn_api_paddle_incubate_nn_functional_fused_layer_norm:
+
+fused_layer_norm
+-------------------------------
+
+.. py:function:: paddle.incubate.nn.functional.fused_layer_norm(x, norm_weight, norm_bias, epsilon, residual_alpha=1.0, begin_norm_axis=1, bias=None, residual=None, quant_scale=- 1, quant_round_type=0, quant_max_bound=0, quant_min_bound=0)
+
+应用 Fused LayerNorm 内核，提供了更高的 GPU 利用率。同时，支持模式融合 LayerNorm(bias + residual_alpha * residual + x)。
+
+当 norm_weight 和 norm_bias 为 None 时，返回融合的 (bias + residual_alpha * residual + x)。
+
+fused_layer_norm 算子目前只支持在 GPU 下运行。
+
+参数
+::::::::::::
+    - **x** (Tensor) - 输入 ``Tensor``。
+    - **norm_weight** (Tensor) - 用于仿射输出的权重张量。
+    - **norm_bias** (Tensor) - 用于仿射输出的偏置张量。
+    - **epsilon** (float) - 一个小的浮点数，用于避免除以零。
+    - **residual_alpha** (float) - 用于残差的缩放因子，默认为 1。
+    - **begin_norm_axis** (int) - 归一化的起始轴，默认为 1。
+    - **bias** (可选|Tensor) - 前一层的偏置，用于融合。
+    - **residual** (可选|Tensor) - 输入的残差，用于融合。
+    - **quant_scale** (float) - 量化比例。
+    - **quant_round_type** (float) - 量化四舍五入类型。
+    - **quant_max_bound** (float) - 量化的最大边界进行裁剪。
+    - **quant_min_bound** (float) - 量化的最小边界进行裁剪。
+
+
+返回
+::::::::::::
+输出``Tensor``
+
+形状
+::::::::::::
+``Tensor``，形状同 ``x`` 一致。
+
+代码示例
+::::::::::::
+
+COPY-FROM: paddle.incubate.nn.functional.fused_layer_norm
diff --git a/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
new file mode 100644
index 00000000000..4091c67c796
--- /dev/null
+++ b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
@@ -0,0 +1,40 @@
+.. _cn_api_paddle_incubate_nn_functional_fused_rms_norm:
+
+fused_rms_norm
+-------------------------------
+
+.. py:function:: paddle.incubate.nn.functional.fused_rms_norm(x, norm_weight, norm_bias, epsilon, begin_norm_axis, bias=None, residual=None, quant_scale=- 1, quant_round_type=0, quant_max_bound=0, quant_min_bound=0)
+
+应用 Fused RMSNorm 内核，提供了更高的 GPU 利用率。同时，支持模式融合 RMSNorm(bias + residual + x)。
+
+细节可参考论文 `Root Mean Square Layer Normalization <https://arxiv.org/abs/1910.07467>`_ 。
+
+fused_rms_norm 算子目前只支持在 GPU 下运行，
+
+参数
+::::::::::::
+    - **x** (Tensor) - 输入 ``Tensor``。
+    - **norm_weight** (Tensor) - 用于仿射输出的权重张量。
+    - **norm_bias** (Tensor) - 用于仿射输出的偏置张量。
+    - **epsilon** (float) - 一个小的浮点数，用于避免除以零。
+    - **begin_norm_axis** (int) - 归一化的起始轴，默认为 1。
+    - **bias** (可选|Tensor) - 前一层的偏置，用于融合。
+    - **residual** (可选|Tensor) - 输入的残差，用于融合。
+    - **quant_scale** (float) - 量化比例。
+    - **quant_round_type** (float) - 量化四舍五入类型。
+    - **quant_max_bound** (float) - 量化的最大边界进行裁剪。
+    - **quant_min_bound** (float) - 量化的最小边界进行裁剪。
+
+
+返回
+::::::::::::
+输出``Tensor``
+
+形状
+::::::::::::
+``Tensor``，形状同 ``x`` 一致。
+
+代码示例
+::::::::::::
+
+COPY-FROM: paddle.incubate.nn.functional.fused_rms_norm

From 06390ac953140d792c7ca001a6743a163e5bb77c Mon Sep 17 00:00:00 2001
From: Android zhang <53324261+zade23@users.noreply.github.com>
Date: Wed, 27 Sep 2023 17:03:21 +0800
Subject: [PATCH 2/8] Update fused_rms_norm_cn.rst

---
 .../incubate/nn/functional/fused_rms_norm_cn.rst       | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
index 4091c67c796..a29bbf38579 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
@@ -18,12 +18,12 @@ fused_rms_norm 算子目前只支持在 GPU 下运行，
     - **norm_bias** (Tensor) - 用于仿射输出的偏置张量。
     - **epsilon** (float) - 一个小的浮点数，用于避免除以零。
     - **begin_norm_axis** (int) - 归一化的起始轴，默认为 1。
-    - **bias** (可选|Tensor) - 前一层的偏置，用于融合。
-    - **residual** (可选|Tensor) - 输入的残差，用于融合。
-    - **quant_scale** (float) - 量化比例。
+    - **bias** (可选|Tensor) - 前一层的偏置。
+    - **residual** (可选|Tensor) - 输入的残差。
+    - **quant_scale** (float) - 量化缩放因子。
     - **quant_round_type** (float) - 量化四舍五入类型。
-    - **quant_max_bound** (float) - 量化的最大边界进行裁剪。
-    - **quant_min_bound** (float) - 量化的最小边界进行裁剪。
+    - **quant_max_bound** (float) - 量化裁剪的最大边界值。
+    - **quant_min_bound** (float) - 量化裁剪的最小边界值。
 
 
 返回

From 2e75eb0ddb9a32f161fc40636b7565368030c827 Mon Sep 17 00:00:00 2001
From: Android zhang <53324261+zade23@users.noreply.github.com>
Date: Wed, 27 Sep 2023 17:03:27 +0800
Subject: [PATCH 3/8] Update fused_layer_norm_cn.rst

---
 .../incubate/nn/functional/fused_layer_norm_cn.rst     | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
index 19630017a4c..18b95ad89d4 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
@@ -19,12 +19,12 @@ fused_layer_norm 算子目前只支持在 GPU 下运行。
     - **epsilon** (float) - 一个小的浮点数，用于避免除以零。
     - **residual_alpha** (float) - 用于残差的缩放因子，默认为 1。
     - **begin_norm_axis** (int) - 归一化的起始轴，默认为 1。
-    - **bias** (可选|Tensor) - 前一层的偏置，用于融合。
-    - **residual** (可选|Tensor) - 输入的残差，用于融合。
-    - **quant_scale** (float) - 量化比例。
+    - **bias** (可选|Tensor) - 前一层的偏置。
+    - **residual** (可选|Tensor) - 输入的残差。
+    - **quant_scale** (float) - 量化缩放因子。
     - **quant_round_type** (float) - 量化四舍五入类型。
-    - **quant_max_bound** (float) - 量化的最大边界进行裁剪。
-    - **quant_min_bound** (float) - 量化的最小边界进行裁剪。
+    - **quant_max_bound** (float) - 量化裁剪的最大边界值。
+    - **quant_min_bound** (float) - 量化裁剪的最小边界值。
 
 
 返回

From f9d63935adb3191d88151906061a847f352cdbb7 Mon Sep 17 00:00:00 2001
From: Android zhang <53324261+zade23@users.noreply.github.com>
Date: Thu, 28 Sep 2023 11:06:58 +0800
Subject: [PATCH 4/8] Update
 docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst

Co-authored-by: zachary sun <70642955+sunzhongkai588@users.noreply.github.com>
---
 docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
index a29bbf38579..746dfe7452b 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
@@ -28,7 +28,7 @@ fused_rms_norm 算子目前只支持在 GPU 下运行，
 
 返回
 ::::::::::::
-输出``Tensor``
+输出 ``Tensor``
 
 形状
 ::::::::::::

From 4d464967b7a6403d16c7c7931d4adcb719564f8a Mon Sep 17 00:00:00 2001
From: Android zhang <53324261+zade23@users.noreply.github.com>
Date: Thu, 28 Sep 2023 11:07:04 +0800
Subject: [PATCH 5/8] Update
 docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst

Co-authored-by: zachary sun <70642955+sunzhongkai588@users.noreply.github.com>
---
 docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
index 18b95ad89d4..4cedc71044e 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
@@ -29,7 +29,7 @@ fused_layer_norm 算子目前只支持在 GPU 下运行。
 
 返回
 ::::::::::::
-输出``Tensor``
+输出 ``Tensor``
 
 形状
 ::::::::::::

From 119fb1c32582830a3dcc7fe5f39a1d3a4acc303e Mon Sep 17 00:00:00 2001
From: Android zhang <53324261+zade23@users.noreply.github.com>
Date: Thu, 28 Sep 2023 11:07:09 +0800
Subject: [PATCH 6/8] Update
 docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst

Co-authored-by: zachary sun <70642955+sunzhongkai588@users.noreply.github.com>
---
 .../api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
index 4cedc71044e..3fefdeb1774 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_layer_norm_cn.rst
@@ -19,8 +19,8 @@ fused_layer_norm 算子目前只支持在 GPU 下运行。
     - **epsilon** (float) - 一个小的浮点数，用于避免除以零。
     - **residual_alpha** (float) - 用于残差的缩放因子，默认为 1。
     - **begin_norm_axis** (int) - 归一化的起始轴，默认为 1。
-    - **bias** (可选|Tensor) - 前一层的偏置。
-    - **residual** (可选|Tensor) - 输入的残差。
+    - **bias** (Tensor，可选) - 前一层的偏置。
+    - **residual** (Tensor，可选) - 输入的残差。
     - **quant_scale** (float) - 量化缩放因子。
     - **quant_round_type** (float) - 量化四舍五入类型。
     - **quant_max_bound** (float) - 量化裁剪的最大边界值。

From 1f0da34361356ce503936127ea8de872c9c80f1f Mon Sep 17 00:00:00 2001
From: Android zhang <53324261+zade23@users.noreply.github.com>
Date: Thu, 28 Sep 2023 11:07:16 +0800
Subject: [PATCH 7/8] Update
 docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst

Co-authored-by: zachary sun <70642955+sunzhongkai588@users.noreply.github.com>
---
 docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
index 746dfe7452b..fe34eda2410 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
@@ -18,8 +18,8 @@ fused_rms_norm 算子目前只支持在 GPU 下运行，
     - **norm_bias** (Tensor) - 用于仿射输出的偏置张量。
     - **epsilon** (float) - 一个小的浮点数，用于避免除以零。
     - **begin_norm_axis** (int) - 归一化的起始轴，默认为 1。
-    - **bias** (可选|Tensor) - 前一层的偏置。
-    - **residual** (可选|Tensor) - 输入的残差。
+    - **bias** (Tensor，可选) - 前一层的偏置。
+    - **residual** (Tensor，可选) - 输入的残差。
     - **quant_scale** (float) - 量化缩放因子。
     - **quant_round_type** (float) - 量化四舍五入类型。
     - **quant_max_bound** (float) - 量化裁剪的最大边界值。

From 0140fe18e39167814a8019a97d7d51dce72fb49b Mon Sep 17 00:00:00 2001
From: Android zhang <53324261+zade23@users.noreply.github.com>
Date: Thu, 28 Sep 2023 11:22:54 +0800
Subject: [PATCH 8/8] Update fused_rms_norm_cn.rst

fix Symbol_Error
---
 docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
index fe34eda2410..1cb6548d0fe 100644
--- a/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
+++ b/docs/api/paddle/incubate/nn/functional/fused_rms_norm_cn.rst
@@ -9,7 +9,7 @@ fused_rms_norm
 
 细节可参考论文 `Root Mean Square Layer Normalization <https://arxiv.org/abs/1910.07467>`_ 。
 
-fused_rms_norm 算子目前只支持在 GPU 下运行，
+fused_rms_norm 算子目前只支持在 GPU 下运行。
 
 参数
 ::::::::::::