Leveraging Pre-trained Checkpoints for Sequence Generation Tasks

# Leveraging Pre-trained Checkpoints for Sequence Generation Tasks
系列変換タスクにおける、BERTやRoBERTa、GPT-2などの大規模事前学習モデルの効果を検証した論文。系列変換タスクとして、機械翻訳や要約、文融合などのタスクを扱っており、大規模な実験を行っている。結果として、BERT2GPTでは、初期値をランダムに設定した場合よりも性能が劣ること及びEncoderとDecoderのVocabularyを一致させることの重要性、EncoderとDecoderの重みを共有することで高い性能を達成できることを示した。

<p align="center">
<img width="500" src="https://user-images.githubusercontent.com/53220859/102100342-ab85e100-3e6c-11eb-8714-1993bc0b6ec1.png">
<img width="500" src="https://user-images.githubusercontent.com/53220859/102100323-a7f25a00-3e6c-11eb-9ca5-cfbf03284814.png">
</p>

## 文献情報
- 著者: Sascha Rothe, Shashi Narayan, Aliaksei Severyn
- リンク: [https://arxiv.org/abs/1907.12461](https://arxiv.org/abs/1907.12461)
- 学会: TACL2020


Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Leveraging Pre-trained Checkpoints for Sequence Generation Tasks #135

Leveraging Pre-trained Checkpoints for Sequence Generation Tasks

文献情報

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Leveraging Pre-trained Checkpoints for Sequence Generation Tasks #135

Description

Leveraging Pre-trained Checkpoints for Sequence Generation Tasks

文献情報

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions