fast fp16 seq and one mode #157

daquexian · 2023-07-25T09:48:26Z

2080 1.5B model, cuda fp16:

	main	this PR
one mode	0.3496s	0.2191s
seq mode	0.0202s	0.0123s

GPU memory usage keeps the same with main branch.

Signed-off-by: daquexian <[email protected]>

fast fp16 seq and one mode

6cca860

Signed-off-by: daquexian <[email protected]>

daquexian mentioned this pull request Jul 25, 2023

[WIP] Add fast cuda kernels for one mode #154

Closed

daquexian force-pushed the fast branch from 6120499 to 6cca860 Compare July 26, 2023 13:46

daquexian added 18 commits July 28, 2023 20:18

fuse ffn one mix

5e4e6f0

Signed-off-by: daquexian <[email protected]>

add

78c58fb

Signed-off-by: daquexian <[email protected]>

update

9d64d4d

Signed-off-by: daquexian <[email protected]>

update

7627a88

Signed-off-by: daquexian <[email protected]>

fix

48b0f29

Signed-off-by: daquexian <[email protected]>

update

6513f28

Signed-off-by: daquexian <[email protected]>

update for music

9a93bb8

Signed-off-by: daquexian <[email protected]>

Merge branch 'main' into fast

072ef46

Signed-off-by: daquexian <[email protected]>

optimize att one v5

f1202eb

Signed-off-by: daquexian <[email protected]>

update

67cb7fc

Signed-off-by: daquexian <[email protected]>

update

fc992cd

Signed-off-by: daquexian <[email protected]>

stash

70ec1a6

Signed-off-by: daquexian <[email protected]>

stash

1a0be57

Signed-off-by: daquexian <[email protected]>

vectorization

f769f8d

Signed-off-by: daquexian <[email protected]>

update to vectorize

86fb4ca

Signed-off-by: daquexian <[email protected]>

fix duplicated symbol causing cublas error

69bfb70

Signed-off-by: daquexian <[email protected]>

avoid most torch cpu operations

aec55ba

Signed-off-by: daquexian <[email protected]>

reduce more cpu overhead

15eb680

Signed-off-by: daquexian <[email protected]>

daquexian force-pushed the fast branch from d1bc116 to 15eb680 Compare August 12, 2023 12:02

fix att_seq_v5

94d9acf

Signed-off-by: daquexian <[email protected]>

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

fast fp16 seq and one mode #157

fast fp16 seq and one mode #157

Uh oh!

daquexian commented Jul 25, 2023 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Uh oh!

fast fp16 seq and one mode #157

Are you sure you want to change the base?

fast fp16 seq and one mode #157

Uh oh!

Conversation

daquexian commented Jul 25, 2023 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

daquexian commented Jul 25, 2023 •

edited

Loading