Add support for generator model quantization #34

eriknovak · 2025-02-10T10:35:14Z

This pull request adds the option to load the LLMLabelGenerator in quantized mode. This allows for loading bigger models on the GPU by reducing their size and using bigger and better models to generate entity substitutions.

ninakokalj

Understood. Looks good.

Add support for generator model quantization

efebda0

eriknovak added the enhancement New feature or request label Feb 10, 2025

eriknovak requested a review from ninakokalj February 10, 2025 10:35

eriknovak self-assigned this Feb 10, 2025

ninakokalj reviewed Feb 10, 2025

View reviewed changes

eriknovak merged commit 54f61aa into main Feb 10, 2025
12 checks passed

eriknovak deleted the feature/quant branch February 10, 2025 14:34

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Add support for generator model quantization #34

Add support for generator model quantization #34

Uh oh!

eriknovak commented Feb 10, 2025

Uh oh!

ninakokalj left a comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Add support for generator model quantization #34

Add support for generator model quantization #34

Uh oh!

Conversation

eriknovak commented Feb 10, 2025

Uh oh!

ninakokalj left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants