Skip to content

请求增加优先级参数,优先调度高优先级的请求 #2669

@781574155

Description

@781574155

Feature request / 功能建议

如题。我们在实际生产环境中,需要长时间跑一些文件处理任务(比如写摘要,且对于单个大文件又要拆分为很多小的请求)。与此同时,用户可能有大模型聊天的需求。如果没有优先级,会导致聊天请求要排队等待前面的文件处理任务执行完,才慢慢调度到聊天的请求。这显然是不能接受的。现在的情况是,我们一有文件在处理(比如几百个),就(基本)无法聊天了

Motivation / 动机

我希望咱们能扩展openai的参数,增加一个priority的参数。我不希望是增加新的接口。我希望能够保持我的程序能随时切换到任何支持openai接口的大模型。

Your contribution / 您的贡献

Metadata

Metadata

Assignees

No one assigned

    Type

    No type

    Projects

    No projects

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions