UPSTREAM PR #17174: server: (refactor) implement generator-based API for task results by DajanaV · Pull Request #170 · auroralabs-loci/llama.cpp

DajanaV · 2025-11-11T18:41:46Z

This PR adds a generator-based API for receiving task results. It aims to reduce the usage of callback function, making the code looks more "linear", easier to follow.

This also allowing to return correct HTTP error code in streaming case, ref: ggml-org/llama.cpp#16486 (comment)

Example:

server_response_generator gen(ctx_server);
{
    std::vector<server_task> tasks;
    // ... populate tasks ...
    gen.post_tasks(std::move(tasks));
}

// wait for the results
auto all_results = gen.wait_for_all(req.is_connection_closed);

// collect results
if (all_results.is_terminated) {
    return; // connection is closed
} else if (all_results.error) {
    res_error(res, all_results.error->to_json());
    return;
} else {
    for (auto & res : all_results.results) {
        GGML_ASSERT(dynamic_cast<server_task_result_embd*>(res.get()) != nullptr);
        responses.push_back(res->to_json());
    }
}

ngxson added 6 commits November 11, 2025 18:36

server: (refactor) implement generator-based API for task results

dfa2400

improve

88277d8

moving some code

440ce93

fix "Response ended prematurely"

993440e

add sink.done before return false

cc2e397

rm redundant check

31b8b70

DajanaV had a problem deploying to PROD__AL_DEMO November 11, 2025 18:41 — with GitHub Actions Failure

DajanaV force-pushed the main branch 16 times, most recently from 24733fb to 4b4bb7c Compare November 13, 2025 12:15

DajanaV closed this Nov 13, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

UPSTREAM PR #17174: server: (refactor) implement generator-based API for task results#170

UPSTREAM PR #17174: server: (refactor) implement generator-based API for task results#170
DajanaV wants to merge 6 commits intomainfrom
upstream-PR17174-branch_ngxson-xsn/server_response_generator_refactor

DajanaV commented Nov 11, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

DajanaV commented Nov 11, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants