Make cross-review default for multi-agent; add --no-cross-review flag by chefsale · Pull Request #37 · calimero-network/ai-code-reviewer

chefsale · 2026-02-11T10:37:24Z

Note

Medium Risk
Changes review output semantics by filtering/reordering findings via a new cross-review pass and alters when REQUEST_CHANGES is posted, which can affect CI/merge gating and reviewer signal.

Overview
Multi-agent reviews now default to 3 agents (CLI, webhook env defaults, and the ai-review GitHub Actions workflow), and a new cross-review second round is enabled by default for --agents>=2.

This adds --no-cross-review and --min-agreement controls (plus webhook env vars like ENABLE_CROSS_REVIEW/MIN_VALIDATION_AGREEMENT) and implements logic to have agents validate and rank consolidated findings, dropping low-agreement items and reordering by consensus.

GitHub review posting behavior is softened to only use REQUEST_CHANGES for critical findings; warnings/suggestions/nitpicks now result in COMMENT so authors aren’t blocked. Tests are expanded to cover the new cross-review parsing/filtering and the updated review-action rules.

^{Written by Cursor Bugbot for commit 8d5a5c6. This will update automatically on new commits. Configure here.}

Co-authored-by: Cursor <[email protected]>

xilosada

🤖 MeroReviewer

Reviewed by 2 agents | Quality score: 33% | Review time: 148.4s

🟡 1 warnings, 💡 2 suggestions, 📝 1 nitpicks. See inline comments.

_{🤖 Generated by MeroReviewer | Review ID: review-e3bdba4a}

src/ai_reviewer/review.py

src/ai_reviewer/cli.py

src/ai_reviewer/review.py

…greement; workflow defaults Co-authored-by: Cursor <[email protected]>

Co-authored-by: Cursor <[email protected]>

xilosada

🤖 MeroReviewer

Reviewed by 3 agents | Quality score: 33% | Review time: 186.6s

✅ 3 fixed | 🆕 4 new. See inline comments.

_{🤖 Generated by MeroReviewer | Review ID: review-58d0e720}

src/ai_reviewer/review.py

src/ai_reviewer/cli.py

src/ai_reviewer/github/webhook.py

src/ai_reviewer/review.py

…nv vars; tests Co-authored-by: Cursor <[email protected]>

xilosada · 2026-02-11T11:30:25Z

Reviewed by 2 agents | Quality score: 33% | Review time: 148.4s

I think the Quality score isn't working at all

xilosada

🤖 MeroReviewer

Reviewed by 3 agents | Quality score: 33% | Review time: 1037.6s

✅ 7 fixed | 🆕 6 new. See inline comments.

_{🤖 Generated by MeroReviewer | Review ID: review-0c42e713}

src/ai_reviewer/review.py

src/ai_reviewer/github/webhook.py

tests/test_review.py

src/ai_reviewer/review.py

tests/test_review.py

…webhook env validation Co-authored-by: Cursor <[email protected]>

xilosada

🤖 MeroReviewer

Reviewed by 3 agents | Quality score: 33% | Review time: 226.3s

✅ 13 fixed | 🆕 6 new. See inline comments.

_{🤖 Generated by MeroReviewer | Review ID: review-9aed8352}

src/ai_reviewer/review.py

src/ai_reviewer/github/webhook.py

src/ai_reviewer/review.py

cursor

Cursor Bugbot has reviewed your changes and found 2 potential issues.

^{Bugbot Autofix is OFF. To automatically fix reported issues with Cloud Agents, enable Autofix in the Cursor dashboard.}

src/ai_reviewer/review.py

…s; test finding_id alias and no false re-ranked Co-authored-by: Cursor <[email protected]>

xilosada

🤖 MeroReviewer

Reviewed by 3 agents | Quality score: 33% | Review time: 461.1s

✅ 19 fixed | 🆕 1 new. See inline comments.

_{🤖 Generated by MeroReviewer | Review ID: review-6bbd4a7a}

src/ai_reviewer/review.py

cursor

Cursor Bugbot has reviewed your changes and found 1 potential issue.

^{Bugbot Autofix is OFF. To automatically fix reported issues with Cloud Agents, enable Autofix in the Cursor dashboard.}

cursor · 2026-02-11T12:52:58Z

src/ai_reviewer/review.py

+        return assessments, summary
+    except json.JSONDecodeError as e:
+        logger.warning(f"Failed to parse cross-review JSON: {e}")
+        return [], ""


Duplicated JSON parsing logic across two functions

Low Severity

parse_cross_review_response nearly duplicates parse_review_response — both share identical markdown-fence extraction, regex-based JSON matching, and try/except parsing structure. The only differences are the regex key ("assessments" vs "findings"), the extracted data key, and default return values. A shared helper like _extract_json_from_llm_response(content, key) would eliminate ~14 lines of duplicated logic and ensure any future parsing fix applies to both paths. The same pattern also exists in CursorClient._parse_json_response.

Additional Locations (1)

src/ai_reviewer/review.py#L365-L392

…s; comment on greedy regex Co-authored-by: Cursor <[email protected]>

xilosada

🤖 MeroReviewer

Reviewed by 3 agents | Quality score: 33% | Review time: 241.3s

✅ 20 fixed | 🆕 2 new. See inline comments.

_{🤖 Generated by MeroReviewer | Review ID: review-3cf5e9fd}

src/ai_reviewer/github/webhook.py

src/ai_reviewer/review.py

cursor

Cursor Bugbot has reviewed your changes and found 1 potential issue.

^{Bugbot Autofix is OFF. To automatically fix reported issues with Cloud Agents, enable Autofix in the Cursor dashboard.}

cursor · 2026-02-11T13:10:21Z

src/ai_reviewer/review.py

+                rank = max(1, int(rank))
+            else:
+                rank = 99
+            id_to_votes[fid].append((valid, rank))


String "false" for valid treated as truthy

Medium Severity

The rank field gets defensive type checking (isinstance guard), but the valid field at line 310 does not. If an LLM returns "valid": "false" as a JSON string instead of a boolean, json.loads produces the Python string "false", which is truthy. The vote-counting expression sum(1 for v, _ in votes if v) then counts it as a valid vote, completely inverting the agent's intended assessment. This silently prevents cross-review from ever dropping that finding.

Additional Locations (1)

src/ai_reviewer/review.py#L324-L325

…review findings truncated Co-authored-by: Cursor <[email protected]>

xilosada

🤖 MeroReviewer

Reviewed by 3 agents | Quality score: 33% | Review time: 331.2s

✅ 19 fixed | 🆕 1 new. See inline comments.

_{🤖 Generated by MeroReviewer | Review ID: review-0b77fa96}

cursor

Cursor Bugbot has reviewed your changes and found 2 potential issues.

^{Bugbot Autofix is OFF. To automatically fix reported issues with Cloud Agents, enable Autofix in the Cursor dashboard.}

src/ai_reviewer/review.py

- Recompute review_quality_score in apply_cross_review from valid_ratio (avg_valid_ratio * agent_factor) so displayed score reflects post-filter state - Coerce LLM 'valid' field to bool (string 'false' -> False) to avoid incorrect votes when JSON returns string instead of boolean - Add tests: quality_score recalculation, valid string coercion Co-authored-by: Cursor <[email protected]>

xilosada

🤖 MeroReviewer

Reviewed by 3 agents | Quality score: 89% | Review time: 331.9s

✅ 19 fixed | 🆕 3 new. See inline comments.

_{🤖 Generated by MeroReviewer | Review ID: review-a2b6acd5}

src/ai_reviewer/review.py

tests/test_review.py

src/ai_reviewer/review.py

Co-authored-by: Cursor <[email protected]>

xilosada

🤖 MeroReviewer

Reviewed by 3 agents | Quality score: 95% | Review time: 288.1s

✅ Ready to Merge

All previously identified issues have been addressed!

✅ Fixed Issues

The following issues from previous reviews have been addressed:

~~Cross-review agents run sequentially, not in parallel~~ (src/ai_reviewer/review.py:635)
~~min_validation_agreement is hardcoded; consider exposing as CLI flag~~ (src/ai_reviewer/cli.py:172)
~~Nit: Summary always appends cross-review note even if nothing changed~~ (src/ai_reviewer/review.py:348)
~~New cross-review functionality lacks test coverage~~ (src/ai_reviewer/review.py:194)
~~Diff truncation may cut mid-line or mid-file~~ (src/ai_reviewer/review.py:232)
~~Nit: min-agreement behavior with 2 agents may surprise users~~ (src/ai_reviewer/cli.py:67)
~~False positive for 'order_changed' when findings are dropped~~ (src/ai_reviewer/review.py:340)
~~Unvalidated environment variable parsing can cause service denial~~ (src/ai_reviewer/github/webhook.py:157)
~~Test does not catch the order_changed bug~~ (tests/test_review.py:593)
~~Cross-review runs all agents regardless of round-1 failures~~ (src/ai_reviewer/review.py:765)
~~Findings with no votes get rank 99, silently pushed to end~~ (src/ai_reviewer/review.py:316)
~~Missing test for finding_id key alias in assessments~~ (tests/test_review.py:470)
~~Silent cross-review agent failures reduce validation quality~~ (src/ai_reviewer/review.py:308)
~~Greedy regex may over-match JSON content~~ (src/ai_reviewer/review.py:270)
~~Diff truncation could leave incomplete diff hunk header~~ (src/ai_reviewer/review.py:232)
~~DRY: JSON extraction logic duplicated between parse functions~~ (src/ai_reviewer/review.py:262)
~~Nit: Undocumented behavior for findings with zero votes~~ (src/ai_reviewer/review.py:299)
~~Greedy regex may capture extra content in edge cases~~ (src/ai_reviewer/review.py:275)
~~Consider logging when findings exceed cross-review limit~~ (src/ai_reviewer/review.py:197)
~~Consider documenting the cross-review cost tradeoff~~ (src/ai_reviewer/review.py:267)
~~Nit: Module-level constant mutation in test~~ (tests/test_review.py:601)
~~Nit: Greedy regex could over-match with multiple JSON objects~~ (src/ai_reviewer/review.py:276)

_{🤖 Generated by MeroReviewer | Review ID: review-525ad5bf}

Make cross-review default for multi-agent; add --no-cross-review flag

5c735b7

Co-authored-by: Cursor <[email protected]>

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/cli.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

cursor bot reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Outdated Show resolved Hide resolved

src/ai_reviewer/review.py Outdated Show resolved Hide resolved

chefsale and others added 2 commits February 11, 2026 11:55

Default 3 agents; cross-review parallel, conditional summary, --min-a…

22dc02d

…greement; workflow defaults Co-authored-by: Cursor <[email protected]>

Cross-review: use len(votes) for valid_ratio; default min-agreement 2/3

5deec74

Co-authored-by: Cursor <[email protected]>

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/cli.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/github/webhook.py Outdated Show resolved Hide resolved

cursor bot reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Outdated Show resolved Hide resolved

Cross-review: diff truncate at newline; min-agreement help; webhook e…

1630f1f

…nv vars; tests Co-authored-by: Cursor <[email protected]>

xilosada approved these changes Feb 11, 2026

View reviewed changes

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/github/webhook.py Outdated Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

tests/test_review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

tests/test_review.py Show resolved Hide resolved

LGTM-with-comments docs and tests; fix order_changed false positive; …

4ea7c7a

…webhook env validation Co-authored-by: Cursor <[email protected]>

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/github/webhook.py Outdated Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Outdated Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

cursor bot reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

src/ai_reviewer/review.py Outdated Show resolved Hide resolved

Cross-review: docstring for unvoted rank 99; filter by round-1 succes…

2e072e8

…s; test finding_id alias and no false re-ranked Co-authored-by: Cursor <[email protected]>

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

cursor bot reviewed Feb 11, 2026

View reviewed changes

PR feedback: diff truncate only when needed; exclude empty assessment…

d09ec6e

…s; comment on greedy regex Co-authored-by: Cursor <[email protected]>

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/github/webhook.py Outdated Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

cursor bot reviewed Feb 11, 2026

View reviewed changes

Centralize env parsing (_get_env_int/_get_env_float); log when cross-…

2ab2c76

…review findings truncated Co-authored-by: Cursor <[email protected]>

xilosada reviewed Feb 11, 2026

View reviewed changes

cursor bot reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

src/ai_reviewer/review.py Outdated Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

tests/test_review.py Outdated Show resolved Hide resolved

xilosada reviewed Feb 11, 2026

View reviewed changes

src/ai_reviewer/review.py Outdated Show resolved Hide resolved

refactor: DRY JSON parsing, cross-review cost comment, test monkeypatch

8d5a5c6

Co-authored-by: Cursor <[email protected]>

xilosada reviewed Feb 11, 2026

View reviewed changes

chefsale merged commit dea5afe into master Feb 11, 2026
2 checks passed

Conversation

chefsale commented Feb 11, 2026 • edited by cursor bot Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

xilosada left a comment

Choose a reason for hiding this comment

🤖 MeroReviewer

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

xilosada left a comment

Choose a reason for hiding this comment

🤖 MeroReviewer

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

xilosada commented Feb 11, 2026

Uh oh!

xilosada left a comment

Choose a reason for hiding this comment

🤖 MeroReviewer

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

xilosada left a comment

Choose a reason for hiding this comment

🤖 MeroReviewer

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

cursor bot left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

xilosada left a comment

Choose a reason for hiding this comment

🤖 MeroReviewer

Uh oh!

Uh oh!

cursor bot left a comment

Choose a reason for hiding this comment

Uh oh!

cursor bot Feb 11, 2026

Choose a reason for hiding this comment

Duplicated JSON parsing logic across two functions

Uh oh!

xilosada left a comment

Choose a reason for hiding this comment

🤖 MeroReviewer

Uh oh!

Uh oh!

Uh oh!

cursor bot left a comment

Choose a reason for hiding this comment

Uh oh!

cursor bot Feb 11, 2026

Choose a reason for hiding this comment

String "false" for valid treated as truthy

Uh oh!

xilosada left a comment

Choose a reason for hiding this comment

🤖 MeroReviewer

Uh oh!

cursor bot left a comment

Choose a reason for hiding this comment

chefsale commented Feb 11, 2026 •

edited by cursor bot

Loading

String `"false"` for `valid` treated as truthy