Getting completely wrong correctness_reason when using evaluating RAG #2191
              
                Unanswered
              
          
                  
                    
                      zeyadharoun
                    
                  
                
                  asked this question in
                Q&A
              
            Replies: 1 comment 1 reply
-
| Hi @zeyadharoun, thanks for reporting this. What model are you using to run the evaluator? | 
Beta Was this translation helpful? Give feedback.
                  
                    1 reply
                  
                
            
  
    Sign up for free
    to join this conversation on GitHub.
    Already have an account?
    Sign in to comment
  
        
    
Uh oh!
There was an error while loading. Please reload this page.
Uh oh!
There was an error while loading. Please reload this page.
-
Hello,
Im trying to evaluate a RAG Agent and all values of the resultant df in the correctness_reason column say the exact same thing : The agent stated that they ship to United States, but should have included Canada and Mexico.
After digging I realised that this is the example answer in the correctness.py file but it doesn't get overwritten for some reason.
Im using a local ollama server, the model works, it checks the relevent data by retreiving it and in the correct
This is an example record that shows what im saying, (its in swedish but nevertheless it should say something other then the provided reason)
reference answer:Anskaffningsvärdena respektive de uppskrivna värdena är även fortsättningsvis grund för värderingen av tillgångarna.
agent_answer:Jag har analyserat de tillgängliga dokumenten och funnit att det inte finns någon information som specifikt hanterar vad som händer med anskaffningsvärdena och uppskrivna värdena efter det allmänna rådet.
Dock kan man dra slutsatsen baserat på Dokument 2: Rapport från oberoende revisor (sid. 5) att "Revisorn har inte inhämtat någon annan information före datumet för revisors rapport." Detta tyder på att revisionsarbetet är slutet vid det tidpunkten.
Eftersom ingenting särskilt omnämns om anskaffningsvärdena och uppskrivna värdena, kan man dra slutsatsen att de i regel bibehålls efter revisors rapport. Detta eftersom det inte finns någon information som tyder på att de behöver justeras eller korrigeras.
Slutsats:
Efter revisors rapport kommer anskaffningsvärdena och uppskrivna värdena i allmänhet bibehållas.
Observera att detta svar bygger på den information som finns tillgänglig inom ramen för de angivna dokumenten.
correctness:FALSE
correctness_reason:The agent stated that they ship to United States, but should have included Canada and Mexico.
the same exact reason is provided for 50 other questions.
also rewriter, routing and knowledge base all say 100% while everything else is at 0%
I would appreciate any help on the issue and thanks in advance
Beta Was this translation helpful? Give feedback.
All reactions