Addressed TD's comments

tdas · tdas · commit fef3a0dd22ea · 2015-09-23T18:38:34.000-07:00
diff --git a/streaming/src/main/scala/org/apache/spark/streaming/scheduler/BatchInfo.scala b/streaming/src/main/scala/org/apache/spark/streaming/scheduler/BatchInfo.scala
@@ -29,30 +29,17 @@ import org.apache.spark.streaming.Time
  *                        the streaming scheduler queue
  * @param processingStartTime Clock time of when the first job of this batch started processing
  * @param processingEndTime Clock time of when the last job of this batch finished processing
- * @param failureReasons The failure reasons if there are any jobs in this batch failed. The key is
- *                       `outputOpId` and the value is the failure reason.
  */
 @DeveloperApi
 case class BatchInfo(
     batchTime: Time,
     streamIdToInputInfo: Map[Int, StreamInputInfo],
     submissionTime: Long,
     processingStartTime: Option[Long],
-    processingEndTime: Option[Long],
-    private[streaming] val failureReasons: Map[Int, String]) {
+    processingEndTime: Option[Long]
+  ) {
 
-  /**
-   * Create `BatchInfo`. This is for binary compatibility.
-   */
-  def this(
-      batchTime: Time,
-      streamIdToInputInfo: Map[Int, StreamInputInfo],
-      submissionTime: Long,
-      processingStartTime: Option[Long],
-      processingEndTime: Option[Long]) {
-    this(batchTime, streamIdToInputInfo, submissionTime, processingStartTime, processingEndTime,
-      Map.empty)
-  }
+  private var _failureReasons: Map[Int, String] = Map.empty
 
   @deprecated("Use streamIdToInputInfo instead", "1.5.0")
   def streamIdToNumRecords: Map[Int, Long] = streamIdToInputInfo.mapValues(_.numRecords)
@@ -82,21 +69,12 @@ case class BatchInfo(
    * The number of recorders received by the receivers in this batch.
    */
   def numRecords: Long = streamIdToInputInfo.values.map(_.numRecords).sum
-}
 
-@DeveloperApi
-object BatchInfo {
-
-  /**
-   * Create `BatchInfo`. This is for binary compatibility.
-   */
-  def apply(
-      batchTime: Time,
-      streamIdToInputInfo: Map[Int, StreamInputInfo],
-      submissionTime: Long,
-      processingStartTime: Option[Long],
-      processingEndTime: Option[Long]): BatchInfo = {
-    BatchInfo(batchTime, streamIdToInputInfo, submissionTime, processingStartTime,
-      processingEndTime, Map.empty)
+  /** Set the failure reasons corresponding to every output ops in the batch */
+  private[streaming] def setFailureReason(reasons: Map[Int, String]): Unit = {
+    _failureReasons = reasons
   }
+
+  /** Failure reasons corresponding to every output ops in the batch */
+  private[streaming] def failureReasons = _failureReasons
 }
diff --git a/streaming/src/main/scala/org/apache/spark/streaming/scheduler/JobSet.scala b/streaming/src/main/scala/org/apache/spark/streaming/scheduler/JobSet.scala
@@ -73,13 +73,14 @@ case class JobSet(
         Map.empty
       }
     }
-    BatchInfo(
+    val binfo = new BatchInfo(
       time,
       streamIdToInputInfo,
       submissionTime,
       if (processingStartTime >= 0) Some(processingStartTime) else None,
-      if (processingEndTime >= 0) Some(processingEndTime) else None,
-      failureReasons
+      if (processingEndTime >= 0) Some(processingEndTime) else None
     )
+    binfo.setFailureReason(failureReasons)
+    binfo
   }
 }

Original file line number	Diff line number	Diff line change
`@@ -73,13 +73,14 @@ case class JobSet(`
`73`	`73`	`Map.empty`
`74`	`74`	`}`
`75`	`75`	`}`
`76`		`- BatchInfo(`
	`76`	`+ val binfo = new BatchInfo(`
`77`	`77`	`time,`
`78`	`78`	`streamIdToInputInfo,`
`79`	`79`	`submissionTime,`
`80`	`80`	`if (processingStartTime >= 0) Some(processingStartTime) else None,`
`81`		`- if (processingEndTime >= 0) Some(processingEndTime) else None,`
`82`		`- failureReasons`
	`81`	`+ if (processingEndTime >= 0) Some(processingEndTime) else None`
`83`	`82`	`)`
	`83`	`+ binfo.setFailureReason(failureReasons)`
	`84`	`+ binfo`
`84`	`85`	`}`
`85`	`86`	`}`