apache · MaxGekk · Nov 1, 2018 · Nov 1, 2018 · Nov 2, 2018 · Nov 2, 2018
diff --git a/sql/core/benchmarks/JSONBenchmark-results.txt b/sql/core/benchmarks/JSONBenchmark-results.txt
@@ -3,35 +3,35 @@ Benchmark for performance of JSON parsing
 ================================================================================================
 
 Preparing data for benchmarking ...
-OpenJDK 64-Bit Server VM 1.8.0_191-b12 on Linux 3.10.0-862.3.2.el7.x86_64
-Intel(R) Xeon(R) CPU E5-2670 v2 @ 2.50GHz
+Java HotSpot(TM) 64-Bit Server VM 1.8.0_192-b12 on Mac OS X 10.13.6
+Intel(R) Core(TM) i7-4850HQ CPU @ 2.30GHz
 JSON schema inferring:                   Best/Avg Time(ms)    Rate(M/s)   Per Row(ns)   Relative
 ------------------------------------------------------------------------------------------------
-No encoding                                 62946 / 63310          1.6         629.5       1.0X
-UTF-8 is set                              112814 / 112866          0.9        1128.1       0.6X
+No encoding                                 52255 / 52438          1.9         522.5       1.0X
+UTF-8 is set                                76641 / 77110          1.3         766.4       0.7X
 
 Preparing data for benchmarking ...
-OpenJDK 64-Bit Server VM 1.8.0_191-b12 on Linux 3.10.0-862.3.2.el7.x86_64
-Intel(R) Xeon(R) CPU E5-2670 v2 @ 2.50GHz
+Java HotSpot(TM) 64-Bit Server VM 1.8.0_192-b12 on Mac OS X 10.13.6
+Intel(R) Core(TM) i7-4850HQ CPU @ 2.30GHz
 JSON per-line parsing:                   Best/Avg Time(ms)    Rate(M/s)   Per Row(ns)   Relative
 ------------------------------------------------------------------------------------------------
-No encoding                                 16468 / 16553          6.1         164.7       1.0X
-UTF-8 is set                                16420 / 16441          6.1         164.2       1.0X
+No encoding                                 58243 / 58613          1.7         582.4       1.0X
+UTF-8 is set                                81752 / 83249          1.2         817.5       0.7X
 
 Preparing data for benchmarking ...
-OpenJDK 64-Bit Server VM 1.8.0_191-b12 on Linux 3.10.0-862.3.2.el7.x86_64
-Intel(R) Xeon(R) CPU E5-2670 v2 @ 2.50GHz
+Java HotSpot(TM) 64-Bit Server VM 1.8.0_192-b12 on Mac OS X 10.13.6
+Intel(R) Core(TM) i7-4850HQ CPU @ 2.30GHz
 JSON parsing of wide lines:              Best/Avg Time(ms)    Rate(M/s)   Per Row(ns)   Relative
 ------------------------------------------------------------------------------------------------
-No encoding                                 39789 / 40053          0.3        3978.9       1.0X
-UTF-8 is set                                39505 / 39584          0.3        3950.5       1.0X
+No encoding                               117087 / 117211          0.1       11708.7       1.0X
+UTF-8 is set                              142492 / 143970          0.1       14249.2       0.8X
 
-OpenJDK 64-Bit Server VM 1.8.0_191-b12 on Linux 3.10.0-862.3.2.el7.x86_64
-Intel(R) Xeon(R) CPU E5-2670 v2 @ 2.50GHz
+Java HotSpot(TM) 64-Bit Server VM 1.8.0_192-b12 on Mac OS X 10.13.6
+Intel(R) Core(TM) i7-4850HQ CPU @ 2.30GHz
 Count a dataset with 10 columns:         Best/Avg Time(ms)    Rate(M/s)   Per Row(ns)   Relative
 ------------------------------------------------------------------------------------------------
-Select 10 columns + count()                 15997 / 16015          0.6        1599.7       1.0X
-Select 1 column + count()                   13280 / 13326          0.8        1328.0       1.2X
-count()                                       3006 / 3021          3.3         300.6       5.3X
+Select 10 columns + count()                 14592 / 14811          0.7        1459.2       1.0X
+Select 1 column + count()                   10885 / 10994          0.9        1088.5       1.3X
+count()                                       2283 / 2300          4.4         228.3       6.4X
 
 
diff --git a/sql/core/src/test/scala/org/apache/spark/sql/execution/datasources/json/JsonBenchmark.scala b/sql/core/src/test/scala/org/apache/spark/sql/execution/datasources/json/JsonBenchmark.scala
@@ -86,6 +86,7 @@ object JSONBenchmark extends SqlBasedBenchmark {
         spark.read
           .schema(schema)
           .json(path.getAbsolutePath)
+          .filter((_: Row) => true)
           .count()
       }
 
@@ -94,6 +95,7 @@ object JSONBenchmark extends SqlBasedBenchmark {
           .option("encoding", "UTF-8")
           .schema(schema)
           .json(path.getAbsolutePath)
+          .filter((_: Row) => true)
           .count()
       }
 
@@ -126,6 +128,7 @@ object JSONBenchmark extends SqlBasedBenchmark {
         spark.read
           .schema(schema)
           .json(path.getAbsolutePath)
+          .filter((_: Row) => true)
           .count()
       }
 
@@ -134,6 +137,7 @@ object JSONBenchmark extends SqlBasedBenchmark {
           .option("encoding", "UTF-8")
           .schema(schema)
           .json(path.getAbsolutePath)
+          .filter((_: Row) => true)
           .count()
       }