apache · miccagiann · Jul 28, 2014 · Jul 30, 2014 · Jul 31, 2014 · Jul 31, 2014
diff --git a/mllib/src/main/scala/org/apache/spark/mllib/api/python/PythonMLLibAPI.scala b/mllib/src/main/scala/org/apache/spark/mllib/api/python/PythonMLLibAPI.scala
@@ -24,6 +24,7 @@ import org.apache.spark.api.java.{JavaSparkContext, JavaRDD}
 import org.apache.spark.mllib.classification._
 import org.apache.spark.mllib.clustering._
 import org.apache.spark.mllib.linalg.{SparseVector, Vector, Vectors}
+import org.apache.spark.mllib.optimization._
 import org.apache.spark.mllib.recommendation._
 import org.apache.spark.mllib.regression._
 import org.apache.spark.mllib.util.MLUtils
@@ -247,16 +248,24 @@ class PythonMLLibAPI extends Serializable {
       dataBytesJRDD: JavaRDD[Array[Byte]],
       numIterations: Int,
       stepSize: Double,
+      regParam: Double,
+      regType: String,
+      intercept: Boolean,
       miniBatchFraction: Double,
       initialWeightsBA: Array[Byte]): java.util.List[java.lang.Object] = {
+    val lrAlg = new LinearRegressionWithSGD()
+    lrAlg.setIntercept(intercept)
+    lrAlg.optimizer.
+      setNumIterations(numIterations).
+      setRegParam(regParam).
+      setStepSize(stepSize)
+    if (regType == "SquaredUpdater")
+      lrAlg.optimizer.setUpdater(new SquaredL2Updater)
+    else if (regType == "L1Updater")
+      lrAlg.optimizer.setUpdater(new L1Updater)
     trainRegressionModel(
       (data, initialWeights) =>
-        LinearRegressionWithSGD.train(
-          data,
-          numIterations,
-          stepSize,
-          miniBatchFraction,
-          initialWeights),
+        lrAlg.run(data, initialWeights),
       dataBytesJRDD,
       initialWeightsBA)
   }

diff --git a/python/pyspark/mllib/regression.py b/python/pyspark/mllib/regression.py
@@ -109,18 +109,27 @@ class LinearRegressionModel(LinearRegressionModelBase):
     True
     """
 
-
 class LinearRegressionWithSGD(object):
     @classmethod
-    def train(cls, data, iterations=100, step=1.0,
-              miniBatchFraction=1.0, initialWeights=None):
-        """Train a linear regression model on the given data."""
+    def train(cls, data, iterations=100, step=1.0, regParam=1.0, regType=None,
+              intercept=False, miniBatchFraction=1.0, initialWeights=None):
+        """Train a linear regression model on the given data. The 'regType' parameter can take
+           one from the following string values: "L1Updater" for invoking the lasso regularizer,
+           "SquaredUpdater" for invoking the ridge regularizer or "NONE" for not using a
+           regularizer at all. The user can determine the regularizer parameter by setting the
+           appropriate value to variable 'regParam' (by default is set to 1.0)."""
         sc = data.context
-        train_f = lambda d, i: sc._jvm.PythonMLLibAPI().trainLinearRegressionModelWithSGD(
-            d._jrdd, iterations, step, miniBatchFraction, i)
+        if regType is None:
+            train_f = lambda d, i: sc._jvm.PythonMLLibAPI().trainLinearRegressionModelWithSGD(
+                d._jrdd, iterations, step, regParam, "NONE", intercept, miniBatchFraction, i)
+        elif regType == "SquaredUpdater" or regType == "L1Updater" or regType == "NONE":
+            train_f = lambda d, i: sc._jvm.PythonMLLibAPI().trainLinearRegressionModelWithSGD(
+                d._jrdd, iterations, step, regParam, regType, intercept, miniBatchFraction, i)
+        else:
+            raise ValueError("Invalid value for 'regType' parameter. Can only be initialized " +
+                             "using the following string values [L1Updater, SquaredUpdater, NONE].")
         return _regression_train_wrapper(sc, train_f, LinearRegressionModel, data, initialWeights)
 
-
 class LassoModel(LinearRegressionModelBase):
     """A linear regression model derived from a least-squares fit with an
     l_1 penalty term.