dask-contrib · sarahyurick · Aug 3, 2021 · Aug 3, 2021 · Aug 12, 2021 · Aug 13, 2021
@@ -345,15 +345,18 @@ def _perform_aggregation(
         grouped_df = tmp_df.groupby(by=group_columns_and_nulls)
 
         # Convert into the correct format for dask
-        aggregations_dict = defaultdict(dict)
+        aggregations_dict = defaultdict(list)
+        input_output_cols = []
         for aggregation in aggregations:
             input_col, output_col, aggregation_f = aggregation
 
-            aggregations_dict[input_col][output_col] = aggregation_f
+            aggregations_dict[input_col].append(aggregation_f)
+            input_output_cols.append((input_col, output_col))
 
         # Now apply the aggregation
         logger.debug(f"Performing aggregation {dict(aggregations_dict)}")
         agg_result = grouped_df.agg(aggregations_dict)
+        agg_result.columns = input_output_cols
 
         # ... fix the column names to a single level ...
         agg_result.columns = agg_result.columns.get_level_values(-1)