Eventual-Inc · universalmind303 · Sep 16, 2024 · Aug 28, 2024 · Aug 28, 2024 · Sep 3, 2024
diff --git a/daft/daft/__init__.pyi b/daft/daft/__init__.pyi
@@ -1106,10 +1106,6 @@ class PyExpr:
     def __repr__(self) -> str: ...
     def __hash__(self) -> int: ...
     def __reduce__(self) -> tuple: ...
-    def is_nan(self) -> PyExpr: ...
-    def is_inf(self) -> PyExpr: ...
-    def not_nan(self) -> PyExpr: ...
-    def fill_nan(self, fill_value: PyExpr) -> PyExpr: ...
     def dt_date(self) -> PyExpr: ...
     def dt_day(self) -> PyExpr: ...
     def dt_hour(self) -> PyExpr: ...
@@ -1255,6 +1251,14 @@ def image_encode(expr: PyExpr, image_format: ImageFormat) -> PyExpr: ...
 def image_resize(expr: PyExpr, w: int, h: int) -> PyExpr: ...
 def image_to_mode(expr: PyExpr, mode: ImageMode) -> PyExpr: ...
 
+# ---
+# expr.float namespace
+# ---
+def is_nan(expr: PyExpr) -> PyExpr: ...
+def is_inf(expr: PyExpr) -> PyExpr: ...
+def not_nan(expr: PyExpr) -> PyExpr: ...
+def fill_nan(expr: PyExpr, fill_value: PyExpr) -> PyExpr: ...
+
 # ---
 # expr.json namespace
 # ---

diff --git a/daft/expressions/expressions.py b/daft/expressions/expressions.py
@@ -1362,7 +1362,7 @@ def is_nan(self) -> Expression:
         Returns:
             Expression: Boolean Expression indicating whether values are invalid.
         """
-        return Expression._from_pyexpr(self._expr.is_nan())
+        return Expression._from_pyexpr(native.is_nan(self._expr))
 
     def is_inf(self) -> Expression:
         """Checks if values in the Expression are Infinity.
@@ -1394,7 +1394,7 @@ def is_inf(self) -> Expression:
         Returns:
             Expression: Boolean Expression indicating whether values are Infinity.
         """
-        return Expression._from_pyexpr(self._expr.is_inf())
+        return Expression._from_pyexpr(native.is_inf(self._expr))
 
     def not_nan(self) -> Expression:
         """Checks if values are not NaN (a special float value indicating not-a-number)
@@ -1424,7 +1424,7 @@ def not_nan(self) -> Expression:
         Returns:
             Expression: Boolean Expression indicating whether values are not invalid.
         """
-        return Expression._from_pyexpr(self._expr.not_nan())
+        return Expression._from_pyexpr(native.not_nan(self._expr))
 
     def fill_nan(self, fill_value: Expression) -> Expression:
         """Fills NaN values in the Expression with the provided fill_value
@@ -1453,7 +1453,7 @@ def fill_nan(self, fill_value: Expression) -> Expression:
         """
 
         fill_value = Expression._to_expression(fill_value)
-        expr = self._expr.fill_nan(fill_value._expr)
+        expr = native.fill_nan(self._expr, fill_value._expr)
         return Expression._from_pyexpr(expr)
 
 

diff --git a/src/daft-dsl/src/functions/float/fill_nan.rs b/src/daft-dsl/src/functions/float/fill_nan.rs
diff --git a/src/daft-dsl/src/functions/float/mod.rs b/src/daft-dsl/src/functions/float/mod.rs
diff --git a/src/daft-dsl/src/functions/float/not_nan.rs b/src/daft-dsl/src/functions/float/not_nan.rs
diff --git a/src/daft-dsl/src/functions/mod.rs b/src/daft-dsl/src/functions/mod.rs
@@ -1,4 +1,3 @@
-pub mod float;
 pub mod list;
 pub mod map;
 pub mod numeric;
@@ -15,7 +14,6 @@ use std::hash::Hash;
 
 use crate::{Expr, ExprRef, Operator};
 
-use self::float::FloatExpr;
 use self::list::ListExpr;
 use self::map::MapExpr;
 use self::numeric::NumericExpr;
@@ -37,7 +35,6 @@ use python::PythonUDF;
 #[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq, Hash)]
 pub enum FunctionExpr {
     Numeric(NumericExpr),
-    Float(FloatExpr),
     Utf8(Utf8Expr),
     Temporal(TemporalExpr),
     List(ListExpr),
@@ -65,7 +62,6 @@ impl FunctionExpr {
         use FunctionExpr::*;
         match self {
             Numeric(expr) => expr.get_evaluator(),
-            Float(expr) => expr.get_evaluator(),
             Utf8(expr) => expr.get_evaluator(),
             Temporal(expr) => expr.get_evaluator(),
             List(expr) => expr.get_evaluator(),

diff --git a/src/daft-dsl/src/python.rs b/src/daft-dsl/src/python.rs
@@ -579,26 +579,6 @@ impl PyExpr {
         hasher.finish()
     }
 
-    pub fn is_nan(&self) -> PyResult<Self> {
-        use functions::float::is_nan;
-        Ok(is_nan(self.into()).into())
-    }
-
-    pub fn is_inf(&self) -> PyResult<Self> {
-        use functions::float::is_inf;
-        Ok(is_inf(self.into()).into())
-    }
-
-    pub fn not_nan(&self) -> PyResult<Self> {
-        use functions::float::not_nan;
-        Ok(not_nan(self.into()).into())
-    }
-
-    pub fn fill_nan(&self, fill_value: &Self) -> PyResult<Self> {
-        use functions::float::fill_nan;
-        Ok(fill_nan(self.into(), fill_value.expr.clone()).into())
-    }
-
     pub fn dt_date(&self) -> PyResult<Self> {
         use functions::temporal::date;
         Ok(date(self.into()).into())

diff --git a/src/daft-functions/src/float/fill_nan.rs b/src/daft-functions/src/float/fill_nan.rs
@@ -0,0 +1,70 @@
+use common_error::{DaftError, DaftResult};
+use daft_core::{
+    prelude::{Field, Schema},
+    series::Series,
+    utils::supertype::try_get_supertype,
+};
+use daft_dsl::{
+    functions::{ScalarFunction, ScalarUDF},
+    ExprRef,
+};
+use serde::{Deserialize, Serialize};
+
+#[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq, Hash)]
+pub struct FillNan {}
+
+#[typetag::serde]
+impl ScalarUDF for FillNan {
+    fn as_any(&self) -> &dyn std::any::Any {
+        self
+    }
+    fn name(&self) -> &'static str {
+        "fill_nan"
+    }
+
+    fn to_field(&self, inputs: &[ExprRef], schema: &Schema) -> DaftResult<Field> {
+        match inputs {
+            [data, fill_value] => match (data.to_field(schema), fill_value.to_field(schema)) {
+                (Ok(data_field), Ok(fill_value_field)) => {
+                    match (&data_field.dtype.is_floating(), &fill_value_field.dtype.is_floating(), try_get_supertype(&data_field.dtype, &fill_value_field.dtype)) {
+                        (true, true, Ok(dtype)) => Ok(Field::new(data_field.name, dtype)),
+                        _ => Err(DaftError::TypeError(format!(
+                            "Expects input for fill_nan to be float, but received {data_field} and {fill_value_field}",
+                        ))),
+                    }
+                }
+                (Err(e), _) | (_, Err(e)) => Err(e),
+            },
+            _ => Err(DaftError::SchemaMismatch(format!(
+                "Expected 2 input args, got {}",
+                inputs.len()
+            ))),
+        }
+    }
+
+    fn evaluate(&self, inputs: &[Series]) -> DaftResult<Series> {
+        match inputs {
+            [data, fill_value] => data.fill_nan(fill_value),
+            _ => Err(DaftError::ValueError(format!(
+                "Expected 2 input args, got {}",
+                inputs.len()
+            ))),
+        }
+    }
+}
+
+pub fn fill_nan(input: ExprRef, fill_value: ExprRef) -> ExprRef {
+    ScalarFunction::new(FillNan {}, vec![input, fill_value]).into()
+}
+
+#[cfg(feature = "python")]
+use {
+    daft_dsl::python::PyExpr,
+    pyo3::{pyfunction, PyResult},
+};
+#[cfg(feature = "python")]
+#[pyfunction]
+#[pyo3(name = "fill_nan")]
+pub fn py_fill_nan(expr: PyExpr, fill_value: PyExpr) -> PyResult<PyExpr> {
+    Ok(fill_nan(expr.into(), fill_value.into()).into())
+}