IQVIA-ML · yaxxie · Nov 29, 2021 · Nov 18, 2021 · Nov 28, 2021 · Nov 28, 2021
diff --git a/src/wrapper.jl b/src/wrapper.jl
@@ -111,7 +111,9 @@ sparsedatatype(x::SparseArrays.SparseMatrixCSC{Float64, <:Integer}) = C_API_DTYP
 sparsedatatype(x::SparseArrays.SparseMatrixCSC{<:Any, <:Integer}) = throw(TypeError(:sparsedatatype, AbstractFloat, one(eltype(x.nzval))))
 
 
-
+# Floating point conversion helpers
+tofloat32(x::Vector{<:AbstractFloat}) = Float32.(x)
+tofloat32(x::Vector{Float32}) = x
 
 
 macro lightgbm(f, params...)
@@ -465,7 +467,38 @@ function LGBM_BoosterUpdateOneIter(bst::Booster)
     return is_finished[]
 end
 
-# function LGBM_BoosterUpdateOneIterCustom()
+"""
+LGBM_BoosterUpdateOneIterCustom
+Pass grads and 2nd derivatives corresponding to some custom loss function
+grads and 2nd derivatives must be same cardinality as training data
+Also, trying to run this on a booster without data will fail.
+"""
+function LGBM_BoosterUpdateOneIterCustom(bst::Booster, grads::Vector{<:AbstractFloat}, hessian::Vector{<:AbstractFloat})
+
+    if length(bst.datasets) == 0
+        throw(ErrorException("Booster does not have any training data associated"))
+    end
+    numdata = LGBM_DatasetGetNumData(first(bst.datasets))
+    nummodels = LGBM_BoosterNumModelPerIteration(bst)
+
+    if !((numdata*nummodels) == length(grads) == length(hessian))
+        throw(DimensionMismatch(
+            "Gradients sizes ($(length(grads)), $(length(hessian))) don't match training data size ($numdata) * ($nummodels)"
+        ))
+    end
+
+    grads = tofloat32(grads)
+    hessian = tofloat32(hessian)
+
+    is_finished = Ref{Cint}()
+    @lightgbm(:LGBM_BoosterUpdateOneIterCustom,
+              bst.handle => BoosterHandle,
+              grads => Ptr{Cfloat},
+              hessian => Ptr{Cfloat},
+              is_finished => Ref{Cint})
+    return is_finished[]
+
+end
 
 function LGBM_BoosterRollbackOneIter(bst::Booster)
     @lightgbm(:LGBM_BoosterRollbackOneIter,
@@ -752,3 +785,11 @@ end
 # function LGBM_BoosterDumpModel()
 # function LGBM_BoosterGetLeafValue()
 # function LGBM_BoosterSetLeafValue()
+
+function LGBM_BoosterNumModelPerIteration(bst::Booster)
+    out_models = Ref{Cint}()
+    @lightgbm(:LGBM_BoosterNumModelPerIteration,
+              bst.handle => BoosterHandle,
+              out_models => Ref{Cint})
+    return out_models[]
+end
diff --git a/test/ffi/booster.jl b/test/ffi/booster.jl
@@ -161,12 +161,63 @@ end
 end
 
 
+@testset "LGBM_BoosterUpdateOneIterCustom" begin
+
+    numdata = 1000
+    mymat = randn(numdata, 2)
+    labels = randn(numdata)
+    dataset = LightGBM.LGBM_DatasetCreateFromMat(mymat, verbosity)
+    LightGBM.LGBM_DatasetSetField(dataset, "label", labels)
+    # default params won't allow this to learn anything from this useless data set (i.e. splitting completes)
+    booster = LightGBM.LGBM_BoosterCreate(dataset, verbosity)
+
+    finished = LightGBM.LGBM_BoosterUpdateOneIterCustom(booster, randn(numdata), rand(numdata))
+    pred1 = LightGBM.LGBM_BoosterGetPredict(booster, 0)
+    # check both types of float work
+    finished = LightGBM.LGBM_BoosterUpdateOneIterCustom(booster, Float32.(randn(numdata)), Float32.(rand(numdata)))
+    pred2 = LightGBM.LGBM_BoosterGetPredict(booster, 0)
+    @test !isapprox(pred1, pred2; rtol=1e-5) # show that the gradients caused an update
+
+    finished = LightGBM.LGBM_BoosterUpdateOneIterCustom(booster, zeros(numdata), ones(numdata))
+    pred3 = LightGBM.LGBM_BoosterGetPredict(booster, 0)
+    @test isapprox(pred2, pred3; rtol=1e-16) # show that the gradients did not cause an update
+
+    @test_throws DimensionMismatch LightGBM.LGBM_BoosterUpdateOneIterCustom(booster, zeros(1), zeros(1))
+
+    existing_booster = LightGBM.LGBM_BoosterCreateFromModelfile(joinpath(@__DIR__, "data", "test_tree"))
+
+    # can't exactly match the size if there is no size (no training data) to match
+    @test_throws ErrorException LightGBM.LGBM_BoosterUpdateOneIterCustom(existing_booster, zeros(1), zeros(1))
+
+    # handle multiclass too
+    num_class = 3
+    mymat = randn(numdata, 2)
+    labels = rand((1:num_class) .- 1, numdata)
+
+    dataset = LightGBM.LGBM_DatasetCreateFromMat(mymat, verbosity)
+    LightGBM.LGBM_DatasetSetField(dataset, "label", labels)
+    booster = LightGBM.LGBM_BoosterCreate(dataset, "objective=multiclass num_class=$(num_class) $verbosity")
+
+    finished = LightGBM.LGBM_BoosterUpdateOneIterCustom(booster, randn(numdata*num_class), rand(numdata*num_class))
+    pred1 = LightGBM.LGBM_BoosterGetPredict(booster, 0)
+    # check both types of float work
+    finished = LightGBM.LGBM_BoosterUpdateOneIterCustom(booster, randn(numdata*num_class), rand(numdata*num_class))
+    pred2 = LightGBM.LGBM_BoosterGetPredict(booster, 0)
+
+    @test !isapprox(pred1, pred2; rtol=1e-5) # show that the gradients caused an update
+
+    # check the naive silly thing does in fact not get accepted
+    @test_throws DimensionMismatch LightGBM.LGBM_BoosterUpdateOneIterCustom(booster, Float32.(randn(numdata)), Float32.(rand(numdata)))
+
+end
+
+
 @testset "LGBM_BoosterRollbackOneIter" begin
 
     # Arrange
     mymat = randn(10000, 2)
     labels = randn(10000)
-    dataset = LightGBM.LGBM_DatasetCreateFromMat(mymat, verbosity)    
+    dataset = LightGBM.LGBM_DatasetCreateFromMat(mymat, verbosity)
     LightGBM.LGBM_DatasetSetField(dataset, "label", labels)
     booster = LightGBM.LGBM_BoosterCreate(dataset, verbosity)
 
@@ -401,4 +452,30 @@ end
 
 end
 
+
+@testset "LGBM_BoosterNumModelPerIteration" begin
+
+
+    mymat = [1. 2.; 3. 4.; 5. 6.]
+    dataset = LightGBM.LGBM_DatasetCreateFromMat(mymat, verbosity)
+    v_dataset = LightGBM.LGBM_DatasetCreateFromMat(mymat .+ 1., verbosity)
+
+    booster = LightGBM.LGBM_BoosterCreate(dataset, "objective=binary $verbosity")
+
+    @test LightGBM.LGBM_BoosterNumModelPerIteration(booster) == 1
+
+    booster = LightGBM.LGBM_BoosterCreate(dataset, "objective=regression $verbosity")
+
+    @test LightGBM.LGBM_BoosterNumModelPerIteration(booster) == 1
+
+    for n in 2:20
+
+        booster = LightGBM.LGBM_BoosterCreate(dataset, "objective=multiclass num_class=$(n) $verbosity")
+
+        @test LightGBM.LGBM_BoosterNumModelPerIteration(booster) == n
+
+    end
+
+end
+
 end # module