SciML
diff --git a/‎ext/OptimizationEnzymeExt.jl
+2-2 b/‎ext/OptimizationEnzymeExt.jl
+2-2
diff --git a/‎ext/OptimizationZygoteExt.jl
+51-4 b/‎ext/OptimizationZygoteExt.jl
+51-4
diff --git a/‎src/OptimizationDIExt.jl
+54-5 b/‎src/OptimizationDIExt.jl
+54-5
@@ -94,7 +94,7 @@ function OptimizationBase.instantiate_function(f::OptimizationFunction{true}, x,
         cons_j = false, cons_vjp = false, cons_jvp = false, cons_h = false,
         lag_h = false)
     if g == true && f.grad === nothing
-        function grad(res, θ)
+        function grad(res, θ, p = p)
             Enzyme.make_zero!(res)
             Enzyme.autodiff(Enzyme.Reverse,
                 Const(firstapply),
@@ -111,7 +111,7 @@ function OptimizationBase.instantiate_function(f::OptimizationFunction{true}, x,
     end
 
     if fg == true && f.fg === nothing
-        function fg!(res, θ)
+        function fg!(res, θ, p = p)
             Enzyme.make_zero!(res)
             y = Enzyme.autodiff(Enzyme.ReverseWithPrimal,
                 Const(firstapply),
 
@@ -7,7 +7,7 @@ import OptimizationBase.SciMLBase: OptimizationFunction
 import OptimizationBase.LinearAlgebra: I, dot
 import DifferentiationInterface
 import DifferentiationInterface: prepare_gradient, prepare_hessian, prepare_hvp,
-                                 prepare_jacobian,
+                                 prepare_jacobian, value_and_gradient!, value_derivative_and_second_derivative!,
                                  gradient!, hessian!, hvp!, jacobian!, gradient, hessian,
                                  hvp, jacobian
 using ADTypes, SciMLBase
@@ -19,8 +19,9 @@ function OptimizationBase.instantiate_function(
         g = false, h = false, hv = false, fg = false, fgh = false,
         cons_j = false, cons_vjp = false, cons_jvp = false, cons_h = false,
         lag_h = false)
+    global _p = p
     function _f(θ)
-        return f(θ, p)[1]
+        return f(θ, _p)[1]
     end
 
     adtype, soadtype = OptimizationBase.generate_adtype(adtype)
@@ -30,19 +31,41 @@ function OptimizationBase.instantiate_function(
         function grad(res, θ)
             gradient!(_f, res, adtype, θ, extras_grad)
         end
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            function grad(res, θ, p)
+                global _p = p
+                gradient!(_f, res, adtype, θ)
+            end
+        end
     elseif g == true
         grad = (G, θ) -> f.grad(G, θ, p)
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            grad = (G, θ, p) -> f.grad(G, θ, p)
+        end
     else
         grad = nothing
     end
 
     if fg == true && f.fg === nothing
+        if g == false
+            extras_grad = prepare_gradient(_f, adtype, x)
+        end
         function fg!(res, θ)
             (y, _) = value_and_gradient!(_f, res, adtype, θ, extras_grad)
             return y
         end
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            function fg!(res, θ, p)
+                global _p = p
+                (y, _) = value_and_gradient!(_f, res, adtype, θ)
+                return y
+            end
+        end
     elseif fg == true
         fg! = (G, θ) -> f.fg(G, θ, p)
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            fg! = (G, θ, p) -> f.fg(G, θ, p)
+        end
     else
         fg! = nothing
     end
@@ -188,7 +211,8 @@ function OptimizationBase.instantiate_function(
         lag_h! = nothing
     end
 
-    return OptimizationFunction{true}(f.f, adtype; grad = grad, hess = hess, hv = hv!,
+    return OptimizationFunction{true}(f.f, adtype; 
+        grad = grad, fg = fg!, hess = hess, hv = hv!, fgh = fgh!,
         cons = cons, cons_j = cons_j!, cons_h = cons_h!,
         cons_vjp = cons_vjp!, cons_jvp = cons_jvp!,
         hess_prototype = hess_sparsity,
@@ -232,19 +256,41 @@ function OptimizationBase.instantiate_function(
         function grad(res, θ)
             gradient!(_f, res, adtype.dense_ad, θ, extras_grad)
         end
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            function grad(res, θ, p)
+                global p = p
+                gradient!(_f, res, adtype.dense_ad, θ)
+            end
+        end
     elseif g == true
         grad = (G, θ) -> f.grad(G, θ, p)
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            grad = (G, θ, p) -> f.grad(G, θ, p)
+        end
     else
         grad = nothing
     end
 
     if fg == true && f.fg !== nothing
+        if g == false
+            extras_grad = prepare_gradient(_f, adtype.dense_ad, x)
+        end
         function fg!(res, θ)
             (y, _) = value_and_gradient!(_f, res, adtype.dense_ad, θ, extras_grad)
             return y
         end
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            function fg!(res, θ, p)
+                global p = p
+                (y, _) = value_and_gradient!(_f, res, adtype.dense_ad, θ)
+                return y
+            end
+        end
     elseif fg == true
         fg! = (G, θ) -> f.fg(G, θ, p)
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            fg! = (G, θ, p) -> f.fg(G, θ, p)
+        end
     else
         fg! = nothing
     end
@@ -398,7 +444,8 @@ function OptimizationBase.instantiate_function(
     else
         lag_h! = nothing
     end
-    return OptimizationFunction{true}(f.f, adtype; grad = grad, hess = hess, hv = hv!,
+    return OptimizationFunction{true}(f.f, adtype; 
+        grad = grad, fg = fg!, hess = hess, hv = hv!, fgh = fgh!,
         cons = cons, cons_j = cons_j!, cons_h = cons_h!,
         hess_prototype = hess_sparsity,
         hess_colorvec = hess_colors,
 
@@ -4,7 +4,8 @@ import OptimizationBase.SciMLBase: OptimizationFunction
 import OptimizationBase.LinearAlgebra: I
 import DifferentiationInterface
 import DifferentiationInterface: prepare_gradient, prepare_hessian, prepare_hvp,
-                                 prepare_jacobian,
+                                 prepare_jacobian, value_and_gradient!, value_and_gradient,
+                                 value_derivative_and_second_derivative!, value_derivative_and_second_derivative,
                                  gradient!, hessian!, hvp!, jacobian!, gradient, hessian,
                                  hvp, jacobian
 using ADTypes, SciMLBase
@@ -26,8 +27,9 @@ function instantiate_function(
         g = false, h = false, hv = false, fg = false, fgh = false,
         cons_j = false, cons_vjp = false, cons_jvp = false, cons_h = false,
         lag_h = false)
+    global _p = p
     function _f(θ)
-        return f(θ, p)[1]
+        return f(θ, _p)[1]
     end
 
     adtype, soadtype = generate_adtype(adtype)
@@ -37,19 +39,41 @@ function instantiate_function(
         function grad(res, θ)
             gradient!(_f, res, adtype, θ, extras_grad)
         end
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            function grad(res, θ, p)
+                global _p = p
+                gradient!(_f, res, adtype, θ)
+            end
+        end
     elseif g == true
         grad = (G, θ) -> f.grad(G, θ, p)
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            grad = (G, θ, p) -> f.grad(G, θ, p)
+        end
     else
         grad = nothing
     end
 
     if fg == true && f.fg === nothing
+        if g == false
+            extras_grad = prepare_gradient(_f, adtype, x)
+        end
         function fg!(res, θ)
             (y, _) = value_and_gradient!(_f, res, adtype, θ, extras_grad)
             return y
         end
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            function fg!(res, θ, p)
+                global _p = p
+                (y, _) = value_and_gradient!(_f, res, adtype, θ)
+                return y
+            end
+        end
     elseif fg == true
         fg! = (G, θ) -> f.fg(G, θ, p)
+        if p !== SciMLBase.NullParameters()
+            fg! = (G, θ, p) -> f.fg(G, θ, p)
+        end
     else
         fg! = nothing
     end
@@ -196,7 +220,8 @@ function instantiate_function(
         lag_h! = nothing
     end
 
-    return OptimizationFunction{true}(f.f, adtype; grad = grad, hess = hess, hv = hv!,
+    return OptimizationFunction{true}(f.f, adtype; 
+        grad = grad, fg = fg!, hess = hess, hv = hv!, fgh = fgh!,
         cons = cons, cons_j = cons_j!, cons_h = cons_h!,
         cons_vjp = cons_vjp!, cons_jvp = cons_jvp!,
         hess_prototype = hess_sparsity,
@@ -232,8 +257,9 @@ function instantiate_function(
         g = false, h = false, hv = false, fg = false, fgh = false,
         cons_j = false, cons_vjp = false, cons_jvp = false, cons_h = false,
         lag_h = false)
+    global _p = p
     function _f(θ)
-        return f(θ, p)[1]
+        return f(θ, _p)[1]
     end
 
     adtype, soadtype = generate_adtype(adtype)
@@ -243,19 +269,41 @@ function instantiate_function(
         function grad(θ)
             gradient(_f, adtype, θ, extras_grad)
         end
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            function grad(θ, p)
+                global _p = p
+                gradient(_f, adtype, θ)
+            end
+        end
     elseif g == true
         grad = (θ) -> f.grad(θ, p)
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            grad = (θ, p) -> f.grad(θ, p)
+        end
     else
         grad = nothing
     end
 
     if fg == true && f.fg === nothing
+        if g == false
+            extras_grad = prepare_gradient(_f, adtype, x)
+        end
         function fg!(θ)
             (y, res) = value_and_gradient(_f, adtype, θ, extras_grad)
             return y, res
         end
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            function fg!(θ, p)
+                global _p = p
+                (y, res) = value_and_gradient(_f, adtype, θ)
+                return y, res
+            end
+        end
     elseif fg == true
         fg! = (θ) -> f.fg(θ, p)
+        if p !== SciMLBase.NullParameters() && p !== nothing
+            fg! = (θ, p) -> f.fg(θ, p)
+        end
     else
         fg! = nothing
     end
@@ -387,7 +435,8 @@ function instantiate_function(
         lag_h! = nothing
     end
 
-    return OptimizationFunction{false}(f.f, adtype; grad = grad, hess = hess, hv = hv!,
+    return OptimizationFunction{false}(f.f, adtype; 
+        grad = grad, fg = fg!, hess = hess, hv = hv!, fgh = fgh!,
         cons = cons, cons_j = cons_j!, cons_h = cons_h!,
         cons_vjp = cons_vjp!, cons_jvp = cons_jvp!,
         hess_prototype = hess_sparsity,