Prepare for ConstrainedProblems (#9)

anriseth · web-flow · commit a0d046486a53 · 2018-02-16T17:26:45.000+11:00
* Add ConstrainedProblems module

* Create MultivariateProblems module

* Add the Beale unconstrained problem
diff --git a/src/OptimTestProblems.jl b/src/OptimTestProblems.jl
@@ -1,6 +1,12 @@
 module OptimTestProblems
 
-include("optim_tests/multivariate/unconstrained.jl")
+export MultivariateProblems, UnivariateProblems
+
+include("optim_tests/multivariate/multivariate.jl")
 include("optim_tests/univariate/bounded.jl")
 
+# Deprecation stuff
+UnconstrainedProblems = OptimTestProblems.MultivariateProblems.UnconstrainedProblems
+export UnconstrainedProblems
+
 end # module
diff --git a/src/optim_tests/multivariate/constrained.jl b/src/optim_tests/multivariate/constrained.jl
@@ -0,0 +1,46 @@
+module ConstrainedProblems
+
+using ..OptimizationProblem,..ConstraintData
+
+examples = Dict{AbstractString, OptimizationProblem}()
+
+hs9_obj(x::AbstractVector) = sin(π*x[1]/12) * cos(π*x[2]/16)
+hs9_c!(c::AbstractVector, x::AbstractVector) = (c[1] = 4*x[1]-3*x[2]; c)
+hs9_h!(h, x, λ) = h
+
+function hs9_obj_g!(g::AbstractVector, x::AbstractVector)
+    g[1] = π/12 * cos(π*x[1]/12) * cos(π*x[2]/16)
+    g[2] = -π/16 * sin(π*x[1]/12) * sin(π*x[2]/16)
+    g
+end
+function hs9_obj_h!(h::AbstractMatrix, x::AbstractVector)
+    v = hs9_obj(x)
+    h[1,1] = -π^2*v/144
+    h[2,2] = -π^2*v/256
+    h[1,2] = h[2,1] = -π^2 * cos(π*x[1]/12) * sin(π*x[2]/16) / 192
+    h
+end
+
+function hs9_jacobian!(J, x)
+    J[1,1] = 4
+    J[1,2] = -3
+    J
+end
+
+# TODO: IPNewtons  gets stuck when using x0 = [0,0].
+#       Check with Tim if this also happened before?
+examples["HS9"] = OptimizationProblem("HS9",
+                                      hs9_obj,
+                                      hs9_obj_g!,
+                                      nothing,
+                                      hs9_obj_h!,
+                                      ConstraintData(hs9_c!, hs9_jacobian!, hs9_h!,
+                                                     [], [], [0.0], [0.0]),
+                                      [-1.0,2.0],#[0.0, 0.0],
+                                      [-3.0,-4.0],#[[12k-3, 16k-4] for k in (0, 1, -1)], # any integer k will do...
+                                      hs9_obj([-3.0,-4.0]),
+                                      true,
+                                      true)
+
+
+end  # module
diff --git a/src/optim_tests/multivariate/from_optim.jl b/src/optim_tests/multivariate/from_optim.jl
@@ -31,8 +31,9 @@ end
 examples["Exponential"] = OptimizationProblem("Exponential",
                                               exponential,
                                               exponential_gradient!,
-                                              nothing,
+                                              nothing, # fg!
                                               exponential_hessian!,
+                                              nothing, # Constraints
                                               [0.0, 0.0],
                                               [2.0, 3.0],
                                               exponential([2.0, 3.0]),
@@ -122,6 +123,7 @@ examples["Fletcher-Powell"] = OptimizationProblem("Fletcher-Powell",
                                                   fletcher_powell_gradient!,
                                                   fletcher_powell_fun_gradient!,
                                                   fletcher_powell_hessian!,
+                                                  nothing, # Constraints
                                                   [-1.0, 0.0, 0.0], # Same as in source
                                                   [1.0, 0.0, 0.0],
                                                   0.0,
@@ -157,6 +159,7 @@ examples["Himmelblau"] = OptimizationProblem("Himmelblau",
                                              himmelblau_gradient!,
                                              nothing,
                                              himmelblau_hessian!,
+                                             nothing, # Constraints
                                              [2.0, 2.0],
                                              [3.0, 2.0],
                                              himmelblau([3.0, 2.0]),
@@ -191,6 +194,7 @@ examples["Hosaki"] = OptimizationProblem("Hosaki",
                                          hosaki_gradient!,
                                          nothing,
                                          hosaki_hessian!,
+                                         nothing, # Constraints
                                          [3.6, 1.9],
                                          [4.0, 2.0],
                                          hosaki([4.0, 2.0]),
@@ -235,6 +239,7 @@ examples["Large Polynomial"] = OptimizationProblem("Large Polynomial",
                                                    large_polynomial_gradient!,
                                                    nothing,
                                                    large_polynomial_hessian!,
+                                                   nothing, # Constraints
                                                    zeros(250),
                                                    collect(float(1:250)),
                                                    large_polynomial(collect(float(1:250))),
@@ -277,6 +282,7 @@ examples["Parabola"] = OptimizationProblem("Parabola",
                                            parabola_gradient!,
                                            nothing,
                                            parabola_hessian!,
+                                           nothing, # Constraints
                                            [0.0, 0.0, 0.0, 0.0, 0.0],
                                            [1.0, 2.0, 3.0, 5.0, 8.0],
                                            parabola([1.0, 2.0, 3.0, 5.0, 8.0]),
@@ -316,6 +322,7 @@ examples["Polynomial"] = OptimizationProblem("Polynomial",
                                              polynomial_gradient!,
                                              nothing,
                                              polynomial_hessian!,
+                                             nothing, # Constraints
                                              [0.0, 0.0, 0.0],
                                              [10.0, 7.0, 108.0],
                                              polynomial([10.0, 7.0, 108.0]),
@@ -366,6 +373,7 @@ examples["Powell"] = OptimizationProblem("Powell",
                                          powell_gradient!,
                                          nothing,
                                          powell_hessian!,
+                                         nothing, # Constraints
                                          [3.0, -1.0, 0.0, 1.0],
                                          [0.0, 0.0, 0.0, 0.0],
                                          powell([0.0, 0.0, 0.0, 0.0]),
@@ -402,6 +410,7 @@ examples["Rosenbrock"] = OptimizationProblem("Rosenbrock",
                                              rosenbrock_gradient!,
                                              nothing,
                                              rosenbrock_hessian!,
+                                             nothing, # Constraints
                                              [-1.2, 1.0],
                                              [1.0, 1.0],
                                              rosenbrock([1.0, 1.0]),
diff --git a/src/optim_tests/multivariate/more_testing.jl b/src/optim_tests/multivariate/more_testing.jl
@@ -63,6 +63,7 @@ function _extrosenbrockproblem(N::Int;
                         extrosenbrock_gradient!,
                         extrosenbrock_fun_gradient!,
                         extrosenbrock_hessian!,
+                        nothing, # Constraints
                         initial_x,
                         ones(initial_x),
                         zero(T),
@@ -155,6 +156,7 @@ function _extpowellproblem(N::Int;
                         extpowell_gradient!,
                         extpowell_fun_gradient!,
                         extpowell_hessian!,
+                        nothing, # Constraints
                         initial_x,
                         zeros(initial_x),
                         zero(T),
@@ -194,7 +196,7 @@ function penfunI_gradient!(storage::AbstractArray,
 end
 
 function penfunI_fun_gradient!(storage::AbstractArray,
-                           x::AbstractArray, param)
+                               x::AbstractArray, param)
     # TODO: we could do this without the xt storage holder
     xt = param.xt
     @. xt = param.alpha*(x-one(eltype(x)))
@@ -231,6 +233,7 @@ function _penfunIproblem(N::Int;
                         penfunI_gradient!,
                         penfunI_fun_gradient!,
                         penfunI_hessian!,
+                        nothing, # Constraints
                         initial_x,
                         xsol,
                         fsol,
@@ -273,7 +276,7 @@ function trigonometric_gradient!(storage::AbstractArray,
 end
 
 function trigonometric_fun_gradient!(storage::AbstractArray,
-                                 x::AbstractArray, param)
+                                     x::AbstractArray, param)
     # TODO: we could do this without the xt storage holder
     n = length(x)
     xt = param.vec
@@ -298,6 +301,7 @@ function _trigonometricproblem(N::Int;
                         trigonometric_gradient!,
                         trigonometric_fun_gradient!,
                         trigonometric_hessian!,
+                        nothing, # Constraints
                         initial_x,
                         zeros(initial_x),
                         zero(T),
@@ -307,3 +311,70 @@ function _trigonometricproblem(N::Int;
 end
 
 examples["Trigonometric"] = _trigonometricproblem(100)
+
+
+##########################################################################
+###
+### Beale (2D)
+###
+### Problem 5 in [3]
+###
+### Sum-of-squares objective, non-convex with g'*inv(H)*g == 0 at the
+### initial position.
+###
+##########################################################################
+
+### General utilities for sum-of-squares functions
+# TODO: Update the other problems that are not Beale to use sumsq as well?
+
+# Requires f(x) and J(x) computes the values and jacobian at x of a set of functions, and
+# that H(x, i) computes the hessian of the ith function
+
+sumsq_obj(f, x) = sum(f(x).^2)
+
+function sumsq_gradient!(g::AbstractVector, f, J, x::AbstractVector)
+    copy!(g, sum((2.0 .* f(x)) .* J(x), 1))
+end
+
+function sumsq_hessian!(h::AbstractMatrix, f, J, H, x::AbstractVector)
+    fx = f(x)
+    Jx = J(x)
+    htmp = 2.0 .* (Jx' * Jx)
+    for i = 1:length(fx)
+        htmp += (2.0 * fx[i]) * H(x, i)
+    end
+    copy!(h, htmp)
+end
+
+const beale_y = [1.5, 2.25, 2.625]
+
+beale_f(x) = [beale_y[i] - x[1]*(1-x[2]^i) for i = 1:3]
+beale_J(x) = hcat([-(1-x[2]^i) for i = 1:3],
+                  [i*x[1]*x[2]^(i-1) for i = 1:3])
+function beale_H(x, i)
+    od = i*x[2]^(i-1)
+    d2 = i > 1 ? i*(i-1)*x[1]*x[2]^(i-2) : zero(x[2])
+    [0 od; od d2]
+end
+
+beale(x::AbstractVector) = sumsq_obj(beale_f, x)
+
+function beale_gradient!(g::AbstractVector, x::AbstractVector)
+    sumsq_gradient!(g, beale_f, beale_J, x)
+end
+
+function beale_hessian!(h::AbstractMatrix, x::AbstractVector)
+    sumsq_hessian!(h, beale_f, beale_J, beale_H, x)
+end
+
+examples["Beale"] = OptimizationProblem("Beale",
+                                        beale,
+                                        beale_gradient!,
+                                        nothing,
+                                        beale_hessian!,
+                                        nothing, # Constraints
+                                        [1.0, 1.0],
+                                        [3.0, 0.5],
+                                        beale([3.0, 0.5]),
+                                        true,
+                                        true)
diff --git a/src/optim_tests/multivariate/multivariate.jl b/src/optim_tests/multivariate/multivariate.jl
@@ -0,0 +1,80 @@
+module MultivariateProblems
+
+import Base.gradient
+
+export UnconstrainedProblems
+
+export OptimizationProblem, objective, gradient, objective_gradient, hessian
+
+struct ConstraintData{F,J,H,Tx,Tc}
+    c!::F
+    jacobian!::J
+    h!::H
+    lx::Vector{Tx}
+    ux::Vector{Tx}
+    lc::Vector{Tc}
+    uc::Vector{Tc}
+end
+
+immutable OptimizationProblem{P, Tfg, Tf <: Real, TS <: AbstractString,
+                              CT <:  Union{Void,ConstraintData}}
+    name::TS
+    f::Function
+    g!::Function
+    fg!::Tfg
+    h!::Function
+    constraintdata::CT
+    initial_x::Vector
+    solutions::Vector
+    minimum::Tf
+    isdifferentiable::Bool
+    istwicedifferentiable::Bool
+    parameters::P
+end
+
+OptimizationProblem(name::AbstractString,
+                    f::Function,
+                    g!::Function,
+                    fg!::Tfg,
+                    h!::Function,
+                    constraints::Union{Void,ConstraintData},
+                    initial_x::Vector,
+                    solutions::Vector,
+                    minimum::Tf,
+                    isdifferentiable::Bool,
+                    istwicedifferentiable::Bool) where Tf where Tfg =
+                        OptimizationProblem(name, f, g!, fg!, h!, constraints,
+                                            initial_x, solutions, minimum,
+                                            isdifferentiable,
+                                            istwicedifferentiable,
+                                            nothing)
+
+objective(p::OptimizationProblem{P}) where P<:Void = p.f
+gradient(p::OptimizationProblem{P}) where P<:Void = p.g!
+objective_gradient(p::OptimizationProblem{P}) where P<:Void = p.fg!
+hessian(p::OptimizationProblem{P}) where P<:Void = p.h!
+
+objective(p::OptimizationProblem{P}) where P = x-> p.f(x,p.parameters)
+gradient(p::OptimizationProblem{P}) where P = (out,x)-> p.g!(out,x,p.parameters)
+objective_gradient(p::OptimizationProblem{P}) where P = (out,x)-> p.fg!(out,x,p.parameters)
+hessian(p::OptimizationProblem{P}) where P = (out,x)-> p.h!(out,x,p.parameters)
+
+function objective_gradient(p::OptimizationProblem{P,Tfg}) where P where Tfg <: Void
+    (out,x) -> begin
+        gradient(p)(out,x)
+        return objective(p)(x)
+    end
+end
+
+function objective_gradient(p::OptimizationProblem{P,Tfg}) where P <: Void where Tfg <: Void
+    (out,x) -> begin
+        gradient(p)(out,x)
+        return objective(p)(x)
+    end
+end
+
+
+include("unconstrained.jl")
+include("constrained.jl")
+
+end
diff --git a/src/optim_tests/multivariate/quad_transforms.jl b/src/optim_tests/multivariate/quad_transforms.jl
@@ -43,6 +43,7 @@ function _quadraticproblem(N::Int; mat::AbstractArray{T,2} = spdiagm(float(1:N))
                         quad_gradient!,
                         quad_fun_gradient!,
                         quad_hessian!,
+                        nothing, # Constraints
                         initial_x,
                         x0,
                         zero(T),
@@ -113,6 +114,7 @@ function _paraboloidproblem(N::Int; mat::AbstractArray{T,2} = spdiagm(float(1:N)
                         paraboloid_gradient!,
                         paraboloid_fun_gradient!,
                         paraboloid_hessian!,
+                        nothing, # Constraints
                         initial_x,
                         x0, # x0 means the solution ...
                         zero(T),
diff --git a/src/optim_tests/multivariate/unconstrained.jl b/src/optim_tests/multivariate/unconstrained.jl
diff --git a/test/runtests.jl b/test/runtests.jl