Source code for decogo.solver.refactory_colgen

"""Implements Column Generation with user-defined input model"""

import copy
import logging
import math
import time

import numpy as np

from decogo.solver.settings import Settings
from decogo.util.block_vector import BlockVector
from decogo.solver.colgen import AlgorithmBase

logger = logging.getLogger('decogo')


[docs]class RefactoryColGen(AlgorithmBase):
    """This class implements Column Generation (CG) algorithm with \
    user-defined input model

    :param problem: Decomposed problem class, which stores all input data
    :type problem: DecomposedProblem
    :param settings: Settings class
    :type settings: Settings
    :param result: Class which stores the results
    :type result: Results
    """

[docs]    def __init__(self, problem, settings, result):
        """Constructor method"""
        super().__init__(problem, settings, result)

[docs]    def solve(self):
        """
        Inner approximation algorithm
        """
        check_w, duals = self.ia_init()

        # initial column generation
        tic_init_cg = time.time()
        i_find_sol = 0

        # region test of fw_column_generation

        # # increase duals
        # max_val = abs(max(duals, key=abs))
        # duals = np.full(shape=self.problem.block_model.cuts.num_of_global_cuts,
        #                 fill_value=100 * max_val)
        #
        # # select nonlinear atomic blocks
        # t_set_atomic = [k for k in range(self.problem.block_model.num_blocks)]
        #
        # # generate columns for atomic blocks using fast column generation
        # self.fw_column_generation(check_w=check_w, duals=duals,
        #                           t_set=t_set_atomic)
        # endregion

        while True:  # find feasible solution and eliminate slacks
            # in IA master problem
            i_find_sol += 1
            tic = time.time()

            # option to generate sub-problem data with exact solver
            if self.settings.exact_solve_data is False:
                self.column_generation(approx_solver=True)  # solve sub-problems
                # approximately
            else:
                self.column_generation()  # solve sub-problems exactly

            time_cg = round(time.time() - tic, 2)
            logger.info('Time used for init CG '
                        'in iter {0}: --{1}-- seconds'
                        .format(self.result.main_iterations, time_cg))
            self.result.current_used_time += time_cg
            logger.info('-----------------------------------------------------')
            logger.info('Elapsed time: --{0}-- seconds'
                        .format(round(self.result.current_used_time, 2)))
            logger.info('-----------------------------------------------------')
            # find solution performed always in the beginning
            tic = time.time()
            self.find_solution_init(self.result.main_iterations)
            time_find_solution = round(time.time() - tic, 2)
            logger.info('Time used for init FindSol '
                        'in iter {0}: --{1}-- seconds'
                        .format(self.result.main_iterations,
                                time_find_solution))
            self.result.current_used_time += time_find_solution
            logger.info('-----------------------------------------------------')
            logger.info('Elapsed time: --{0}-- seconds'
                        .format(round(self.result.current_used_time, 2)))
            logger.info('-----------------------------------------------------')

            if self.result.primal_bound < float('inf'):
                logger.info('Found the first feasible solution')

                logger.info('IA obj. val: {0}'.format(
                    self.result.cg_relaxation * self.result.sense))
                logger.info('Elapsed time: {0}'.format(
                    self.result.current_used_time))

                break

        j = 0
        while True:  # apply cg_fast_fw or approx_cg
            j += 1
            tic = time.time()

            if self.settings.cg_fast_fw:
                self.column_generation_fast_fw()
                time_init_cg = round(time.time() - tic, 2)
                logger.info('Time used for init cg fast fw '
                            'in iter {0}: --{1}-- seconds'
                            .format(j, time_init_cg))
            else:
                self.column_generation(approx_solver=True)
                time_init_cg = round(time.time() - tic, 2)
                logger.info('Time used for init approx cg '
                            'in iter {0}: --{1}-- seconds'
                            .format(j, time_init_cg))

            self.result.current_used_time += time_init_cg
            logger.info(
                '-----------------------------------------------------')
            logger.info('Elapsed time: --{0}-- seconds'
                        .format(round(self.result.current_used_time, 2)))
            logger.info(
                '-----------------------------------------------------')
            if j == 5:
                break

        time_init_cg = round(time.time() - tic_init_cg, 2)
        logger.info('\nCG relaxation obj. value '
                    'in iter {0}: {1}'.format(self.result.main_iterations,
                                              self.result.sense *
                                              self.result.cg_relaxation))
        logger.info('Time used for total init CG '
                    'in iter {0}: --{1}-- seconds'.
                    format(self.result.main_iterations, time_init_cg))

        logger.info('-----------------------------------------------------')
        logger.info('Elapsed time at CG iter {0}: --{1}-- seconds'
                    .format(self.result.main_iterations,
                            round(self.result.current_used_time, 2)))
        logger.info('-----------------------------------------------------')

        # flag which says if reduced cost is positive and we can stop
        stop_by_cg_converg = False

        # init hat K
        hat_k_set = {k for k in range(self.problem.block_model.num_blocks)
                     if self.problem.block_model.sub_models[k].linear
                     is False}

        time_i_loop_set = []

        while True:

            self.result.main_iterations += 1

            tic_i_start = time.time()

            num_subproblems_solved = self.result.cg_num_minlp_problems

            tic = time.time()
            self.column_generation(hat_k_set)
            time_column_generation = round(time.time() - tic, 2)
            logger.info('CG relaxation obj. value in iter {0}: {1}'
                        .format(self.result.main_iterations, self.result.sense *
                                self.result.cg_relaxation))
            logger.info('\nTime used for CG: --{0}-- seconds'
                        .format(time_column_generation))

            self.result.current_used_time += time_column_generation
            logger.info('-------------------------------------------------')
            logger.info('Elapsed time at CG iter {0}: --{1}-- seconds'
                        .format(self.result.main_iterations,
                                round(self.result.current_used_time, 2)))
            logger.info('-------------------------------------------------')
            logger.info('\nNum of MINLP subproblems solved '
                        'in iter loop *{0}*   {1}'
                        .format(self.result.main_iterations,
                                self.result.cg_num_minlp_problems -
                                num_subproblems_solved))
            logger.info('Total number of minlp subproblems '
                        'solved in iter {0}: {1}'
                        .format(self.result.main_iterations,
                                self.result.cg_num_minlp_problems))

            column_blocks = [self.problem.get_inner_points_size(k) for k in
                             range(self.problem.block_model.num_blocks)]
            column_sum = sum(self.problem.get_inner_points_size(k) for k in
                             range(self.problem.block_model.num_blocks))

            logger.info('Total number of columns '
                        'in iter {0}: {1}'
                        .format(self.result.main_iterations,
                                column_sum))
            logger.info('Columns in blocks '
                        'in iter {0}: {1}'
                        .format(self.result.main_iterations, column_blocks))

            logger.info('Time used for CG in iter '
                        '{0}: --{1}-- seconds'.format(
                self.result.main_iterations,
                time_column_generation))

            logger.info('------------------------------------')
            logger.info('CG regarding all blocks')
            # col/cut generation for all blocks; calculate reduced cost
            tic = time.time()
            z, x_ia, w_ia, slacks, duals, obj_value_ia = \
                self.problem.master_problems.solve_ia(self.settings.lp_solver)

            reduced_cost_direction = np.concatenate(([1], duals))

            # reduce block set based on the reduced cost
            hat_k_set = []
            for k in range(self.problem.block_model.num_blocks):
                if self.problem.block_model.sub_models[k].linear is False:
                    _, _, delta_k, new_point, _ = \
                        self.generate_column(k, reduced_cost_direction,
                                             x_k=x_ia.get_block(k))

                    if delta_k <= -1e-3:
                        hat_k_set.append(k)

            time_column_generation = round(time.time() - tic, 2)
            logger.info('Time used for CG for all blocks: --{0}-- seconds'
                        .format(round(time_column_generation, 2)))
            self.result.current_used_time += time_column_generation
            logger.info('-----------------------------------------------------')
            logger.info('Elapsed time: --{0}-- seconds'
                        .format(round(self.result.current_used_time, 2)))
            logger.info('-----------------------------------------------------')

            # check if reduced block set is empty.
            # if it is empty then we stop, since for all blocks reduced cost
            # was positive
            if len(hat_k_set) == 0:
                if self.settings.cg_check_convergence is True:
                    logger.info('CG converges, checking the convergence by '
                                'exact subproblem solving')
                    # solve again the subproblems regarding the same direction
                    # until optimality
                    # if here reduced cost is positive, then we can stop,
                    # otherwise we should continue
                    hat_k_set = []
                    for k in range(self.problem.block_model.num_blocks):
                        if self.problem.block_model.sub_models[k].linear \
                                is False:
                            # heuristic=False forces SCIP to use default
                            # settings, i.e it tries to solve the subproblem
                            # until optimality not clear whether it will slow
                            # down everything too much maybe here is better
                            # to use just stricter settings for SCIP
                            _, _, delta_k, new_point, _ = \
                                self.generate_column(k,
                                                     reduced_cost_direction,
                                                     heuristic=False)
                            if delta_k <= -1e-3:
                                hat_k_set.append(k)

                    if len(hat_k_set) == 0:
                        stop_by_cg_converg = True
                else:
                    stop_by_cg_converg = True

            # primal heuristics
            if self.settings.cg_find_solution:
                tic = time.time()
                self.find_solution(
                    self.result.main_iterations)
                time_find_solution = round(time.time() - tic, 2)
                logger.info('Time used for FindSol in iter {0}'
                            ': --{1}-- seconds'.
                            format(self.result.main_iterations,
                                   time_find_solution))
                self.result.current_used_time += time_find_solution
                logger.info('-------------------------------------------------')
                logger.info('Elapsed time at FindSol iter {0}: --{1}-- seconds'
                            .format(self.result.main_iterations,
                                    round(self.result.current_used_time, 2)))
                logger.info('-------------------------------------------------')

            # main iteration time counting
            time_i_loop = round(time.time() - tic_i_start, 2)
            time_i_loop_set.append(time_i_loop)
            logger.info('Total time used in iter {0}'
                        ': --{1}-- seconds'.format(self.result.main_iterations,
                                                   time_i_loop))

            if self.result.main_iterations == \
                    self.settings.cg_max_main_iter:
                logger.info('\nIteration limit')
                break

            if not self.settings.generate_data:
                if stop_by_cg_converg is True:
                    logger.info('CG converged')
                    break

        self.result.num_of_columns_after_cg = sum(
            self.problem.get_inner_points_size(k)
            for k in range(self.problem.block_model.num_blocks))

        self.result.total_number_columns = sum(
            self.problem.get_inner_points_size(k)
            for k in range(self.problem.block_model.num_blocks))

        self.result.total_sub_problem_number \
            = self.result.cg_num_minlp_problems + \
              self.result.cg_num_unfixed_nlp_problems + \
              self.result.cg_num_fixed_nlp_problems

        self.result.sub_problem_number_after_cg = \
            self.result.total_sub_problem_number

[docs]    def ia_init(self, duals=None):
        """Initialization of inner approximation

        :param duals: Initial dual vector for initialization
        :type duals: ndarray
        """

        logger.info('\nInitialization')

        tic = time.time()

        # initial dual vector
        if duals is None:
            duals = np.zeros(shape=self.problem
                             .block_model.cuts.num_of_global_cuts)

        duals, check_w = self.sub_gradient(duals)

        time_sub_gradient = round(time.time() - tic, 2)
        logger.info('\nTime used for SubGradient: --{0}-- seconds'
                    .format(time_sub_gradient))
        self.result.current_used_time += time_sub_gradient

        logger.info('-----------------------------------------------------')
        logger.info('Elapsed time: --{0}-- seconds'
                    .format(round(self.result.current_used_time, 2)))
        logger.info('-----------------------------------------------------')

        return check_w, duals

[docs]    def column_generation(self, subset_of_blocks=None, approx_solver=False):
        """Performs column generation steps (see paper)

        :param subset_of_blocks: apply column generation for reduced block set
        :type subset_of_blocks: list or None
        :param approx_solver: enables approximate solving of subproblems in \
        column generation
        :type approx_solver: bool
        :return: Dual solution from IA master problem regarding global \
        constraints
        :rtype: ndarray
        """
        logger.info('\n=======================================================')
        if approx_solver:
            logger.info('Column generation: approximated subproblem solving')
        else:
            logger.info('Column generation')
        new_columns_generated = [0] * self.problem.block_model.num_blocks
        num_minlp_problems_solved = self.result.cg_num_minlp_problems

        if subset_of_blocks is not None:
            blocks = subset_of_blocks
        else:
            blocks = {k for k in range(self.problem.block_model.num_blocks)
                      if self.problem.block_model.sub_models[k].linear is False}

        i = 0

        while True:

            z, x_ia, w_ia, slacks, duals, obj_value_ia = \
                self.problem.master_problems.solve_ia(self.settings.lp_solver)
            self.result.cg_relaxation = obj_value_ia
            if i == 0:
                initial_obj_value_ia = obj_value_ia
                logger.info('\nInitial CG objective value: {0}'.format(
                    self.result.sense * initial_obj_value_ia))

            max_slack_value = max(max(item) for item in slacks)
            sum_slack_values = sum(item[0] + item[1] for item in slacks)

            i += 1

            logger.info('{0: <15}{1: <30}{2: <30}'
                        '{3: <30}'.format('CG iter', 'IA obj. value',
                                          'max slack value IA',
                                          'sum slack values IA'))

            logger.info('{0: <15}{1: <30}{2: <30}''{3: <30}'
                        .format(i, self.result.sense *
                                self.result.cg_relaxation,
                                max_slack_value, sum_slack_values))

            reduced_cost_direction = np.concatenate(([1], duals))

            # generate new columns
            generate_column_time_list = {}
            reduced_cost_list = {}

            # generate columns according to dual values
            for k in blocks:
                tic = time.time()
                _, _, reduced_cost_list[k], new_point, _ = \
                    self.generate_column(k, reduced_cost_direction,
                                         approx_solver=approx_solver,
                                         x_k=x_ia.get_block(k))
                generate_column_time_list[k] = round(time.time() - tic, 2)
                if new_point is True:
                    new_columns_generated[k] += 1

            # generate columns according to non-zero slacks
            generate_column_slack_time_list = {}
            if max_slack_value > 1e-1:

                z, x_ia, w_ia, slacks, duals, obj_value_ia = \
                    self.problem.master_problems.solve_ia(
                        self.settings.lp_solver)
                self.result.cg_relaxation = obj_value_ia
                max_slack_value = max(max(item) for item in slacks)

                if max_slack_value > 1e-1:

                    slack_direction = self.get_slack_directions(slacks)
                    for k in blocks:
                        tic = time.time()
                        _, _, _, new_point, _ = \
                            self.generate_column(k, slack_direction,
                                                 approx_solver=approx_solver,
                                                 x_k=x_ia.get_block(k))
                        generate_column_slack_time_list[k] = \
                            round(time.time() - tic, 2)
                        if new_point is True:
                            new_columns_generated[k] += 1

            if i >= self.settings.cg_max_iter:
                logger.info('Iteration limit')
                # logger.info('Reduced cost: {0}'
                #             .format(str(reduced_cost_list)))
                logger.info('New columns added: {0}'
                            .format(str(new_columns_generated)))
                break

            if all([item >= -1e-6 for item in
                    reduced_cost_list.values()]) is True:
                logger.info('Reduced costs greater than zero')
                logger.info('New columns added: {0}'
                            .format(str(new_columns_generated)))
                break

        self.result.num_cg_iterations += i

        # number of MINLP subproblems during CG
        logger.info(
            'number of minlp subproblems '
            'solved during CG: {0}'.format(self.result.cg_num_minlp_problems -
                                           num_minlp_problems_solved))
        logger.info('\n=======================================================')
        return duals

[docs]    def column_generation_fast_fw(self):
        """ Performs fast FW column generation steps (see paper) """
        logger.info('---------------------------------------------------------')
        logger.info('Fast column generation')

        start_time = time.time()

        # solve ia master problem
        z, x_ia, w_ia, slacks, duals, obj_value_ia = \
            self.problem.master_problems.solve_ia(self.settings.lp_solver)
        self.result.cg_relaxation = obj_value_ia

        direction = np.concatenate(([1], duals))

        # it is always good idea to have a look at the existing code and
        # make the code as simple as possible to read
        tilde_w = BlockVector()
        for k in range(self.problem.block_model.num_blocks):
            if self.problem.block_model.sub_models[k].linear is False:
                column, _ = self.problem.get_min_column(k, direction)
                tilde_w.set_block(k, column)
            else:
                tilde_w.set_block(k, w_ia.get_block(k))

        v_plus = copy.copy(tilde_w)

        # todo: refactor this, make use of BlockVector,
        # if neccessary extend BlockVector class
        for j, (index, vector) in enumerate(tilde_w.vectors.items()):
            if j == 0:
                tilde_w_array = np.array(vector.reshape(1, len(vector)))
            else:
                tilde_w_array = \
                    np.concatenate((tilde_w_array,
                                    vector.reshape(1, len(vector))))

        for j, (index, vector) in enumerate(v_plus.vectors.items()):
            if j == 0:
                v_plus_array = np.array(vector.reshape(1, len(vector)))
            else:
                v_plus_array = \
                    np.concatenate((v_plus_array,
                                    vector.reshape(1, len(vector))))
        sigma_cg = abs(duals)
        global_cuts_rhs = []
        for cut in self.problem.block_model.cuts.global_cuts:
            global_cuts_rhs.append(cut.rhs)
        global_cuts_rhs = np.array(global_cuts_rhs)

        tic_fast_cg = time.time()
        num_unfixed_nlp_problems_solved = \
            self.result.cg_num_unfixed_nlp_problems

        gamma_cg_plus = 1

        i = 0
        logger.info('{0: <10}{1: <30}'
                    '{2: <30}'.format('iter', 'IA obj. value', 'slacks'))
        logger.info('{0: <10}{1: <30}'
                    '{2: <30}'.format(i, obj_value_ia * self.result.sense,
                                      sum(map(sum, slacks))))

        if sum(map(sum, slacks)) < 1e-2:
            logger.info('IA obj. val: {0}'.format(
                obj_value_ia * self.result.sense))
            logger.info('Elapsed time: {0}'.format(
                self.result.current_used_time + (time.time() - start_time)))

        new_columns_generated_cumulative = \
            {k: 0 for k in range(self.problem.block_model.num_blocks)
             if self.problem.block_model.sub_models[k].linear is False}

        while True:
            i += 1

            generate_column_time_list = {}
            reduced_cost_list = {}
            r_cg = BlockVector()
            new_columns_generated = []
            for k in range(self.problem.block_model.num_blocks):
                tic = time.time()
                if self.settings.cg_fast_approx:
                    _, _, reduced_cost_list[k], new_point, r_k = \
                        self.local_solve_subproblem(
                            k, direction, x_k=x_ia.get_block(k))
                else:
                    _, _, reduced_cost_list[k], new_point, r_k = \
                        self.generate_column(k, direction,
                                             x_k=x_ia.get_block(k))
                generate_column_time_list[k] = round(time.time() - tic,
                                                     2)
                if r_k is not None:
                    r_cg.set_block(k, r_k)
                else:
                    r_cg.set_block(k, w_ia.get_block(k))
                # logger.info(
                #     'added r_{0} in iter {1}'.format(k, i))
                if new_point is True:
                    # count in current iteration
                    new_columns_generated.append(1)

                    # cumulative count
                    new_columns_generated_cumulative[k] += 1
                else:
                    new_columns_generated.append(0)

            if all(item == 0 for item in new_columns_generated):
                logger.info('No new columns generated in the current iteration')
                break

            z, x_ia, w_ia, slacks, duals, obj_value_ia = \
                self.problem.master_problems.solve_ia(self.settings.lp_solver)
            self.result.cg_relaxation = obj_value_ia

            logger.info('\n{0: <10}{1: <30}'
                        '{2: <30}'.format('iter', 'IA obj. value', 'slacks'))
            logger.info('{0: <10}{1: <30}'
                        '{2: <30}'.format(i,
                                          obj_value_ia * self.result.sense,
                                          sum(map(sum, slacks))))

            if sum(map(sum, slacks)) < 1e-2:
                logger.info('IA obj. val: {0}'.format(
                    obj_value_ia * self.result.sense))
                logger.info(
                    'Elapsed time: {0}'.format(self.result.current_used_time +
                                               (time.time() - start_time)))

            # use column
            for j, (index, vector) in enumerate(r_cg.vectors.items()):
                if j == 0:
                    r_cg_array = np.array(vector.reshape(1, len(vector)))
                else:
                    r_cg_array = \
                        np.concatenate((r_cg_array,
                                        vector.reshape(1, len(vector))))

            # the operations add, substract and multiplication by scalar is
            # implemented in BlockVector class. Maybe it is easier to use them
            # The implementation of summing the components of BlockVector
            # can implemented and added there

            # determining the step size
            coeff_w_r_array = r_cg_array - tilde_w_array
            coeff_a = np.multiply((np.sum(coeff_w_r_array[:, 1:], axis=0)
                                   - global_cuts_rhs), sigma_cg)
            coeff_a = \
                2 * np.dot(coeff_a, np.sum(coeff_w_r_array[:, 1:], axis=0))
            coeff_b = np.multiply(sigma_cg,
                                  np.sum(tilde_w_array[:, 1:], axis=0))
            coeff_b = 2 * np.dot(coeff_b,
                                 np.sum(coeff_w_r_array[:, 1:], axis=0))
            coeff_b += np.sum(coeff_w_r_array[:, 0], axis=0)

            if coeff_a == 0:  # tilda_w equals nu_plus
                # logger.info('tilda_w equals nu_plus')
                break
            else:
                theta_cg = - coeff_b / coeff_a
            # logger.info('theta_cg: {0}'.format(theta_cg))
            if theta_cg == 0:
                break

            # update step
            add_term = theta_cg * (r_cg_array - tilde_w_array)
            v_array = copy.copy(v_plus_array)
            v_plus_array = tilde_w_array + add_term
            # fast FW step
            gamma_cg = gamma_cg_plus
            gamma_cg_plus = 0.5 * (1 + math.sqrt(4 * gamma_cg ** 2
                                                 + 1))
            tilde_w_array = v_plus_array + \
                            (gamma_cg - 1) / gamma_cg_plus * \
                            (v_plus_array - v_array)

            gap = {}
            for k in range(self.problem.block_model.num_blocks):
                if self.problem.block_model.sub_models[k].linear is False:
                    gap[k] = np.dot(direction, (tilde_w_array[k, :] -
                                                r_cg_array[k, :]))

            # logger.info('Value of gap (g_k):')
            # logger.info(gap)

            logger.info('Number of new columns in the current iteration:')
            logger.info(new_columns_generated)

            # update direction
            direction = 2 * np.multiply(sigma_cg, np.sum(tilde_w_array[:, 1:],
                                                         axis=0) -
                                        global_cuts_rhs)
            direction = np.concatenate(([1], direction))

            if i == self.settings.cg_fast_fw_max_iter:
                break

        logger.info('\nNew columns in FastCG:')
        logger.info(list(new_columns_generated_cumulative.values()))

        # number of unfixed nlp subproblems during CG
        logger.info('number of unfixed nlp subproblems '
                    'solved during CG: {0}'
                    .format(self.result.cg_num_unfixed_nlp_problems -
                            num_unfixed_nlp_problems_solved))
        time_fast_cg = round(time.time() - tic_fast_cg, 2)
        logger.info('Time used for solving subproblem'
                    ': --{0}-- seconds'.
                    format(time_fast_cg))
        logger.info('---------------------------------------------------------')

[docs]    def sub_gradient(self, direction_vector):
        """Performs sub-gradient iterations

        :param direction_vector: Initial vector for sub-gradient iterations
        :type direction_vector: ndarray
        :return: Final direction vector
        :rtype: tuple
        """

        y = BlockVector()

        # create an array of rhs of global constraints
        b = np.zeros(shape=self.problem.block_model.cuts.num_of_global_cuts)
        for j, cut in enumerate(self.problem.block_model.cuts.global_cuts):
            b[j] = cut.rhs

        iteration = 0
        alpha = 1
        logger.info('\nSubgradient steps')
        logger.info('{0: <15}{1: <30}{2: <30}'
                    .format('Subgra.iter', 'Lagrange bound', 'alpha'))

        direction_vector_prev = copy.deepcopy(direction_vector)
        lag_sol_prev = float('-inf')

        violation = np.zeros(
            shape=self.problem.block_model.cuts.num_of_global_cuts)

        while iteration < self.settings.cg_sub_gradient_max_iter:
            time_generate_column_sub_gradient_list = {}
            new_columns_generated = [0] * self.problem.block_model.num_blocks
            iteration += 1
            lag_sol = 0
            direction = np.concatenate(([1], direction_vector))
            for k in range(self.problem.block_model.num_blocks):
                if self.problem.block_model.sub_models[k].linear:
                    # solve the sub-problem of linear atomic block
                    # logger.info('{0: <15}{1: <30}'
                    #             .format('linear block:', k))
                    dir_orig_space = \
                        self.problem.block_model.trans_into_orig_space(
                            k, direction)
                    feasible_point, _, _, _ = \
                        self.problem.sub_problems[k].minlp_solve(
                            solver_name='gurobi',
                            direction=dir_orig_space)
                    y.set_block(k, feasible_point)
                else:
                    # logger.info('{0: <15}{1: <30}'
                    #             .format('nonlinear block:', k))
                    tic = time.time()
                    feasible_point, primal_bound, reduced_cost, new_point, _ = \
                        self.generate_column(k, direction)
                    time_generate_column_sub_gradient_list[k] = round(
                        time.time() - tic, 2)
                    if new_point is True:
                        new_columns_generated[k] += 1
                    y.set_block(k, feasible_point)
                    lag_sol += primal_bound

            lag_sol -= np.dot(direction_vector, b)

            logger.info('{0: <15}{1: <30}{2: <30}'
                        .format(iteration, self.result.sense * lag_sol, alpha))

            if iteration == 1:
                violation = self.problem.eval_viol_lin_global_constraints(y)

                lag_sol_prev = lag_sol
                direction_vector_prev = copy.deepcopy(direction_vector)
            else:
                # update the step
                if lag_sol <= lag_sol_prev:
                    alpha *= 0.5
                    direction_vector = copy.deepcopy(direction_vector_prev)
                else:
                    alpha *= 2
                    violation = self.problem.eval_viol_lin_global_constraints(y)

                    lag_sol_prev = lag_sol
                    direction_vector_prev = copy.deepcopy(direction_vector)

            if all(abs(item) <= 1e-1 for item in violation):
                # if no violation, stop
                break

            # update direction
            direction_vector += alpha * violation

        check_w = BlockVector()

        # taking most recent generated column into check_w
        for k in range(self.problem.block_model.num_blocks):
            column = \
                self.problem.block_model.trans_into_im_space(k, y.get_block(k))
            check_w.set_block(k, column)

        return direction_vector, check_w

[docs]    def generate_column(self, block_id, direction, heuristic=True,
                        approx_solver=False, x_k=None):
        """Generates the inner point (and corresponding column) either
        with MINLP sub-problem or with NLP sub-problem (too heuristically);
        adds valid local linear cut to heu_oa_master_problem if any

        :param block_id: Block identifier
        :type block_id: int
        :param direction: Direction in image space
        :type direction: ndarray
        :param heuristic: Indicates if the sub-problem must be solved \
        heuristically
        :type heuristic: bool
        :param approx_solver: enables approximate solving of subproblems in \
        column generation
        :type approx_solver: bool
        :param x_k: start_point for solving subproblems
        :type x_k: BlockVector or None
        :return: Inner point, primal bound, reduced cost of new point, \
        bool value indicating whether new point is generated and \
        corresponding column
        :rtype: tuple
        """
        if approx_solver:  # approximate solve minlp subproblem
            feasible_point, primal_bound, reduced_cost, is_new_point, \
                column = self.local_solve_subproblem(
                    block_id, direction, x_k=x_k)
        else:
            if self.settings.cg_generate_columns_with_nlp is True:
                feasible_point, primal_bound, reduced_cost, is_new_point, \
                    column = self.local_solve_subproblem(block_id,
                                                         direction,
                                                         x_k=x_k)
                if reduced_cost > -0.01:
                    feasible_point, reduced_cost, primal_bound, _, \
                        is_new_point, column = \
                        self.global_solve_subproblem(block_id, direction)
            else:
                feasible_point, reduced_cost, primal_bound, _, is_new_point, \
                    column = self.global_solve_subproblem(block_id,
                                                          direction,
                                                          x_k=x_k)

        reduced_cost = round(reduced_cost, 3)

        return feasible_point, primal_bound, reduced_cost, is_new_point, column

[docs]    def global_solve_subproblem(self, block_id,
                                dir_im_space,
                                compute_reduced_cost=True, x_k=None):
        """Solves subproblem, adds inner point, \
        (either in compact form or in the original) and computes reduced cost \
        for the new inner point

        :param block_id: Block identifier
        :type block_id: int
        :param dir_im_space: Direction in image space
        :type dir_im_space: ndarray
        :param compute_reduced_cost: Indicates if reduced cost has to be \
        computed
        :type compute_reduced_cost: bool
        :param heuristic: Indicates if the sub-problem must be solved \
        heuristically
        :type heuristic: bool
        :return: Inner point (feasible point), reduced cost value, \
        primal bound of the sub-problem, dual bound of the sub-problem, \
        bool value indicating whether new inner point was generated, \
        corresponding column to the inner point
        :rtype: tuple
        """
        self.result.cg_num_minlp_problems += 1

        # can be None in case of initialization of the inner master problem
        reduced_cost = None
        is_new_point = False

        # transform into original space the direction
        dir_orig_space = \
            self.problem.block_model.trans_into_orig_space(block_id,
                                                           dir_im_space)

        # solve the sub-problem
        feasible_point, primal_bound, dual_bound, _ = \
            self.problem.sub_problems[block_id].global_solve(
                direction=dir_orig_space,
                result=self.result)

        column = None
        if compute_reduced_cost is True:
            # compute reduced cost

            # get the best inner point with given direction
            best_point, best_obj_val = self.problem.get_min_inner_point(
                block_id, dir_orig_space)
            reduced_cost = primal_bound - best_obj_val  # absolute reduced cost

            if reduced_cost < 0:
                # add the inner point with negative absolute reduced cost
                is_new_point, _, column = \
                    self.problem.add_inner_point(block_id, feasible_point)
        else:
            is_new_point, _, column = \
                self.problem.add_inner_point(
                    block_id, feasible_point,
                    self.settings.cg_min_inner_point_distance)

        if column is None:
            column = self.problem.block_model.trans_into_im_space(
                block_id, feasible_point)

        # add sub-problem data
        if self.settings.generate_data is True:
            self.result.add_sub_problem_data(block_id,
                                             dir_im_space,
                                             dir_orig_space,
                                             column,
                                             feasible_point,
                                             x_k)

        # check if subproblem is solved to optimality
        gap = abs(primal_bound - dual_bound) / (
                max(abs(primal_bound), abs(dual_bound)) + 1e-5)
        if gap > 0.0001:
            self.result.optimal_subproblems = False

        return feasible_point, reduced_cost, primal_bound, dual_bound, \
               is_new_point, column

[docs]    def get_slack_directions(self, slacks):
        """Computes new direction based on the slack values of IA master problem

        :param slacks: Slack values stored as a list of tuples
        :type slacks: list
        :return: New direction in image space
        :rtype: ndarray
        """

        # get maximum slack value
        max_slack_value = max(max(item) for item in slacks)

        direction_image_space = np.zeros(
            shape=self.problem.block_model.cuts.num_of_global_cuts + 1)
        for m, slack in enumerate(slacks):
            # check if slacks are zero
            if any(item != 0 for item in slack) and \
                    max(slack) > 0.1 * max_slack_value:
                direction_image_space[m + 1] = 1

        return direction_image_space

[docs]    def local_solve_subproblem(self, block_id, dir_im_space, x_k=None):
        """Solves MINLP subproblem approximately, adds inner point \
        (either in compact form or in the original) and computes reduced cost
        for the new inner point

        :param block_id: Block identifier
        :type block_id: int
        :param dir_im_space: Direction in image space
        :type dir_im_space: ndarray
        :param x_k: start_point for solving subproblems
        :type x_k: BlockVector or None
        :return: Inner point (feasible point), reduced cost value, \
        primal bound of the sub-problem, dual bound of the sub-problem, \
        bool value indicating whether new inner point was generated, \
        corresponding column to the inner point
        :rtype: tuple
        """
        self.result.cg_num_unfixed_nlp_problems += 1

        dir_orig_space = self.problem.block_model.trans_into_orig_space(
            block_id, dir_im_space)

        if x_k is not None:
            best_point = x_k
            best_point_obj_val = np.dot(dir_orig_space, best_point)
        else:
            best_point, best_point_obj_val = self.problem.get_min_inner_point(
                block_id, dir_orig_space)

        # solve the sub-problem
        tilde_y, new_point_obj_val, _, sol_is_feasible = \
            self.problem.sub_problems[block_id].local_solve(
                direction=dir_orig_space, result=self.result,
                start_point=best_point)

        reduced_cost = 0
        column = None
        is_new_point = False
        if sol_is_feasible is True:
            reduced_cost = (new_point_obj_val - best_point_obj_val) / (
                    max(abs(new_point_obj_val),
                        abs(best_point_obj_val)) + 1e-5)
            is_new_point, _, column = \
                self.problem.add_inner_point(
                    block_id, tilde_y, min_inner_point_dist=
                    self.settings.cg_min_inner_point_distance)

            # add sub-problem data
            if self.settings.generate_data is True:
                self.result.add_sub_problem_data(block_id,
                                                 dir_im_space,
                                                 dir_orig_space,
                                                 column, tilde_y)
        else:
            tilde_y = None
            new_point_obj_val = None

        return tilde_y, new_point_obj_val, reduced_cost, is_new_point, column

[docs]    def find_solution_init(self, iter_index=None):
        """Method to generate a feasible solution and therefore reducing
        the slacks to zero in innerMaster problem

        :param iter_index: number of main iteration when the method is called
        :type: int
        """
        logger.info('\n=======================================================')
        logger.info('Find solution - init')

        # solve IA master problem
        _, _, w_ia, _, _, obj_value_ia = \
            self.problem.master_problems.solve_ia(self.settings.lp_solver)
        self.result.cg_relaxation = obj_value_ia

        self.problem.original_problem.local_solve_fast(w_ia, self.result,
                                                       self.problem,
                                                       iter_index)

[docs]    def find_solution(self, iter_index=None):
        """Primal heuristics method

        :param iter_index: number of main iteration when the method is called
        :type: int
        """
        logger.info('\n=======================================================')
        logger.info('Find solution - projection from ia solution - '
                    'local search')

        _, tilde_y, _, _, _, obj_value_ia = \
            self.problem.master_problems.solve_ia(
                self.settings.lp_solver)  # solve the inner problem
        self.result.cg_relaxation = obj_value_ia

        self.problem.original_problem.local_solve(tilde_y, self.result,
                                                  self.problem, iter_index)

[docs]    def print_z_values(self, z):
        """Prints sorted z-weights blockwise

        :param z: Weight vector
        :type z: BlockVector
        """
        non_zero_z = {}
        for k in range(self.problem.block_model.num_blocks):
            non_zero_z[k] = []
            for i, item in enumerate(z.get_block(k)):
                if item > 0:
                    non_zero_z[k].append((i, item))
            non_zero_z[k].sort(key=lambda x: x[1], reverse=True)

        logger.info('z values')
        logger.info(
            'Pairs (index z_k values), such that z_k > 0, sorted by z_k values')
        for k in range(self.problem.block_model.num_blocks):
            logger.info('block {0}: {1}'.format(k, non_zero_z[k]))

[docs]    def fw_column_generation(self, check_w, duals, t_set):
        """ Performs fast FW column generation steps (see paper) """

        logger.info('---------------------------------------------------------')
        logger.info('Fast fw column generation')

        tic_fast_cg = time.time()

        direction = np.concatenate(([1], duals))

        # sigma_cg = abs(duals) + value?
        sigma_cg = abs(duals)

        # todo: refactor this, make use of BlockVector,
        # if neccessary extend BlockVector class
        for j, (index, vector) in enumerate(check_w.vectors.items()):
            if j == 0:
                check_w_array = np.array(vector.reshape(1, len(vector)))
            else:
                check_w_array = \
                    np.concatenate((check_w_array,
                                    vector.reshape(1, len(vector))))

        global_cuts_rhs = []
        for cut in self.problem.block_model.cuts.global_cuts:
            global_cuts_rhs.append(cut.rhs)
        global_cuts_rhs = np.array(global_cuts_rhs)

        # num_unfixed_nlp_problems_solved = \
        #     self.result.cg_num_unfixed_nlp_problems
        gamma_cg_plus = 1

        # logger.info('{0: <15}'
        #             .format('hat_t_set:'))
        # logger.info(list(t_set))
        i = 0
        tilde_v, tilde_w, tilde_t_set = \
            self.get_active_block(dir_im_space=direction, t_set=t_set)
        # logger.info('{0: <15}'
        #             .format('active block:'))
        # active_block = {ti: self.problem.approx_data.inner_points.KT[ti]
        #                 for ti in tilde_t_set}
        # logger.info(active_block)
        # v_plus <- tilde_v
        for j, (index, vector) in enumerate(tilde_v.vectors.items()):
            if j == 0:
                v_plus_array = np.array(vector.reshape(1, len(vector)))
            else:
                v_plus_array = \
                    np.concatenate((v_plus_array,
                                    vector.reshape(1, len(vector))))

        new_columns_generated = {t: 0 for t in t_set}
        # generate_column_time_list = {}

        while True:
            i += 1
            # solve sub-problems for t in tilde_t_set and add columns
            for t in tilde_t_set:
                if self.settings.cg_fast_approx:
                    is_new_point = \
                        self.fast_solve_atomic_sub_problem(block_id=t,
                                                           dir_im_space=direction,
                                                           w_k=tilde_w.get_block(
                                                               t))
                else:
                    _, _, _, is_new_point, _ = \
                        self.generate_column(t, direction)

                if is_new_point:
                    new_columns_generated[t] += is_new_point

            if i == self.settings.cg_fast_fw_max_iter:
                logger.info('{0: <30}{1: <15}'
                            .format('reach max iteration:', i))
                break

            tilde_v, tilde_w, tilde_t_set = \
                self.get_active_block(dir_im_space=direction, t_set=t_set)
            # logger.info('{0: <15}'
            #             .format('active block:'))
            # active_block = {ti: self.problem.approx_data.inner_points.KT[ti]
            #                 for ti in tilde_t_set}
            # logger.info(active_block)
            # logger.info(list(tilde_t_set))
            # logger.info(list(new_columns_generated.values()))

            # use column
            for j, (index, vector) in enumerate(tilde_v.vectors.items()):
                if j == 0:
                    tilde_v_array = np.array(vector.reshape(1, len(vector)))
                else:
                    tilde_v_array = \
                        np.concatenate((tilde_v_array,
                                        vector.reshape(1, len(vector))))

            # the operations add, substract and multiplication by scalar is
            # implemented in BlockVector class. Maybe it is easier to use them
            # The implementation of summing the components of BlockVector
            # can implemented and added there

            # determining the step size
            coeff_w_r_array = tilde_v_array - check_w_array
            coeff_a = np.multiply((np.sum(coeff_w_r_array[:, 1:], axis=0)
                                   - global_cuts_rhs), sigma_cg)
            coeff_a = \
                2 * np.dot(coeff_a, np.sum(coeff_w_r_array[:, 1:], axis=0))
            coeff_b = np.multiply(sigma_cg,
                                  np.sum(check_w_array[:, 1:], axis=0))
            coeff_b = 2 * np.dot(coeff_b,
                                 np.sum(coeff_w_r_array[:, 1:], axis=0))
            coeff_b += np.sum(coeff_w_r_array[:, 0], axis=0)

            if coeff_a == 0:  # tilda_w equals nu_plus
                logger.info('tilda_w equals nu_plus')
                break
            else:
                theta_cg = - coeff_b / coeff_a
            # logger.info('theta_cg: {0}'.format(theta_cg))
            if theta_cg == 0:
                break

            # update step
            add_term = theta_cg * (tilde_v_array - check_w_array)
            v_array = copy.copy(v_plus_array)
            v_plus_array = check_w_array + add_term
            # fast FW step
            gamma_cg = gamma_cg_plus
            gamma_cg_plus = 0.5 * (1 + math.sqrt(4 * gamma_cg ** 2
                                                 + 1))
            check_w_array = v_plus_array + \
                            (gamma_cg - 1) / gamma_cg_plus * \
                            (v_plus_array - v_array)

            gap = {}
            for k in range(self.problem.block_model.num_blocks):
                if self.problem.block_model.sub_models[k].linear is False:
                    gap[k] = np.dot(direction, (check_w_array[k, :] -
                                                tilde_v_array[k, :]))

            # logger.info('Value of gap (g_k):')
            # logger.info(gap)

            # logger.info('Number of new columns in the current iteration:')
            # logger.info(new_columns_generated)

            # update direction
            direction = 2 * np.multiply(sigma_cg, np.sum(check_w_array[:, 1:],
                                                         axis=0) -
                                        global_cuts_rhs)
            direction = np.concatenate(([1], direction))

        logger.info('hat_t_set:')
        logger.info(list(t_set))
        logger.info('New columns in FastCG:')
        logger.info(list(new_columns_generated.values()))

        # todo: refactor this, make use of BlockVector,
        # if neccessary extend BlockVector class
        check_w = BlockVector()
        for k in range(self.problem.block_model.num_blocks):
            check_w.set_block(k, check_w_array[k])

        # # number of unfixed nlp subproblems during CG
        # logger.info('number of unfixed nlp subproblems '
        #             'solved during CG: {0}'
        #             .format(self.result.cg_num_unfixed_nlp_problems -
        #                     num_unfixed_nlp_problems_solved))
        time_fast_cg = round(time.time() - tic_fast_cg, 2)
        self.result.current_used_time += time_fast_cg
        logger.info('Time used for solving subproblem'
                    ': --{0}-- seconds'.
                    format(time_fast_cg))
        logger.info('---------------------------------------------------------')

        return check_w

[docs]    def get_active_block(self, dir_im_space, t_set=None):

        tilde_v = BlockVector()
        tilde_t_set = []
        if t_set is None:
            t_set = list(self.problem.approx_data.inner_points.points.keys())

        t_set_enumerate = copy.copy(t_set)
        hat_t_set = copy.copy(t_set)
        for t in t_set_enumerate:
            if t in range(self.problem.block_model.num_blocks):
                # handle linear atomic block
                if self.problem.block_model.sub_models[t].linear:
                    if t in hat_t_set:
                        hat_t_set.remove(t)
            else:
                # select hyper-blocks with empty column
                if self.problem.approx_data.inner_points.get_size(t) == 0:
                    tilde_t_set.append(t)
                    hat_t_set.remove(t)

        # set of atomic block indices from t_set
        hat_k_set = []
        for t in hat_t_set:
            for k in self.problem.approx_data.inner_points.KT[t]:
                # remove linear atomic block from hat_k_set
                if self.problem.block_model.sub_models[k].linear is False:
                    if k not in hat_k_set:
                        hat_k_set.append(k)
        # fill resources for linear atomic block and
        # missing atomic blocks from hat_k_set
        for k in range(self.problem.block_model.num_blocks):
            if self.problem.block_model.sub_models[k].linear:
                # solve the sub-problem of linear atomic block
                dir_orig_space = \
                    self.problem.block_model.trans_into_orig_space(
                        k, dir_im_space)
                feasible_point, _, _, _ = \
                    self.problem.sub_problems[k].minlp_solve(
                        solver_name='gurobi',
                        direction=dir_orig_space)
                column = \
                    self.problem.block_model.trans_into_im_space(
                        k, feasible_point)
                tilde_v.set_block(k, column)
            else:
                if k not in hat_k_set:
                    column, _ = \
                        self.problem.get_min_column(k, dir_im_space)
                    tilde_v.set_block(k, column)

        # calculate minimum resources/column and select active blocks from
        # blocks (with columns) in t_set
        tilde_w = BlockVector()
        tilde_t_k_set = {k: k for k in hat_k_set}
        max_obj_val = {k: float('-inf') for k in hat_k_set}
        for t in hat_t_set:
            if t in range(self.problem.block_model.num_blocks):
                column, obj_val = \
                    self.problem.get_min_column(t, dir_im_space)
                tilde_w.set_block(t, column)
                # tilde_v.set_block(t, column)
                if obj_val > max_obj_val[t]:
                    max_obj_val[t] = obj_val
                    tilde_t_k_set[t] = t
            else:
                column_2d_array, _ = \
                    self.problem.get_min_column(t, dir_im_space)
                tilde_w.set_block(t, column_2d_array)
                for index, i in enumerate(
                        self.problem.approx_data.inner_points.KT[t]):
                    column = column_2d_array[index]
                    obj_val = np.dot(dir_im_space, column)
                    if self.problem.block_model.sub_models[i].linear is False:
                        if obj_val >= max_obj_val[i]:
                            max_obj_val[i] = obj_val
                            tilde_t_k_set[i] = t

        # select active blocks from blocks (with columns) in t_set
        for k in hat_k_set:
            t = tilde_t_k_set[k]
            if t not in tilde_t_set:
                tilde_t_set.append(t)
            if t == k:
                column = tilde_w.get_block(k)
                tilde_v.set_block(k, column)
            else:
                column_2d_array = tilde_w.get_block(t)
                index = self.problem.approx_data.inner_points.KT[t].index(k)
                column = column_2d_array[index]
                tilde_v.set_block(k, column)

        return tilde_v, tilde_w, tilde_t_set

[docs]    def fast_solve_atomic_sub_problem(self, block_id, dir_im_space, w_k):
        """Solves MINLP subproblem approximately, adds inner point \
        (either in compact form or in the original) and computes reduced cost
        for the new inner point

        :param block_id: Block identifier
        :type block_id: int
        :param dir_im_space: Direction in image space
        :type dir_im_space: ndarray
        :param w_k: given column
        :type w_k: ndarray
        :return: Inner point (feasible point), primal bound of the sub-problem, \
        dual bound of the sub-problem, \
        bool value indicating whether new inner point was generated, \
        corresponding column to the inner point
        :rtype: tuple
        """

        solver_options = self.settings.get_nlp_solver_options()

        start_point, _, _ = \
            self.problem.sub_problems[block_id].resource_proj_solve(
                self.settings.nlp_solver, w_k)

        # direction must be in the original space
        dir_orig_space = self.problem.block_model.trans_into_orig_space(
            block_id, dir_im_space)

        # in order to solve NLP relaxation of MINLP problem it is not
        # necessary explicitly to relax integer variables
        # the NLP solver simply treats them as continuous variables
        unfixed_tilde_y, new_point_obj_val, _, sol_is_feasible = \
            self.problem.sub_problems[block_id].minlp_solve(
                self.settings.nlp_solver, direction=dir_orig_space,
                solver_options=solver_options, start_point=start_point)

        if self.problem.block_model.sub_models[block_id].integer is True:

            rounded_point = \
                self.problem.block_model.sub_models[block_id].round(
                    unfixed_tilde_y)
            # start_point is used for fixing the integers
            tilde_y, new_point_obj_val, _, sol_is_feasible = \
                self.problem.sub_problems[block_id].fixed_minlp_solve(
                    self.settings.nlp_solver,
                    start_point=rounded_point,
                    direction=dir_orig_space,
                    solver_options=solver_options)

        else:
            tilde_y = unfixed_tilde_y

        is_new_point = False
        if sol_is_feasible is True:
            is_new_point, _, column = \
                self.problem.add_inner_point(
                    block_id, tilde_y,
                    min_inner_point_dist=
                    self.settings.cg_min_inner_point_distance)
            # add sub-problem data
            if self.settings.generate_data is True:
                self.result.add_sub_problem_data(block_id,
                                                 dir_im_space,
                                                 dir_orig_space,
                                                 column, tilde_y)

        return is_new_point