import numpy as np
import pandas as pd
import sklearn
import matplotlib as mlp
import matplotlib.pyplot as plt
import seaborn as sns
import time
import re, pip, conda


for package in [sklearn,mlp,np,pd,sns,pip,conda]:
    print(re.findall("([^']*)",str(package))[2],package.__version__)

sklearn 1.0.1
matplotlib 3.4.3
numpy 1.21.4
pandas 1.3.4
seaborn 0.11.2
pip 21.3.1
conda 4.11.0


#pip install --upgrade scikit-learn
#conda update scikit-learn


[0,1] - 100个小区间

[0,0.01] n1
[0.01,0.02] n2
[0.02,0.03] n3
...
[0.99,1] n100


#!pip install bayesian-optimization
#!conda install -c conda-forge bayesian-optimization


#!pip install hyperopt


#!pip install optuna
#!conda install -c conda-forge optuna


#!pip install scikit-optimize


# 基本工具
import numpy as np
import pandas as pd
import time
import os # 用于修改环境设置

# 算法/损失/评估指标等
import sklearn
from sklearn.ensemble import RandomForestRegressor as RFR
from sklearn.model_selection import KFold, cross_validate

# 导入贝叶斯优化器bayes_opt
from bayes_opt import BayesianOptimization

# 导入贝叶斯优化器hyperopt
import hyperopt
from hyperopt import hp, fmin, tpe, Trials, partial
from hyperopt.early_stop import no_progress_loss

# 导入贝叶斯优化器optuna
import optuna

C:\Users\zhiyuan\anaconda3\envs\kaggle\lib\site-packages\tqdm\auto.py:22: TqdmWarning: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html
  from .autonotebook import tqdm as notebook_tqdm


print(optuna.__version__)

3.1.0


print(hyperopt.__version__)

0.2.7


data = pd.read_csv(r"..\Lesson 09.随机森林模型\datasets\House Price\train_encode.csv",index_col=0)

X = data.iloc[:,:-1]
y = data.iloc[:,-1]


X.head()


X.shape

(1460, 80)


from bayes_opt import BayesianOptimization


def bayesopt_objective(n_estimators, max_depth, max_features, min_impurity_decrease):
    
    # 定义评估器：随机森林
    # 需要调整的超参数等于目标函数的输入，不需要调整的超参数则直接等于固定值
    # 默认参数输入一定是浮点数，因此需要套上int函数处理成整数
    reg = RFR(n_estimators = int(n_estimators)
              ,max_depth = int(max_depth)
              ,max_features = int(max_features)
              ,min_impurity_decrease = min_impurity_decrease
              ,random_state = 1412
              ,verbose = False # 可自行决定是否开启森林建树的verbose
              ,n_jobs = -1)
    
    # 交叉验证
    # 定义损失的输出，5折交叉验证下的结果，输出负根均方误差（-RMSE）
    # 注意，交叉验证需要使用数据，但我们不能让数据X,y成为目标函数的输入
    cv = KFold(n_splits=5,shuffle=True,random_state=1412)
    # 输出交叉验证的结果
    validation_loss = cross_validate(reg,X,y
                                     ,scoring="neg_root_mean_squared_error"
                                     ,cv=cv
                                     ,verbose=False       # 不打印具体流程
                                     ,n_jobs=-1
                                     ,error_score='raise' # 如果交叉验证中的算法执行报错，则告诉我们错误的理由
                                    )
    
    # 交叉验证的结果
    # 交叉验证输出的评估指标是负根均方误差，因此本来就是负的损失
    # 目标函数可直接输出该损失的均值
    return np.mean(validation_loss["test_score"])


param_grid_simple = {'n_estimators': (80,100)
                     , 'max_depth':(10,25)
                     , "max_features": (10,20)
                     , "min_impurity_decrease":(0,1)
                    }


def param_bayes_opt(init_points,n_iter):
    
    # 定义优化器，先实例化优化器
    opt = BayesianOptimization(bayesopt_objective # 需要优化的目标函数
                               ,param_grid_simple # 备选参数空间
                               ,random_state=1412 # 随机数种子，虽然无法控制住
                              )
    
    # 使用优化器，Ps：记住bayes_opt只支持最大化
    opt.maximize(init_points = init_points # 抽取多少个初始观测值
                 , n_iter=n_iter           # 一共观测/迭代多少次
                )
    
    # 优化完成，取出最佳参数与最佳分数
    params_best = opt.max["params"] # 使用键值对取出最佳参数
    score_best = opt.max["target"]  # 获取最佳分数
    
    # 打印最佳参数与最佳分数
    print("\n","\n","best params: ", params_best,
          "\n","\n","best cvscore: ", score_best)
    
    # 返回最佳参数与最佳分数
    return params_best, score_best


def bayes_opt_validation(params_best):
    
    # 输入参数
    reg = RFR(n_estimators = int(params_best["n_estimators"]) 
              ,max_depth = int(params_best["max_depth"])
              ,max_features = int(params_best["max_features"])
              ,min_impurity_decrease = params_best["min_impurity_decrease"]
              ,random_state=1412
              ,verbose=False
              ,n_jobs=-1)

    cv = KFold(n_splits=5,shuffle=True,random_state=1412)
    
    # 交叉验证
    validation_loss = cross_validate(reg,X,y
                                     ,scoring="neg_root_mean_squared_error"
                                     ,cv=cv
                                     ,verbose=False
                                     ,n_jobs=-1
                                    )
    # 返回测试集分数
    return np.mean(validation_loss["test_score"])


start = time.time()
params_best, score_best = param_bayes_opt(20,280) #初始看20个观测值，后面迭代280次
print('It takes %s minutes' % ((time.time() - start)/60))
validation_score = bayes_opt_validation(params_best)
print("\n","\n","validation_score: ",validation_score)

# 输出结果第一列是迭代次数、第2列是目标函数值、第3列 ... 是最大深度 ... 最大特征 等等参数。整体迭代300次。最后打印最佳参数、分数、耗时。

|   iter    |  target   | max_depth | max_fe... | min_im... | n_esti... |
-------------------------------------------------------------------------
|  1        | -2.948e+0 |  23.2     |  17.52    |  0.06379  |  88.79    |
|  2        | -2.909e+0 |  14.8     |  17.61    |  0.9214   |  97.58    |
|  3        | -2.9e+04  |  15.86    |  15.56    |  0.2661   |  87.98    |
|  4        | -2.887e+0 |  14.05    |  16.84    |  0.06744  |  89.72    |
|  5        | -2.887e+0 |  18.71    |  19.17    |  0.9315   |  83.7     |
|  6        | -2.895e+0 |  17.7     |  19.58    |  0.7127   |  89.18    |
|  7        | -2.968e+0 |  14.21    |  12.62    |  0.3381   |  91.51    |
|  8        | -2.91e+04 |  23.23    |  10.89    |  0.6078   |  95.06    |
|  9        | -2.891e+0 |  14.89    |  14.0     |  0.9487   |  80.16    |
|  10       | -2.958e+0 |  11.52    |  12.58    |  0.03276  |  92.56    |
|  11       | -2.91e+04 |  13.14    |  13.31    |  0.2563   |  98.24    |
|  12       | -2.95e+04 |  17.94    |  11.48    |  0.3778   |  82.09    |
|  13       | -2.913e+0 |  16.02    |  17.03    |  0.7735   |  88.31    |
|  14       | -2.925e+0 |  13.92    |  15.04    |  0.529    |  93.66    |
|  15       | -2.938e+0 |  12.51    |  13.69    |  0.4482   |  99.9     |
|  16       | -2.933e+0 |  17.73    |  10.05    |  0.4143   |  82.79    |
|  17       | -2.952e+0 |  16.6     |  10.84    |  0.9134   |  88.37    |
|  18       | -2.958e+0 |  21.92    |  15.0     |  0.8219   |  85.86    |
|  19       | -2.934e+0 |  14.07    |  11.38    |  0.05068  |  91.53    |
|  20       | -2.962e+0 |  10.35    |  17.38    |  0.7624   |  99.19    |
|  21       | -2.937e+0 |  13.97    |  16.09    |  0.3349   |  88.16    |
|  22       | -2.887e+0 |  14.95    |  16.89    |  0.07827  |  89.8     |
|  23       | -2.908e+0 |  14.21    |  17.99    |  0.4688   |  90.52    |
|  24       | -2.887e+0 |  18.29    |  19.35    |  0.8535   |  85.12    |
|  25       | -2.968e+0 |  19.49    |  20.0     |  0.0      |  84.53    |
|  26       | -2.906e+0 |  17.9     |  18.8     |  1.0      |  84.29    |
|  27       | -2.886e+0 |  14.42    |  16.55    |  0.0      |  90.57    |
|  28       | -2.885e+0 |  14.52    |  16.53    |  1.0      |  90.12    |
|  29       | -2.902e+0 |  15.17    |  15.66    |  0.319    |  89.94    |
|  30       | -2.928e+0 |  13.27    |  16.41    |  0.8249   |  90.6     |
|  31       | -2.881e+0 |  15.2     |  16.7     |  0.6155   |  90.9     |
|  32       | -2.905e+0 |  16.04    |  17.33    |  1.0      |  90.32    |
|  33       | -2.889e+0 |  18.73    |  18.79    |  1.0      |  82.43    |
|  34       | -2.891e+0 |  17.79    |  19.32    |  1.0      |  86.55    |
|  35       | -2.876e+0 |  19.43    |  17.86    |  1.0      |  83.36    |
|  36       | -2.905e+0 |  20.3     |  17.85    |  1.0      |  82.25    |
|  37       | -2.899e+0 |  18.43    |  16.97    |  0.6339   |  82.39    |
|  38       | -2.929e+0 |  18.72    |  17.58    |  0.8506   |  86.01    |
|  39       | -2.887e+0 |  16.64    |  19.95    |  0.8027   |  85.54    |
|  40       | -2.889e+0 |  16.01    |  19.89    |  0.9527   |  87.31    |
|  41       | -2.89e+04 |  15.33    |  15.78    |  1.0      |  80.25    |
|  42       | -2.939e+0 |  13.54    |  15.32    |  1.0      |  80.0     |
|  43       | -2.947e+0 |  16.93    |  14.72    |  0.81     |  80.6     |
|  44       | -2.895e+0 |  17.53    |  19.89    |  0.3215   |  87.48    |
|  45       | -2.889e+0 |  18.71    |  18.17    |  0.03282  |  82.97    |
|  46       | -2.903e+0 |  15.93    |  19.28    |  0.007221 |  86.27    |
|  47       | -2.9e+04  |  16.01    |  20.0     |  0.0      |  88.86    |
|  48       | -2.875e+0 |  15.67    |  17.5     |  1.0      |  80.3     |
|  49       | -2.878e+0 |  15.38    |  17.32    |  1.0      |  81.6     |
|  50       | -2.853e+0 |  15.99    |  18.21    |  0.0      |  81.1     |
|  51       | -2.904e+0 |  15.55    |  19.09    |  0.601    |  81.11    |
|  52       | -2.924e+0 |  16.73    |  17.63    |  0.4579   |  81.92    |
|  53       | -2.876e+0 |  15.32    |  17.65    |  0.0      |  80.81    |
|  54       | -2.925e+0 |  16.63    |  18.02    |  0.5035   |  80.17    |
|  55       | -2.852e+0 |  15.45    |  18.28    |  0.09286  |  81.23    |
|  56       | -2.853e+0 |  15.55    |  18.11    |  0.0      |  81.88    |
|  57       | -2.907e+0 |  14.55    |  18.07    |  0.0      |  82.08    |
|  58       | -2.921e+0 |  16.2     |  18.99    |  0.0997   |  81.97    |
|  59       | -2.852e+0 |  15.6     |  18.06    |  0.5865   |  81.86    |
|  60       | -2.876e+0 |  15.49    |  17.44    |  0.07222  |  81.46    |
|  61       | -2.877e+0 |  15.42    |  17.81    |  0.9484   |  82.82    |
|  62       | -2.853e+0 |  15.55    |  18.09    |  0.5876   |  80.75    |
|  63       | -2.923e+0 |  19.64    |  16.39    |  0.7572   |  83.73    |
|  64       | -2.909e+0 |  14.75    |  17.82    |  0.9799   |  81.05    |
|  65       | -2.88e+04 |  15.32    |  16.56    |  0.5475   |  83.21    |
|  66       | -2.914e+0 |  15.0     |  17.24    |  1.0      |  84.24    |
|  67       | -2.896e+0 |  15.05    |  15.7     |  1.0      |  82.43    |
|  68       | -2.895e+0 |  15.77    |  15.46    |  0.0      |  83.74    |
|  69       | -2.853e+0 |  15.26    |  18.45    |  0.02002  |  80.46    |
|  70       | -2.941e+0 |  16.16    |  16.76    |  0.2009   |  92.03    |
|  71       | -2.909e+0 |  14.34    |  19.08    |  0.0958   |  80.04    |
|  72       | -2.875e+0 |  15.59    |  17.78    |  0.0424   |  82.72    |
|  73       | -2.967e+0 |  14.36    |  12.3     |  0.6712   |  80.33    |
|  74       | -2.907e+0 |  14.23    |  19.86    |  0.9782   |  86.91    |
|  75       | -2.972e+0 |  19.33    |  20.0     |  1.0      |  88.35    |
|  76       | -2.894e+0 |  17.28    |  19.91    |  0.6293   |  90.76    |
|  77       | -2.935e+0 |  13.92    |  15.84    |  0.1577   |  83.59    |
|  78       | -2.883e+0 |  18.14    |  19.61    |  0.6678   |  92.57    |
|  79       | -2.93e+04 |  19.34    |  18.94    |  0.5768   |  92.74    |
|  80       | -2.887e+0 |  16.88    |  19.67    |  0.3616   |  93.24    |
|  81       | -2.889e+0 |  16.73    |  19.17    |  0.8361   |  91.97    |
|  82       | -2.9e+04  |  17.85    |  20.0     |  1.0      |  93.95    |
|  83       | -2.881e+0 |  15.84    |  20.0     |  0.0      |  92.1     |
|  84       | -2.9e+04  |  15.28    |  19.27    |  0.85     |  93.07    |
|  85       | -2.902e+0 |  15.43    |  19.74    |  0.3355   |  90.84    |
|  86       | -2.901e+0 |  15.86    |  19.64    |  0.252    |  95.07    |
|  87       | -2.942e+0 |  16.98    |  14.7     |  0.2749   |  86.28    |
|  88       | -2.887e+0 |  13.06    |  19.95    |  0.6557   |  94.74    |
|  89       | -2.887e+0 |  13.48    |  19.61    |  0.1196   |  96.02    |
|  90       | -2.881e+0 |  12.42    |  18.66    |  0.7506   |  95.3     |
|  91       | -2.918e+0 |  11.9     |  19.72    |  0.0      |  95.61    |
|  92       | -2.887e+0 |  13.73    |  18.69    |  1.0      |  95.17    |
|  93       | -2.877e+0 |  12.65    |  18.6     |  1.0      |  93.96    |
|  94       | -2.925e+0 |  12.07    |  17.6     |  0.9865   |  94.43    |
|  95       | -2.887e+0 |  13.28    |  18.87    |  0.0      |  94.21    |
|  96       | -2.877e+0 |  12.86    |  19.29    |  0.8052   |  92.65    |
|  97       | -2.875e+0 |  12.29    |  19.9     |  0.7932   |  93.42    |
|  98       | -2.924e+0 |  11.49    |  18.92    |  0.9259   |  92.54    |
|  99       | -2.906e+0 |  14.06    |  19.77    |  0.3828   |  92.67    |
|  100      | -2.89e+04 |  13.04    |  18.51    |  0.6317   |  96.31    |
|  101      | -2.853e+0 |  15.36    |  18.1     |  0.4371   |  80.01    |
|  102      | -2.898e+0 |  14.89    |  19.93    |  0.9062   |  96.9     |
|  103      | -2.889e+0 |  13.66    |  19.58    |  0.4008   |  98.42    |
|  104      | -2.89e+04 |  17.32    |  19.69    |  0.04412  |  91.96    |
|  105      | -2.853e+0 |  15.69    |  18.36    |  0.01086  |  80.16    |
|  106      | -2.9e+04  |  14.83    |  19.7     |  0.4319   |  99.75    |
|  107      | -2.884e+0 |  18.21    |  19.92    |  0.1281   |  99.46    |
|  108      | -2.95e+04 |  19.8     |  20.0     |  0.0      |  100.0    |
|  109      | -2.908e+0 |  17.01    |  20.0     |  0.08407  |  98.65    |
|  110      | -2.905e+0 |  17.93    |  18.06    |  0.6703   |  99.44    |
|  111      | -2.941e+0 |  25.0     |  10.0     |  0.0      |  80.0     |
|  112      | -2.928e+0 |  19.14    |  10.0     |  0.0      |  100.0    |
|  113      | -2.883e+0 |  13.7     |  18.17    |  0.9195   |  92.96    |
|  114      | -2.887e+0 |  13.06    |  19.1     |  0.93     |  93.48    |
|  115      | -2.878e+0 |  12.84    |  19.99    |  0.4258   |  91.65    |
|  116      | -2.889e+0 |  12.35    |  19.96    |  0.3574   |  89.73    |
|  117      | -2.916e+0 |  10.71    |  19.94    |  0.0938   |  88.5     |
|  118      | -2.869e+0 |  12.28    |  19.98    |  0.3843   |  99.26    |
|  119      | -2.869e+0 |  12.74    |  19.85    |  0.007808 |  99.91    |
|  120      | -2.891e+0 |  13.21    |  19.26    |  0.9999   |  99.94    |
|  121      | -2.914e+0 |  11.59    |  19.63    |  0.07302  |  99.93    |
|  122      | -2.87e+04 |  12.73    |  19.19    |  0.02993  |  98.63    |
|  123      | -2.872e+0 |  12.47    |  19.88    |  0.5012   |  97.91    |
|  124      | -2.915e+0 |  11.48    |  19.24    |  0.9974   |  97.93    |
|  125      | -2.892e+0 |  13.28    |  18.95    |  0.01142  |  99.52    |
|  126      | -2.877e+0 |  12.26    |  19.89    |  0.0868   |  92.72    |
|  127      | -2.859e+0 |  24.86    |  14.87    |  0.4054   |  99.26    |
|  128      | -2.873e+0 |  25.0     |  14.04    |  1.0      |  99.6     |
|  129      | -2.929e+0 |  25.0     |  15.45    |  0.9673   |  100.0    |
|  130      | -2.859e+0 |  24.78    |  14.17    |  0.06212  |  98.69    |
|  131      | -2.859e+0 |  24.24    |  14.61    |  0.8034   |  98.56    |
|  132      | -2.856e+0 |  23.96    |  14.38    |  0.04263  |  99.34    |
|  133      | -2.94e+04 |  24.2     |  15.22    |  0.0      |  98.55    |
|  134      | -2.923e+0 |  24.12    |  13.81    |  0.6933   |  99.04    |
|  135      | -2.858e+0 |  24.97    |  14.6     |  0.8047   |  99.24    |
|  136      | -2.858e+0 |  24.78    |  14.14    |  0.1613   |  99.61    |
|  137      | -2.859e+0 |  24.91    |  14.74    |  0.8767   |  98.07    |
|  138      | -2.856e+0 |  23.63    |  14.27    |  0.1131   |  99.81    |
|  139      | -2.917e+0 |  24.85    |  13.76    |  0.8032   |  97.85    |
|  140      | -2.859e+0 |  24.31    |  14.65    |  0.3618   |  99.91    |
|  141      | -2.845e+0 |  22.75    |  14.43    |  0.3707   |  99.28    |
|  142      | -2.845e+0 |  22.77    |  14.8     |  0.02135  |  99.85    |
|  143      | -2.845e+0 |  22.42    |  14.24    |  0.198    |  99.91    |
|  144      | -2.925e+0 |  22.83    |  15.08    |  0.5595   |  99.81    |
|  145      | -2.844e+0 |  22.85    |  14.19    |  0.0      |  99.53    |
|  146      | -2.844e+0 |  22.23    |  14.53    |  0.0      |  99.35    |
|  147      | -2.908e+0 |  22.2     |  13.9     |  0.3868   |  99.11    |
|  148      | -2.869e+0 |  12.85    |  19.93    |  0.7621   |  99.26    |
|  149      | -2.96e+04 |  21.35    |  15.39    |  0.2309   |  99.81    |
|  150      | -2.856e+0 |  23.2     |  14.49    |  0.0109   |  99.33    |
|  151      | -2.861e+0 |  24.92    |  14.82    |  0.9327   |  98.62    |
|  152      | -2.919e+0 |  11.88    |  19.23    |  0.07981  |  94.02    |
|  153      | -2.872e+0 |  12.77    |  19.05    |  0.04917  |  97.76    |
|  154      | -2.914e+0 |  11.82    |  20.0     |  0.0      |  91.19    |
|  155      | -2.856e+0 |  23.07    |  14.19    |  0.003883 |  99.96    |
|  156      | -2.872e+0 |  12.96    |  19.91    |  0.4315   |  97.25    |
|  157      | -2.937e+0 |  24.88    |  15.15    |  0.9654   |  96.93    |
|  158      | -2.913e+0 |  14.28    |  18.03    |  0.7987   |  94.11    |
|  159      | -2.927e+0 |  12.77    |  17.46    |  0.07643  |  98.25    |
|  160      | -2.87e+04 |  12.84    |  19.95    |  0.1335   |  98.81    |
|  161      | -2.893e+0 |  13.3     |  19.4     |  0.983    |  90.89    |
|  162      | -2.853e+0 |  15.37    |  18.67    |  0.8017   |  80.24    |
|  163      | -2.883e+0 |  13.16    |  18.12    |  0.33     |  92.24    |
|  164      | -2.89e+04 |  13.35    |  19.56    |  0.9955   |  97.53    |
|  165      | -2.983e+0 |  10.0     |  10.0     |  1.0      |  85.6     |
|  166      | -2.904e+0 |  15.63    |  19.01    |  0.02633  |  80.04    |
|  167      | -2.909e+0 |  14.94    |  18.14    |  0.918    |  80.02    |
|  168      | -2.853e+0 |  15.75    |  18.13    |  0.02219  |  80.51    |
|  169      | -2.844e+0 |  22.34    |  14.72    |  0.2479   |  98.64    |
|  170      | -2.843e+0 |  22.58    |  14.73    |  0.09646  |  97.92    |
|  171      | -2.964e+0 |  21.98    |  15.36    |  0.3448   |  97.86    |
|  172      | -2.856e+0 |  23.09    |  14.55    |  0.5981   |  98.69    |
|  173      | -2.844e+0 |  22.68    |  14.59    |  0.4372   |  98.17    |
|  174      | -2.844e+0 |  22.74    |  14.42    |  0.02986  |  98.45    |
|  175      | -2.909e+0 |  22.68    |  13.94    |  0.06073  |  97.66    |
|  176      | -2.923e+0 |  22.95    |  15.3     |  0.1521   |  98.32    |
|  177      | -2.844e+0 |  22.12    |  14.38    |  0.04509  |  98.05    |
|  178      | -2.844e+0 |  22.75    |  14.55    |  0.03358  |  98.83    |
|  179      | -2.927e+0 |  25.0     |  10.0     |  1.0      |  89.0     |
|  180      | -2.915e+0 |  25.0     |  20.0     |  0.0      |  80.0     |
|  181      | -2.853e+0 |  15.79    |  18.56    |  0.7099   |  80.36    |
|  182      | -2.891e+0 |  24.98    |  19.91    |  0.1936   |  93.81    |
|  183      | -2.868e+0 |  23.37    |  19.27    |  0.1689   |  94.63    |
|  184      | -2.922e+0 |  23.63    |  18.52    |  0.0      |  93.94    |
|  185      | -2.885e+0 |  23.23    |  20.0     |  0.3337   |  95.25    |
|  186      | -2.89e+04 |  22.78    |  18.79    |  0.3049   |  95.3     |
|  187      | -2.845e+0 |  22.69    |  14.63    |  0.04476  |  99.41    |
|  188      | -2.887e+0 |  24.1     |  19.4     |  0.9451   |  94.93    |
|  189      | -2.895e+0 |  22.57    |  19.96    |  0.3987   |  94.32    |
|  190      | -2.888e+0 |  24.67    |  19.63    |  0.05494  |  96.67    |
|  191      | -2.865e+0 |  23.11    |  19.72    |  0.0      |  97.06    |
|  192      | -2.865e+0 |  23.07    |  19.74    |  0.4877   |  97.98    |
|  193      | -2.914e+0 |  23.47    |  18.98    |  0.02639  |  97.68    |
|  194      | -2.905e+0 |  22.51    |  20.0     |  0.6894   |  97.27    |
|  195      | -2.908e+0 |  22.91    |  20.0     |  0.0      |  98.7     |
|  196      | -2.881e+0 |  23.75    |  20.0     |  0.6416   |  97.48    |
|  197      | -2.844e+0 |  22.39    |  14.74    |  0.02051  |  98.29    |
|  198      | -2.91e+04 |  24.31    |  18.68    |  0.04868  |  95.52    |
|  199      | -2.899e+0 |  25.0     |  20.0     |  1.0      |  98.6     |
|  200      | -2.924e+0 |  24.19    |  15.02    |  0.9349   |  80.11    |
|  201      | -2.86e+04 |  25.0     |  14.54    |  0.3456   |  98.65    |
|  202      | -2.866e+0 |  23.72    |  19.99    |  0.2093   |  96.33    |
|  203      | -2.937e+0 |  18.19    |  10.0     |  1.0      |  94.69    |
|  204      | -2.907e+0 |  10.0     |  20.0     |  1.0      |  83.16    |
|  205      | -2.949e+0 |  20.88    |  13.2     |  0.0      |  91.29    |
|  206      | -2.899e+0 |  24.93    |  19.71    |  0.7239   |  84.92    |
|  207      | -2.864e+0 |  23.47    |  19.53    |  0.9883   |  96.6     |
|  208      | -2.89e+04 |  22.62    |  18.81    |  0.9123   |  96.46    |
|  209      | -2.927e+0 |  22.54    |  10.05    |  0.6898   |  84.75    |
|  210      | -2.895e+0 |  22.53    |  19.11    |  0.9994   |  98.67    |
|  211      | -2.886e+0 |  24.47    |  19.79    |  0.8973   |  96.5     |
|  212      | -2.891e+0 |  22.95    |  19.3     |  0.1932   |  96.38    |
|  213      | -2.98e+04 |  10.0     |  10.0     |  0.0      |  80.0     |
|  214      | -2.968e+0 |  10.3     |  10.06    |  0.7974   |  97.34    |
|  215      | -2.928e+0 |  17.22    |  13.86    |  1.0      |  97.21    |
|  216      | -2.966e+0 |  10.04    |  15.28    |  0.6897   |  85.13    |
|  217      | -2.861e+0 |  24.83    |  14.35    |  0.9897   |  92.38    |
|  218      | -2.873e+0 |  25.0     |  14.19    |  1.0      |  91.43    |
|  219      | -2.861e+0 |  24.11    |  14.84    |  0.681    |  91.97    |
|  220      | -2.859e+0 |  24.93    |  14.77    |  0.1068   |  92.13    |
|  221      | -2.935e+0 |  24.99    |  15.37    |  0.8659   |  92.53    |
|  222      | -2.912e+0 |  24.07    |  13.9     |  0.439    |  91.94    |
|  223      | -2.927e+0 |  23.61    |  15.31    |  0.7272   |  91.32    |
|  224      | -2.859e+0 |  24.53    |  14.67    |  0.07302  |  93.05    |
|  225      | -2.926e+0 |  23.92    |  15.24    |  0.04927  |  92.62    |
|  226      | -2.86e+04 |  24.82    |  14.2     |  0.5013   |  93.37    |
|  227      | -2.859e+0 |  24.89    |  14.48    |  0.03647  |  92.78    |
|  228      | -2.86e+04 |  24.88    |  14.63    |  0.0183   |  94.33    |
|  229      | -2.859e+0 |  24.25    |  14.1     |  0.0      |  93.87    |
|  230      | -2.861e+0 |  24.18    |  14.19    |  0.8938   |  94.33    |
|  231      | -2.913e+0 |  24.68    |  13.42    |  0.2816   |  94.46    |
|  232      | -2.929e+0 |  23.83    |  15.11    |  0.9128   |  94.35    |
|  233      | -2.861e+0 |  24.25    |  14.29    |  0.9944   |  92.97    |
|  234      | -2.915e+0 |  23.37    |  13.37    |  0.762    |  94.11    |
|  235      | -2.856e+0 |  24.73    |  14.37    |  0.261    |  90.4     |
|  236      | -2.935e+0 |  24.95    |  15.1     |  0.4849   |  89.9     |
|  237      | -2.912e+0 |  24.91    |  13.3     |  0.2908   |  89.98    |
|  238      | -2.861e+0 |  24.62    |  14.94    |  0.6089   |  91.26    |
|  239      | -2.861e+0 |  24.54    |  14.36    |  0.1977   |  91.36    |
|  240      | -2.861e+0 |  24.36    |  14.05    |  0.9764   |  93.54    |
|  241      | -2.856e+0 |  24.52    |  14.33    |  0.8382   |  90.72    |
|  242      | -2.927e+0 |  25.0     |  10.0     |  1.0      |  100.0    |
|  243      | -2.861e+0 |  25.0     |  14.41    |  0.8521   |  94.48    |
|  244      | -2.851e+0 |  23.64    |  14.41    |  0.2165   |  90.07    |
|  245      | -2.855e+0 |  24.06    |  14.16    |  0.0      |  90.54    |
|  246      | -2.915e+0 |  23.67    |  13.92    |  0.8395   |  90.12    |
|  247      | -2.836e+0 |  22.8     |  14.65    |  0.3069   |  89.92    |
|  248      | -2.85e+04 |  23.1     |  14.78    |  0.0      |  89.46    |
|  249      | -2.835e+0 |  22.77    |  14.14    |  0.0      |  89.82    |
|  250      | -2.92e+04 |  22.32    |  15.03    |  0.07138  |  89.74    |
|  251      | -2.85e+04 |  23.13    |  14.58    |  0.5024   |  89.17    |
|  252      | -2.836e+0 |  22.73    |  14.18    |  0.5437   |  89.63    |
|  253      | -2.85e+04 |  23.24    |  14.07    |  0.0      |  89.4     |
|  254      | -2.914e+0 |  21.99    |  13.75    |  0.341    |  89.29    |
|  255      | -2.84e+04 |  22.8     |  14.36    |  0.4114   |  90.29    |
|  256      | -2.908e+0 |  22.86    |  13.51    |  0.06174  |  90.37    |
|  257      | -2.852e+0 |  23.11    |  14.57    |  0.001069 |  88.48    |
|  258      | -2.853e+0 |  23.87    |  14.3     |  0.0      |  88.17    |
|  259      | -2.918e+0 |  23.23    |  13.78    |  0.0      |  87.93    |
|  260      | -2.853e+0 |  23.8     |  14.97    |  0.0      |  88.56    |
|  261      | -2.852e+0 |  23.84    |  14.8     |  0.7077   |  88.22    |
|  262      | -2.933e+0 |  24.01    |  15.45    |  0.2949   |  87.59    |
|  263      | -2.849e+0 |  23.52    |  14.67    |  0.1701   |  89.08    |
|  264      | -2.858e+0 |  24.83    |  14.17    |  0.3443   |  88.34    |
|  265      | -2.857e+0 |  24.37    |  14.5     |  0.898    |  88.49    |
|  266      | -2.909e+0 |  24.65    |  13.69    |  0.3106   |  87.35    |
|  267      | -2.841e+0 |  22.86    |  14.78    |  0.9396   |  88.5     |
|  268      | -2.852e+0 |  23.24    |  14.61    |  0.8546   |  88.18    |
|  269      | -2.841e+0 |  22.77    |  14.62    |  0.9389   |  90.12    |
|  270      | -2.93e+04 |  23.3     |  15.33    |  0.912    |  88.89    |
|  271      | -2.84e+04 |  22.53    |  14.24    |  0.797    |  88.73    |
|  272      | -2.905e+0 |  21.9     |  14.54    |  0.5857   |  87.91    |
|  273      | -2.852e+0 |  23.74    |  14.29    |  0.86     |  88.47    |
|  274      | -2.837e+0 |  22.28    |  14.62    |  0.9523   |  89.16    |
|  275      | -2.908e+0 |  24.15    |  13.91    |  0.05677  |  88.88    |
|  276      | -2.858e+0 |  24.76    |  14.84    |  0.3275   |  88.16    |
|  277      | -2.836e+0 |  22.96    |  14.25    |  0.4754   |  89.87    |
|  278      | -2.939e+0 |  15.1     |  10.0     |  0.0      |  98.37    |
|  279      | -2.836e+0 |  22.84    |  14.38    |  0.8515   |  89.17    |
|  280      | -2.971e+0 |  10.0     |  17.82    |  0.0      |  80.0     |
|  281      | -2.982e+0 |  10.0     |  10.0     |  1.0      |  89.99    |
|  282      | -2.97e+04 |  13.98    |  10.21    |  0.0337   |  84.75    |
|  283      | -2.849e+0 |  23.02    |  14.42    |  0.0763   |  89.95    |
|  284      | -2.968e+0 |  21.22    |  20.0     |  1.0      |  80.0     |
|  285      | -2.905e+0 |  21.91    |  14.42    |  0.9744   |  90.57    |
|  286      | -2.951e+0 |  21.38    |  12.03    |  1.0      |  80.0     |
|  287      | -2.872e+0 |  25.0     |  16.98    |  0.0      |  83.25    |
|  288      | -2.948e+0 |  24.54    |  17.98    |  0.3718   |  82.82    |
|  289      | -2.909e+0 |  25.0     |  15.89    |  0.0      |  83.67    |
|  290      | -2.971e+0 |  20.52    |  10.0     |  0.0      |  88.21    |
|  291      | -2.938e+0 |  10.0     |  14.77    |  1.0      |  89.34    |
|  292      | -2.934e+0 |  10.13    |  14.54    |  0.3669   |  95.81    |
|  293      | -2.976e+0 |  19.17    |  15.27    |  0.0      |  94.48    |
|  294      | -2.965e+0 |  25.0     |  12.26    |  0.0      |  83.29    |
|  295      | -2.888e+0 |  24.84    |  19.87    |  0.8937   |  90.86    |
|  296      | -2.961e+0 |  13.87    |  10.0     |  1.0      |  94.86    |
|  297      | -2.895e+0 |  22.89    |  19.95    |  0.6566   |  91.44    |
|  298      | -2.975e+0 |  10.13    |  13.87    |  0.9502   |  81.74    |
|  299      | -2.946e+0 |  16.58    |  15.55    |  0.01365  |  99.89    |
|  300      | -2.888e+0 |  24.79    |  19.88    |  0.8136   |  88.76    |
=========================================================================

 
 best params:  {'max_depth': 22.76987255830374, 'max_features': 14.139404019924546, 'min_impurity_decrease': 0.0, 'n_estimators': 89.82134842869006} 
 
 best cvscore:  -28346.672687223065
It takes 2.107581957181295 minutes

 
 validation_score:  -28346.672687223065


import hyperopt
from hyperopt import hp, fmin, tpe, Trials, partial
from hyperopt.early_stop import no_progress_loss # 用于控制提前停止


print(hyperopt.__version__)

0.2.7


# 大概参数长这种样子
#params = {'参数名称':参数范围}


def hyperopt_objective(params):
    
    # 定义评估器
    # 需要搜索的参数需要从输入的字典中索引出来
    # 不需要搜索的参数，可以是设置好的某个值
    # 在需要整数的参数前调整参数类型
    reg = RFR(n_estimators = int(params["n_estimators"])
              ,max_depth = int(params["max_depth"])
              ,max_features = int(params["max_features"])
              ,min_impurity_decrease = params["min_impurity_decrease"]
              ,random_state=1412
              ,verbose=False
              ,n_jobs=-1)
    
    # 交叉验证结果，输出负根均方误差（-RMSE）
    cv = KFold(n_splits=5,shuffle=True,random_state=1412)
    validation_loss = cross_validate(reg,X,y
                                     ,scoring="neg_root_mean_squared_error"
                                     ,cv=cv
                                     ,verbose=False
                                     ,n_jobs=-1
                                     ,error_score='raise'
                                    )
    
    # 最终输出结果；由于hyperopt只支持取最小值，所以必须对（-RMSE）求绝对值
    # 以求解最小RMSE所对应的参数组合
    return np.mean(abs(validation_loss["test_score"]))


param_grid_simple = {'n_estimators': hp.quniform("n_estimators",80,100,1)
                     , 'max_depth': hp.quniform("max_depth",10,25,1)
                     , "max_features": hp.quniform("max_features",10,20,1)
                     , "min_impurity_decrease":hp.quniform("min_impurity_decrease",0,5,1)
                    }


len([*range(80,100,1)])*len([*range(10,25,1)])*len([*range(10,20,1)])*len([range(0,5,1)])

3000


def param_hyperopt(max_evals=100):
    
    # 保存迭代过程
    trials = Trials()
    
    # 设置提前停止
    early_stop_fn = no_progress_loss(100)              # 当连续100次迭代，损失函数值都没有下降就停止吧，一般我们不会设置这么大，当数据量小的时候可以设置的小一些，多给一些机会。
    
    # 定义代理模型，注释掉代表使用代理模型参数默认值，一般来说我们也不调整代理模型
    #algo = partial(tpe.suggest, n_startup_jobs=20, n_EI_candidates=50)
    params_best = fmin(hyperopt_objective              # 目标函数
                       , space = param_grid_simple     # 参数空间
                       , algo = tpe.suggest            # 代理模型你要哪个呢？
                       #, algo = algo
                       , max_evals = max_evals         # 允许的迭代次数
                       , verbose=True                  # 打印优化流程
                       , trials = trials               # 保存迭代过程
                       , early_stop_fn = early_stop_fn # 控制提前停止
                      )
    
    # 打印最优参数，fmin会自动打印最佳分数
    print("\n","\n","best params: ", params_best,
          "\n")
    return params_best, trials


def hyperopt_validation(params):    
    reg = RFR(n_estimators = int(params["n_estimators"])
              ,max_depth = int(params["max_depth"])
              ,max_features = int(params["max_features"])
              ,min_impurity_decrease = params["min_impurity_decrease"]
              ,random_state=1412
              ,verbose=False
              ,n_jobs=-1
             )
    cv = KFold(n_splits=5,shuffle=True,random_state=1412)
    validation_loss = cross_validate(reg,X,y
                                     ,scoring="neg_root_mean_squared_error"
                                     ,cv=cv
                                     ,verbose=False
                                     ,n_jobs=-1
                                    )
    return np.mean(abs(validation_loss["test_score"]))


params_best, trials = param_hyperopt(30) # 迭代30次，即1%的空间大小

100%|████████████████████████████████████████████████| 30/30 [01:26<00:00,  2.90s/trial, best loss: 28547.282757540164]

 
 best params:  {'max_depth': 15.0, 'max_features': 18.0, 'min_impurity_decrease': 5.0, 'n_estimators': 80.0}


params_best, trials = param_hyperopt(100) # 3%的空间大小

100%|███████████████████████████████████████████████| 100/100 [00:21<00:00,  4.71trial/s, best loss: 28450.06487530331]

 
 best params:  {'max_depth': 22.0, 'max_features': 14.0, 'min_impurity_decrease': 0.0, 'n_estimators': 94.0}


params_best, trials = param_hyperopt(300) # 10%的空间大小

 92%|██████████████████████████████████████████▍   | 277/300 [01:01<00:05,  4.52trial/s, best loss: 28346.672687223065]

 
 best params:  {'max_depth': 22.0, 'max_features': 14.0, 'min_impurity_decrease': 0.0, 'n_estimators': 89.0}


hyperopt_validation(params_best)

28346.672687223065


# 打印所有搜索相关的记录
trials.trials[0]

{'state': 2,
 'tid': 0,
 'spec': None,
 'result': {'loss': 28766.452192638408, 'status': 'ok'},
 'misc': {'tid': 0,
  'cmd': ('domain_attachment', 'FMinIter_Domain'),
  'workdir': None,
  'idxs': {'max_depth': [0],
   'max_features': [0],
   'min_impurity_decrease': [0],
   'n_estimators': [0]},
  'vals': {'max_depth': [13.0],
   'max_features': [18.0],
   'min_impurity_decrease': [4.0],
   'n_estimators': [80.0]}},
 'exp_key': None,
 'owner': None,
 'version': 0,
 'book_time': datetime.datetime(2021, 12, 24, 13, 33, 19, 633000),
 'refresh_time': datetime.datetime(2021, 12, 24, 13, 33, 19, 840000)}


# 打印全部搜索的目标函数值
trials.losses()[:10]

[28766.452192638408,
 29762.22885008687,
 29233.57333898302,
 29257.33343872428,
 29180.63733732971,
 29249.676793746046,
 29309.41793204717,
 28915.33638544984,
 29122.269575607537,
 29150.39720576636]


import optuna


print(optuna.__version__)

2.10.0


def optuna_objective(trial):  # 只能输入trial这一个参数，trial表示一次尝试，不由我们定义，由Optuna自己决定，本质是个对象
    
    # 定义参数空间
    n_estimators = trial.suggest_int("n_estimators",80,100,1)                           # 整数型，(参数名称，下界，上界，步长)
    max_depth = trial.suggest_int("max_depth",10,25,1)
    max_features = trial.suggest_int("max_features",10,20,1)
    #max_features = trial.suggest_categorical("max_features",["log2","sqrt","auto"])    # 字符型
    min_impurity_decrease = trial.suggest_int("min_impurity_decrease",0,5,1)
    #min_impurity_decrease = trial.suggest_float("min_impurity_decrease",0,5,log=False) # 浮点型
    
    # 定义评估器
    # 需要优化的参数由上述参数空间决定
    # 不需要优化的参数则直接填写具体值
    reg = RFR(n_estimators = n_estimators
              ,max_depth = max_depth
              ,max_features = max_features
              ,min_impurity_decrease = min_impurity_decrease
              ,random_state=1412
              ,verbose=False
              ,n_jobs=-1
             )
    
    # 交叉验证过程，输出负均方根误差(-RMSE)
    # optuna同时支持最大化和最小化，因此如果输出-RMSE，则选择最大化
    # 如果选择输出RMSE，则选择最小化
    cv = KFold(n_splits=5,shuffle=True,random_state=1412)
    validation_loss = cross_validate(reg,X,y
                                     ,scoring="neg_root_mean_squared_error"
                                     ,cv=cv                # 交叉验证模式
                                     ,verbose=False        # 是否打印进程
                                     ,n_jobs=-1            # 线程数
                                     ,error_score='raise'
                                    )
    # 最终输出RMSE
    return np.mean(abs(validation_loss["test_score"]))


def optimizer_optuna(n_trials, algo):
    
    # 定义使用TPE或者高斯过程（GP）
    if algo == "TPE":
        algo = optuna.samplers.TPESampler(n_startup_trials = 10, n_ei_candidates = 24) # n_startup_trials：初始观测点个数；n_ei_candidates：期望增量；这里都是默认值
    elif algo == "GP":
        # Optuna没有内置高斯过程类，使用Optuna库的integration模块，有很多与其他模块相结合的工具，例如这里的SkoptSampler
        from optuna.integration import SkoptSampler
        import skopt
        algo = SkoptSampler(skopt_kwargs={'base_estimator':'GP', # 选择高斯过程
                                          'n_initial_points':10, # 初始观测点10个
                                          'acq_func':'EI'}       # 选择的采集函数为期望增量（EI）
                           )
    
    # 实际优化过程，首先实例化优化器
    study = optuna.create_study(sampler = algo         # 要使用的具体算法，sampler表示抽样器
                                , direction="minimize" # 优化的方向，可以填写minimize或maximize确立找最小值还是最大值
                               )
    # 开始优化，n_trials为允许的最大迭代次数
    # 由于参数空间已经在目标函数中定义好，因此这里不需要输入参数空间
    study.optimize(optuna_objective         # 目标函数
                   , n_trials=n_trials      # 最大迭代次数（包括最初的观测值的）
                   , show_progress_bar=True # 是否展示进度条
                  )
    
    # 可直接从优化好的对象study中调用优化的结果
    # 打印最佳参数与最佳损失值
    print("\n","\n","best params: ", study.best_trial.params,
          "\n","\n","best score: ", study.best_trial.values,
          "\n")
    
    return study.best_trial.params, study.best_trial.values


# 屏蔽警告
import warnings
warnings.filterwarnings('ignore', message='The objective has been evaluated at this point before.')


best_params, best_score = optimizer_optuna(10,"GP") #默认打印迭代过程

[I 2021-12-24 22:14:26,709] A new study created in memory with name: no-name-05950945-f6f7-41c3-bd8a-ffb15a284ea9
D:\ProgramData\Anaconda3\lib\site-packages\optuna\progress_bar.py:47: ExperimentalWarning: Progress bar is experimental (supported from v1.2.0). The interface can change in the future.
  self._init_valid()

  0%|          | 0/10 [00:00<?, ?it/s]

[I 2021-12-24 22:14:28,229] Trial 0 finished with value: 28848.70339210933 and parameters: {'n_estimators': 99, 'max_depth': 14, 'max_features': 16, 'min_impurity_decrease': 4}. Best is trial 0 with value: 28848.70339210933.
[I 2021-12-24 22:14:29,309] Trial 1 finished with value: 28632.395126147465 and parameters: {'n_estimators': 90, 'max_depth': 23, 'max_features': 16, 'min_impurity_decrease': 2}. Best is trial 1 with value: 28632.395126147465.
[I 2021-12-24 22:14:30,346] Trial 2 finished with value: 29301.159287113685 and parameters: {'n_estimators': 89, 'max_depth': 17, 'max_features': 12, 'min_impurity_decrease': 0}. Best is trial 1 with value: 28632.395126147465.
[I 2021-12-24 22:14:31,215] Trial 3 finished with value: 29756.446415640086 and parameters: {'n_estimators': 80, 'max_depth': 11, 'max_features': 14, 'min_impurity_decrease': 3}. Best is trial 1 with value: 28632.395126147465.
[I 2021-12-24 22:14:31,439] Trial 4 finished with value: 29784.547574554617 and parameters: {'n_estimators': 88, 'max_depth': 11, 'max_features': 15, 'min_impurity_decrease': 2}. Best is trial 1 with value: 28632.395126147465.
[I 2021-12-24 22:14:31,651] Trial 5 finished with value: 28854.291800282757 and parameters: {'n_estimators': 82, 'max_depth': 12, 'max_features': 18, 'min_impurity_decrease': 3}. Best is trial 1 with value: 28632.395126147465.
[I 2021-12-24 22:14:31,853] Trial 6 finished with value: 29268.28890743908 and parameters: {'n_estimators': 80, 'max_depth': 10, 'max_features': 19, 'min_impurity_decrease': 5}. Best is trial 1 with value: 28632.395126147465.
[I 2021-12-24 22:14:32,111] Trial 7 finished with value: 29302.5258321895 and parameters: {'n_estimators': 99, 'max_depth': 16, 'max_features': 14, 'min_impurity_decrease': 3}. Best is trial 1 with value: 28632.395126147465.
[I 2021-12-24 22:14:32,353] Trial 8 finished with value: 29449.903990989755 and parameters: {'n_estimators': 80, 'max_depth': 21, 'max_features': 17, 'min_impurity_decrease': 1}. Best is trial 1 with value: 28632.395126147465.
[I 2021-12-24 22:14:32,737] Trial 9 finished with value: 29168.76064401323 and parameters: {'n_estimators': 97, 'max_depth': 22, 'max_features': 17, 'min_impurity_decrease': 1}. Best is trial 1 with value: 28632.395126147465.

 
 best params:  {'n_estimators': 90, 'max_depth': 23, 'max_features': 16, 'min_impurity_decrease': 2} 
 
 best score:  [28632.395126147465]


optuna.logging.set_verbosity(optuna.logging.ERROR)     # 关闭自动打印的info，只显示进度条
#optuna.logging.set_verbosity(optuna.logging.INFO)
best_params, best_score = optimizer_optuna(300,"TPE")  # 300次迭代，TPE

D:\ProgramData\Anaconda3\lib\site-packages\optuna\progress_bar.py:47: ExperimentalWarning: Progress bar is experimental (supported from v1.2.0). The interface can change in the future.
  self._init_valid()

  0%|          | 0/300 [00:00<?, ?it/s]

 
 best params:  {'n_estimators': 96, 'max_depth': 22, 'max_features': 14, 'min_impurity_decrease': 3} 
 
 best score:  [28457.22400533479]


optuna.logging.set_verbosity(optuna.logging.ERROR)
best_params, best_score = optimizer_optuna(300,"GP")

D:\ProgramData\Anaconda3\lib\site-packages\optuna\progress_bar.py:47: ExperimentalWarning: Progress bar is experimental (supported from v1.2.0). The interface can change in the future.
  self._init_valid()

  0%|          | 0/300 [00:00<?, ?it/s]

 
 best params:  {'n_estimators': 87, 'max_depth': 23, 'max_features': 16, 'min_impurity_decrease': 5} 
 
 best score:  [28541.05837443567]

HPO库	优劣评价	推荐指数
bayes_opt	✅实现基于高斯过程的贝叶斯优化 ✅当参数空间由大量连续型参数构成时 ⛔包含大量离散型参数时避免使用 ⛔算力/时间稀缺时避免使用	⭐⭐
hyperopt	✅实现基于TPE的贝叶斯优化 ✅支持各类提效工具 ✅进度条清晰，展示美观，较少怪异警告或报错 ✅可推广/拓展至深度学习领域 ⛔不支持基于高斯过程的贝叶斯优化 ⛔代码限制多、较为复杂，灵活性较差	⭐⭐⭐⭐
optuna	✅（可能需结合其他库）实现基于各类算法的贝叶斯优化 ✅代码最简洁，同时具备一定的灵活性 ✅可推广/拓展至深度学习领域 ⛔非关键性功能维护不佳，有怪异警告与报错	⭐⭐⭐⭐

超参数优化方法（HPO）	默认参数	网格搜索	随机搜索	随机搜索 (大空间)	随机搜索 (连续型)
搜索空间/全域空间	-	1536/1536	800/1536	1536/3000	1536/无限
运行时间（分钟）	-	6.36	2.83(↓)	3.86(↓)	3.92
搜索最优（RMSE）	30571.266	29179.698	29251.284	29012.905(↓)	29148.381
重建最优（RMSE）	-	28572.070	28639.969(↑)	28346.673(↓)	28495.682

超参数优化方法（HPO）	默认参数	网格搜索	随机搜索	随机搜索 (大空间)	随机搜索 (连续型)	贝叶斯优化 (基于GP)
搜索空间/全域空间	-	1536/1536	800/1536	1536/3000	1536/无限	300/无限
运行时间（分钟）	-	6.36	2.83(↓)	3.86(↓)	3.92	2.11(↓)
搜索最优（RMSE）	30571.266	29179.698	29251.284	29012.905(↓)	29148.381	28346.673(↓)
重建最优（RMSE）	-	28572.070	28639.969(↑)	28346.673(↓)	28495.682	28346.673(↓)

HPO方法	默认参数	网格搜索	随机搜索	随机搜索 (大空间)	随机搜索 (连续型)	贝叶斯优化 (基于GP)	贝叶斯优化 (基于TPE)
搜索空间/全域空间	-	1536/1536	800/1536	1536/3000	1536/无限	300/无限	277/3000
运行时间（分钟）	-	6.36	2.83(↓)	3.86(↓)	3.92	2.11(↓)	1.00(↓)
搜索最优（RMSE）	30571.266	29179.698	29251.284	29012.905(↓)	29148.381	28346.673(↓)	28346.673(-)
重建最优（RMSE）	-	28572.070	28639.969(↑)	28346.673(↓)	28495.682	28346.673(-)	28346.673(-)

超参数优化 - 贝叶斯优化方法¶

一贝叶斯优化基础方法¶

1 贝叶斯优化的基本流程¶

2 贝叶斯优化用于超参数优化（HPO）¶

二贝叶斯优化的实现¶

1 基于Bayes_opt实现GP优化¶

2 基于HyperOpt实现TPE优化¶

3 基于Optuna实现多种贝叶斯优化¶

	Id	住宅类型	住宅区域	街道接触面积(英尺)	住宅面积	街道路面状况	住宅形状(大概)	住宅现状	...	销售月份	销售年份	销售类型	销售状态
0	0.0	5.0	3.0	36.0	327.0	1.0	3.0	3.0	...	1.0	2.0	8.0	4.0
1	1.0	0.0	3.0	51.0	498.0	1.0	3.0	3.0	...	4.0	1.0	8.0	4.0
2	2.0	5.0	3.0	39.0	702.0	1.0	0.0	3.0	...	8.0	2.0	8.0	4.0
3	3.0	6.0	3.0	31.0	489.0	1.0	0.0	3.0	...	1.0	0.0	8.0	0.0
4	4.0	5.0	3.0	55.0	925.0	1.0	0.0	3.0	...	11.0	2.0	8.0	4.0

超参数优化 - 贝叶斯优化方法¶

一 贝叶斯优化基础方法¶

1 贝叶斯优化的基本流程¶

2 贝叶斯优化用于超参数优化（HPO）¶

二 贝叶斯优化的实现¶

1 基于Bayes_opt实现GP优化¶

2 基于HyperOpt实现TPE优化¶

3 基于Optuna实现多种贝叶斯优化¶

一贝叶斯优化基础方法¶

二贝叶斯优化的实现¶