1. 针对不同的问题会有不同的算法,没有哪个算法就是最好的,我们原来用过xgboost调了半天参数,结果用了lasso试了一下,比xgboost效果好;
2.对不同的模型要注意过拟合的问题,树模型要进行交叉验证,千万不要一味的增加深度,只会让模型越来越差;
3.不同的模型训练完后一定要看一下每个特征的权重,会发现不同的算法特征的权重是不一样的,也能找到最重要的几个特征着重处理;
4.当实在没有什么好的方法来提升效果的时候,不如去分析一下badcase,找到差异最大的badcase知道他们为什么会产生这种状况,然后再修改特征;
5.特征才是解决问题的根本,特征决定了算法的上限,好好分析特征,不要在意在这里浪费时间;
6.先写到这,后续有什么问题再补充