。 无论是想要转码还是深入更高阶的领域,kaggle数据竞赛都是最优的选择。协助提升技能和知识水平、与其他人交流分享经验、获取奖金和荣誉等。 Kaggle竞赛主要分为A类赛和B类赛 。A类赛主要适合用传统的机器学习算法做,偏向与文本数据处理,列如房价预测,文本分类等;B类赛则几乎都是用神经深度学习算法做,偏向于图像识别 目标检测等方向,列如基础的猫狗识别、cifar10图像分类、蛋白质识别等。 像我之前在悉大参与过预测类的就有根据房子的特征,预测实际成交价和预测值之间的logerror,这类比赛的流程基本是特征工程→模型选择→调参→模型融合。模型主要用了XGBoost、LightGBM等几种开源框架。 当时我们运行出来RMSE最小的是xgboost模型,但发现只用这个模型还是不够,可以调整不同的参数来获得许多个侧重点不同的lgb模型:不同的深度列如叶子数、不同的损失函数等等,过程是既有乐趣又有挑战性的。 总的来说kaggle上有许多高质量的比赛,还可以跟许多厉害的大神组队,下面的讨论区也有top solution分享,想要增加机器学习,数据挖掘实战经验的话,来一场kaggle比赛绝对是一个高回报的工作噢
© 版权声明
文章版权归作者所有,未经允许请勿转载。
羡慕 看不懂
Cool