机器学习算法竞赛实战

王贺

出版时间

2021-09-12

ISBN

9787115569592

评分

★★★★★
书籍介绍

本书是算法竞赛领域一本系统介绍竞赛的图书,书中不仅包含竞赛的基本理论知识,还结合多个方向和案例详细阐述了竞赛中的上分思路和技巧。全书分为五部分:第一部分以算法竞赛的通用流程为主,介绍竞赛中各个部分的核心内容和具体工作;第二部分介绍了用户画像相关的问题;第三部分以时间序列预测问题为主,先讲述这类问题的常见解题思路和技巧,然后分析天池平台的全球城市计算AI 挑战赛和 Kaggle 平台的Corporación Favorita Grocery Sales Forecasting;第四部分主要介绍计算广告的核心技术和业务,包括广告召回、广告排序和广告竞价,其中两个实战案例是2018 腾讯广告算法大赛——相似人群拓展和Kaggle 平台的TalkingData AdTracking Fraud Detection Challenge;第五部分基于自然语言处理相关的内容进行讲解,其中实战案例是Kaggle 平台上的经典竞赛Quora Question Pairs。

本书适合从事机器学习、数据挖掘和人工智能相关算法岗位的人阅读。

王贺(鱼遇雨欲语与余)

现任职于小米商业算法部,从事应用商店广告推荐的研究和开发。从 2018 年至 2020 年多次参加国内外算法竞赛,共获得 5 次冠军和 5 次亚军,是 2019 年和 2020 年腾讯广告算法大赛的冠军。毕业于武汉大学计算机学院,硕士学位,研究方向为图数据挖掘。

刘鹏

华为技术有限公司算法工程师,从事电信运营商和智能运维领域的算法研究和开发工作。2016 年本科毕业于武汉大学数学基地班,保研至中国科学技术大学自动化系,硕士期间研究方向为复杂网络与机器学习,2018 年起多次获得机器学习相关竞赛奖项。

钱乾

数程科技大数据技术负责人,工作方向为物流领域的智能算法应用。本科就读于美国佐治亚理工大学,研究方向包括机器学习、深度学习、自然语言处理等。

作者简介
王贺(鱼遇雨欲语与余) 现任职于小米商业算法部,从事应用商店广告推荐的研究和开发。从 2018 年至 2020 年多次参加国内外算法竞赛,共获得 5 次冠军和 5 次亚军,是 2019 年和 2020 年腾讯广告算法大赛的冠军。毕业于武汉大学计算机学院,硕士学位,研究方向为图数据挖掘。 刘鹏 华为技术有限公司算法工程师,从事电信运营商和智能运维领域的算法研究和开发工作。2016 年本科毕业于武汉大学数学基地班,保研至中国科学技术大学自动化系,硕士期间研究方向为复杂网络与机器学习,2018 年起多次获得机器学习相关竞赛奖项。 钱乾 数程科技大数据技术负责人,工作方向为物流领域的智能算法应用。本科就读于美国佐治亚理工大学,研究方向包括机器学习、深度学习、自然语言处理等。
目录
前言
第一部分 磨刀事半,砍柴功倍
第 1 章 初见竞赛
第 2 章 问题建模
第 3 章 数据探索

显示全部
用户评论
本书是算法竞赛领域系统介绍竞赛的入门书,不仅包含竞赛的基本理论知识,还结合多个方向和案例详细阐述了竞赛中的上分思路和技巧。 作者站在初学者(比如说我)的视角,介绍竞赛知识理论以及案例实践。机器学习单纯会理论,无法应用,还是纸上谈兵。通过此书入门竞赛还是不错的。读完后追评!
复制粘贴的好书,代码都是一坨一坨的。仿佛让读者读得越难受,才能展现出作者的水平。
小白入门好书,新手友好度极好,前面内容实在详尽,后面实战仔细,让小白能了解入门很多详尽的知识,还能略窥竞赛窍门,至于代码等等还是要去开源社区多看多练,Coggle公众号也做的很好,日日更新,日日新,知识海里的舟。总之小白必备入门级。
国内第一本机器学习竞赛书,讲得很清楚,很好!
全书分为五部分: 第一部分是总览的形式,带领读者理解数据竞赛的各个环节,通用化流程:问题建模,数据探索,特征工程,模型训练,模型融合。 第二部分:介绍了人物画像的一些概念。结合一个kaggle的一个案例进行通用流程的讲解。 第三部分:时间序列,结合了两个比赛案例进行讲解。 第四部分:计算广告,用了两个比赛的案例进行梳理。 第五部分:是自然语言处理部分,用了一个比赛案例。 个人还是比较推荐入手跟着节奏一步一步来一遍,让自己熟悉比赛的流程。通过比赛来拓宽自己的技术栈。在通过比赛认识一些人,看看别人是怎么做的,自己哪里还可以在提高。不断让自己迭代学习。
属于是抄代码都抄不明白。一到关键部分就嫌麻烦不写代码——“要啥啥没有”,一眼网上扒出来的。除了前几章稍微能看其余都不如看文档。
前面挺好的,后面具体的比赛案例有些欠缺,感觉不如少写几个比赛,但写的更精,更透彻些
收藏