Rajiv Tiwari 是一位有着超过 15年经验的自由大数据架构师,他的研究方向包括大数据、数据分析、数据管理、数据架构、数据清洗 /数据整合、数据仓库,以及银行和其他金融组织中的数据智能等。 他毕业于瓦拉纳西印度理工学院( IIT)电子工程专业,在英国工作了 10年有余,大部分时间居住在英国金融城——伦敦。从 2010年起, Rajiv 就开始使用 Hadoop,当时银行部门使用 Hadoop 的还很少。他目前正在帮助 1级投资银行( Tier 1 Investment Bank)在 Hadoop平台上实施一个大型风险分析项目。 如果想联系 Rajiv,则可以通过他的网站 http://www.bigdatacloud.net或推特 @ bigdataoncloud。 我一直认为当作家把自己的书献给他们的妻子、合作伙伴或孩子时有点俗气,但是近几个月来,让我明白了为什么一个家庭的支持对写一本书那么重要。 考虑到我目前在投资银行每天工作时间很长,且很难抽出时间来写这本书,所以,我一直在深夜和周末写这本书。我要感谢我的妻子 Seema,她几乎帮我照料一切能分散我写作注意力的东西;还有我的儿子 Rivaan。 审稿人简介 Harshit Bakliwal 是一位印度领先的 IT公司的 Hadoop开发者。他有 6年左右的工作经验和超过 3年的大数据 /Hadoop经验。他从 2010年开始使用 Hadoop,当时 Hadoop 刚刚在科技界崭露头角,并没有太多的在线帮助。从那时起,他继续用自己的方式学习这门语言及其他高水平的语言,如 Pig、 Hive、Sqoop、Oozie和 HBase。现如今他能处理 4~ 5个集群(每个集群大约有 200个节点)上 PB级的数据。 Dr.Daniel Fasel是 Scigility 公司的创始人和 CEO。Scigility公司为瑞士和欧洲其他国家的大规模信息系统和大数据技术提供解决方案。它的专业团队在大数据技术上有超过 7年的极强的学术背景和实际知识经验。 他是瑞士电信(瑞士第一大电信运营商)商业智能团队的第一位数据科学家,并在就职期间实现了 NoSQL技术在瑞士电信公司的探索性分析技术。在注重科学数据和 NoSQL技术之前,他是合同和客户域(瑞士电信数据仓库的核心组件)的商业智能工程师。他还担任商业情报架构师和 Oracle Hyperion Essbase立方体管理员。 他在瑞士福里堡大学( University of Fribourg)获得经济学博士学位。他写了一篇关于模糊数据仓库的文章,让他获得了最高的成绩。除了他的博士研究,他一直担任福里堡大学信息学系的系统工程师和系统管理员团队的领导。2009年(当时大数据还不是一个流行词),他安装和维护了分布式计算集群和 NoSQL技术。他还经常在大数据和数据仓库领域出版英语或德语的书籍与文章。 Mark Reddy 是软件工程师和分布式系统爱好者。他从爱尔兰的高威梅奥理工学院( Galway-Mayo Institute of Technology)荣誉毕业后,曾在 Hewlett-Packard 和 Avaeon Solutions公司任职。他目前在 Boxever工作,这是一家专 注于旅游行业大数据和预测分析的爱尔兰初创企业。他使用 Hadoop、Spark、 Cassandra、ZooKeeper、Storm、Kafka等工具设计并实现了大规模分布式的解决方案,这些系统处理的数据达 TB级。他喜欢利用他的知识和经验为开源项目做贡献,并对行业热点话题进行公开演讲。 当他不写代码的时候,他喜欢公开演讲或写博客( http://markreddy.ie/),他也喜欢旅游、健身,以及发推特随想 @ markreddy。