数据分析师越来越火了,小伙伴们想要在众多求职者中脱颖而出,就要多看相关书籍并不断总结从而提升自己的竞争能力。可是数据分析相关书籍那么多,如果全部看一遍,估计不吃不喝也得好多年吧……为此宠粉的小编特地找了大佬们推荐的书籍,终!于!整理出了这份数据分析师必备的书籍清单。赶快收藏啦~
本次书单推荐包含「入门篇」、「进阶篇」、「高阶篇」,适用于不同层次的学习者。请大家对号入座,收好适合自己的修炼秘籍吧~
1.《谁说菜鸟不会数据分析》
推荐理由:基于通用的Excel工具,在8个章节中,分别讲解数据分析必知必会的知识、数据处理技巧、数据展现的技术、通过专业化的视角来提升图表之美、数据分析报告的撰写技能以及持续的修炼。读者完全可以把这本书当小说来阅读,跟随主人公小白,在Mr.林的指点下轻松掌握数据分析的技能,提升职场竞争能力。
2.《深入浅出数据分析》
推荐理由:数据分析入门第一本。通俗简单,却能够让读者对数据分析的相关概念有大致的了解,诠释了数据分析的基本步骤,实验方法,最优化方法/假设检验法/贝叶斯统计法/等等方法论,还有数据整理技巧,这个太重要了,为读者搭建了走向深入研究的桥梁。
3.《深入浅出统计学》
推荐理由:号称“文科生也能看懂”的统计书。尽管阅读容易,但所讲的知识在数据分析中都是常见且必须掌握的,比如基本的统计量,基本上每个分析项目中都会用到;比如基本的概率分布,总体与样本的概念、置信区间、假设检验、回归分析,都是关于数据分析的统计学知识。
4.《赤裸裸的统计学》
推荐理由:作者年轻时是个追求学习意义的学霸,后来自己从统计学中发掘了很多可以应用到生活的地方。这也是本书的主旨,结合生活讲解统计知识,生动有趣。可以避免统计学一上来就大讲贝叶斯概率和随机分析的枯燥。
1.《EXCEL数据处理与分析实战技巧精粹》
推荐理由:详尽的实例,精彩的讲解,细致的描述,多角度的剖析,融汇Excel Home万千问题与答案,彰显Excel丰富内涵。相信本书是你爱不释手、轻松办公的利器。
2.《Excel VBA从入门到精通》
推荐理由:本书分为五篇,其中第一篇是VBA基础知识篇,主要内容包括VBA的概念、宏和VBA开发环境;第二篇是VBA基础语法篇,主要内容包括VBA语法基础、VBA基础语句、程序结构控制语句、过程、Sub与Function过程;第三篇是Excel VBA对象篇,主要内容包括Excel VBA对象模型和应用程序对象、工作簿对象、工作表对象、单元格对象和图表对象;第四篇是VBA高级应用篇,主要内容包括自定义Excel 2010的用户界面、工作表控件、界面设计、XML与VBA、加载宏和数据库编程等;第五篇是综合实例与面试问答篇,主要讲解了成绩管理系统和日程安排表两个综合实例,并提供了30多个近几年各大公司经常考察的面试题。
1.《R语言实战(第2版)》
推荐理由:本书从解决实际问题入手,尽量跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。第2版新增6章内容,涵盖时间序列、聚类分析、分类、高级编程、创建包和创建动态报告等,并分别详细介绍了如何使用ggplot2和lattice进行高级绘图。通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。
2.《统计建模与R软件》
推荐理由:书中结合数理统计问题对R软件进行科学、准确和全面的介绍,以便使读者能深刻理解该软件的精髓和灵活、高效的使用技巧.此外,还介绍了在工程技术、经济管理、社会生活等各方面的丰富的统计问题及其统计建模方法,通过该软件将所建模型进行求解,使读者获得从实际问题建模入手,到利用软件进行求解,以及对计算结果进行分析的全面训练。
1.《利用Python进行数据分析(原书第2版)》
推荐理由:本书由Python pandas项目创始人Wes McKinney亲笔撰写,详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。第2版针对Python 3.6进行全面修订和更新,涵盖新版的pandas、NumPy、IPython和Jupyter,并增加大量实际案例,可以帮助你高效解决一系列数据分析问题。
2.《Python数据分析从入门到精通》
推荐理由:对于希望使用Python来完成数据分析工作的人来说,学习IPython、Numpy、pandas、Matplotlib这个组合是目前看来不错的方向,本书就是这样一本循序渐进的书。内容精练、重点突出、实例丰富,是广大数据分析工作者必备的参考书,为读者能真正使用Python进行数据分析奠定基础。
3.《Python数据挖掘:概念、方法与实践》
推荐理由:本书使用Python编程语言和基于项目的方法介绍多种常被忽视的数据挖掘概念,如关联规则、实体匹配、网络分析、文本挖掘和异常检测。每个章节都全面阐述某种特定数据挖掘技术的基础知识,提供替代方案以评估其有效性,并用真实的数据实现该技术,帮助你“知其然,知其所以然”,从而迈向数据挖掘专家的道路。
1.《SPSS统计分析基础教程》
推荐理由:本书改变了以往SPSS书籍对统计理论和软件操作“两条主线、各自表述”的编写方式,将这两者完全融合了起来。它以SPSS 12.0为准,针对统计初学者和SPSS初级用户的需求,以统计理论为主线,详细介绍了在SPSS中的界面操作、数据管理、统计图表制作、统计描述和常用单因素统计分析方法的原理与实际操作。其内容完全覆盖目前国内大部分专业本科统计课程的教学范围,并结合SPSS的强大功能作了很好的扩展。全书内容深入浅出,风格简洁明快,是一本难得的统计理论与SPSS操作相结合的统计参考书。
2.《Discovering statistics using spas》
推荐理由:国外的一些入门书籍很容易上手, 在学术论坛和知乎等页面都有网友推荐这本书。国外图书价格偏贵,但是据说某宝的PDF版很便宜。
3.《问卷统计分析实务: SPSS操作与应用》
推荐理由:本书的内容架构,在于完整介绍问卷调查法中的数据处理与其统计分析流程,统计分析技术以SPSS统计软件包的操作界面与应用为主,内容除基本统计原理的解析外,着重的是SPSS统计软件包在量化研究上的应用。
1.《The little SAS book》
推荐理由:内容不深,但是全面、实用,很经典的一本书,适合初学者看。英文版读得太累可以搜一下中文版。
2.《SAS统计分析应用》
推荐理由:本书基于SAS 9.1.3中文版本编写,介绍了SAS Learning Edition基于窗口点击式环境以及Base SAS、SAS\STAT的用法。全书以统计分析方法为主线,通过大量实例,详细介绍了SAS程序设计方法及各种统计过程适用条件和使用方法,并对统计过程实例的输出结果做了详尽的解释。
3.《SAS统计分析与数据挖掘》
推荐理由:从SAS编程出发,用案例形式介绍SAS数据挖掘在各领域的广泛应用,全书分为SAS基础篇、提高篇及应用篇,每章均给出大量分析案例。
1.《SQL必知必会》
推荐理由:本书是深受世界各地读者欢迎的SQL经典畅销书,内容丰富,文字简洁明快,针对Oracle、SQL Server、MySQL、DB2、PostgreSQL、SQLite等各种主流数据库提供了大量简明的实例。与其他同类图书不同,它没有过多阐述数据库基础理论,而是专门针对一线软件开发人员,直接从SQL SELECT开始,讲述实际工作环境中最常用和最必需的SQL知识,实用性极强。通过本书,读者能够从没有多少SQL经验的新手,迅速编写出世界级的SQL!
2. 《SQL基础教程》
推荐理由:本书介绍了关系数据库以及用来操作关系数据库的SQL语言的使用方法,提供了大量的示例程序和详实的操作步骤说明,读者可以亲自动手解决具体问题,循序渐进地掌握SQL的基础知识和技巧,切实提高自身的编程能力。在每章结尾备有习题,用来检验读者对该章内容的理解程度。另外本书还将重要知识点总结为“法则”,方便大家随时查阅。
3.《高可用MySQL:构建健壮的数据中心》
推荐理由:本书是“MySQL High Availability”的中文翻译版,主要讲解真实环境下如何使用MySQL的复制、集群和监控特性,揭示MySQL可靠性和高可用性的方方面面。本书由MySQL开发团队亲自执笔,定位于解决MySQL数据库的常见应用瓶颈,在保持MySQL的持续可用性的前提下,挖潜各种提高性能的解决方案。
1.《数据挖掘导论(完整版)》
推荐理由:本书全面介绍了数据挖掘,涵盖了五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章。前一章涵盖基本概念、代表性算法和评估技术,而后一章讨论高级概念和算法。这样读者在透彻地理解数据挖掘的基础的同时,还能够了解更多重要的高级主题。
2.《数据挖掘概念与技术(原书第3版)》
推荐理由:本书完整全面地讲述数据挖掘的概念、方法、技术和最新研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。
3.《大数据:互联网大规模数据挖掘与分布式处理(第2版)》
推荐理由:畅销书全新升级,新增影响与同质性、社交媒体推荐和行为分析等超实用内容,涵盖解决数据挖掘核心问题所用算法,及实际应用数据挖掘所需知识,理论与实现并重。斯坦福大学数据挖掘方向专家Jure Leskovec、Anand Rajaraman、Jeffrey David Ullman重磅力作。
1.《数据可视化之美》
推荐理由:在本书中,20多位可视化专家包括艺术家、设计师、评论家、科学家、分析师、统计学家等,展示了他们如何在各自的学科领域内开展项目。他们共同展示了可视化所能实现的功能以及如何使用它来改变世界。成功的可视化的美丽之处既在于其艺术设计,也在于其通过对细节的优雅展示,能够有效地产生对数据的洞察和新的理解。
2.《用数据讲故事》
推荐理由:本书通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。具体内容包括:如何充分理解上下文,如何选择合适的图表,如何消除杂乱,如何聚焦受众的视线,如何像设计师一样思考,以及如何用数据讲故事。本书得到了国内数据分析大咖秋叶、范冰、邓凯的推荐。
3.《ggplot2:数据分析与图形艺术》
推荐理由:ggplot2 是最优秀的数据分析可视化工具之一,这本书系统地讲解了 ggplot2 的基本原理和具体操作,书中有大量的例子,也可以下载源代码。更建议直接学习英文版的教材(如果英文过关的话)。
《麦肯锡教我的写作武器》
推荐理由:本书分为基础篇和实践篇两部分,结合实际案例,系统地介绍了运用逻辑思考,制作一份兼具逻辑力与明确表达力的精彩商务文案所需的诸多方法,如金字塔原理、MECE原则、分辨问题类型的高杉法、SCQOR故事展开法以及具体制作报告与简报的方法等,让你学会逻辑思考方法、提高写作能力的实用工具书。
1.《精益数据分析》
推荐理由:此书优势在于将企业分成了几个大的行业类别,并分门别类的讲解了每个行业的商业模式特点及分析技巧,对使用者的分析能力要求较高,且必须具备相应的业务知识。书中并没有讲到具体的数据分析技术,主要分析了各种产品中用到的指标、模型和“数据驱动型产品”的一些思路。
2.《数学之美》
推荐理由:本书把高深的数学原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。读者通过具体的例子学到的是思考问题的方式 —— 如何化繁为简,如何用数学去解决工程问题,如何跳出固有思维不断去思考创新。
3.《集体智慧编程》
推荐理由:本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
4.《机器学习》
推荐理由:展示了机器学习中核心的算法和理论,并阐明了算法的运行过程。本书综合了许多的研究成果,例如统计学、人工智能、哲学、信息论、生物学、认知科学、计算复杂性和控制论等,并以此来理解问题的背景、算法和其中的隐含假定。
5.《R数据分析——方法与案例详解(双色)》
推荐理由:R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。
6.《Python高级数据分析:机器学习、深度学习和NLP实例》
推荐理由:本书介绍了基于Python的高级数据分析,探讨了Neo4j、Elasticsearch和MongoDB等数据库,讨论了如何实现包括主题爬取在内的ETL技术,并用于高频算法交易和目标导向的对话系统等领域;还介绍了一些机器学习概念(如半监督学习、深度学习和NLP)的例子;同时涵盖了重要的传统数据分析技术,如时间序列和主成分分析等。