数据科学与大数据技术入门书籍

建站技术 Nix 2年前 (2022-10-16) 187次浏览

文章摘要:数据科学与大数据技术入门书籍

学习大数据需要用到的书籍有《Effective Java》《BigData》《Hive编程指南》《Spark快 […]

学习大数据需要用到的书籍有《Effective Java》《BigData》《Hive编程指南》《Spark快速大数据分析》等。如果想具体了解大数据入门书籍,那不妨接着往下看吧!

1.第一阶段主要学习大数据基础,主要是关于Java基础的学习,包括Java语言基础、HTML、CSS与JavaScript以及Web和数据库相关的知识。

推荐书籍:

《Effective Java》,这本书推荐给零基础或基础差的小伙伴读,针对初学Java可能遇到的编程问题,这本书都提供了有效、实用的解决方案,以及对于Java平台精妙之处的独到见解和优秀的代码范例。

2.第二阶段主要学习Linux和Hadoop生态系统,需要逐步学习和掌握Linux体系、Hadoop离线计算大纲、分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架等。

推荐书籍:

《Big Data》,在大数据的背景下,这本书提供了对数据建模、数据层、数据处理需求分析、数据架构和存储实现问题的见解。

《Hive编程指南》是一本ApacheHive的编程指南,对Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合做了详细的介绍。

3. 第三阶段学习分布式计算框架,特别是Spark计算引擎的相关知识,要做到全面掌握。

推荐书籍:

《Spark快速大数据分析》,这本书全面介绍了Spark的使用、核心概念和基本原则,不过多深入实现细节,主要关注上层用户的具体用法,适合初学者入门。

《Spark机器学习:核心技术与实践》,本文通过理论结合大量实例,对Spark数据分析、机器学习算法实现及其在各个企业级系统中的应用进行了较为全面的介绍,重点介绍了Spark的应用。


声明:
若非注明,本站文章源于互联网收集整理和网友分享发布,如有侵权,请联系站长处理。
文章名称:数据科学与大数据技术入门书籍
文章链接:http://www.7966.org/post/23220.html
转载请注明出处

喜欢 (0)