会员
自己动手做大数据系统(第2版)
刘未昕等更新时间:2020-07-24 10:15:45
最新章节:13.4 小结开会员,本书免费读 >
在第一版的基础上,根据近几年大数据领域最新出现的各种流行组件,逐个进行介绍,并以两个具体的示例,贯穿各个章节,对组件之间的协同工作关系进行剖析。新增大数据平台架构选型及最佳实践案例,大数据治理,流计算开发,flink等流式大数据处理。基于docker的大数据运维部署等部分,书中所使用的示例程序,是基于笔者在进行企业培训时,企业提出的业务需求而展开,示例程序更有代表性。
上架时间:2020-04-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
自己动手做大数据系统(第2版)最新章节
查看全部- 13.4 小结
- 13.3 基于容器的大数据系统
- 13.2 基于云平台的容器集群
- 13.1 云平台
- 第13章 搭建基于云平台的容器级数据系统
- 第四部分 云平台搭建
- 第三部分技术点总结
- 12.5 小结
- 12.4 访问日志检索
- 12.3 生成词云图和占比饼图
刘未昕等
主页
同类热门书
最新上架
- 会员
分布式数据库基础与应用
本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书计算机14万字 - 会员
SQL Server从入门到精通(第5版)
《SQLServer从入门到精通(第5版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了SQLServer开发所必需的各方面技术。全书分为4篇共19章,内容包括数据库基础、SQLServer数据库环境搭建、创建与管理数据库、操作数据表、SQL基础、SQL函数的使用、SQL数据查询基础、SQL数据高级查询、视图的使用、存储过程、触发器、游标的使用、索引与数据完整性、SQL中计算机14.1万字 - 会员
数据科学技术:文本分析和知识图谱
数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的计算机21.6万字 - 会员
企业级大数据项目实战:用户搜索行为分析系统从0到1
《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发计算机9万字 - 会员
达梦数据库开发实战
达梦数据库是一款非常优秀的国产数据库。本书从实用角度,通过对达梦数据库的体系结构、运行机制的讲解,以及与其他数据库相似功能的对比,帮助读者掌握达梦数据库的基本操作。本书第1章讲解达梦数据库的安装部署;第2章讲述达梦数据库的体系结构,并与Oracle的体系结构进行对比;第3章讲解数据库中最重要的两部分redo和undo;第4章介绍用户管理,重点讲述用户创建和权限;第5章讲解表和索引,并对普通表和堆表计算机10.7万字 - 会员
数据挖掘竞赛实战:方法与案例
本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案计算机6.7万字 - 会员
算力芯片:高性能CPU/GPU/NPU微架构分析
本书介绍了超级计算机算力和AI算力的异同,从CPU流水线开始,描述主要的众核处理器架构和功能部件设计。在GPU和NPU等加速器部分,介绍了GPU为何能从单纯的图形任务处理器变成通用处理器。GPU在设计逻辑、存储体系、线程管理,以及面向AI的张量处理器方面成为最近几年全世界科技行业最瞩目的明星。本书对华为等厂商推出的NPU芯片设计也做了架构描述,回顾了近20年来主流的CPU、GPU芯片架构的特点,介计算机29.3万字 - 会员
分布式数据库:原理与实践
本书全方位讲解分布式数据库的知识点,由易到难、由浅入深地带领读者在分布式数据领域不断深入。第1章主要介绍分布式数据库的起源与发展,并就分布式数据库的结构模式、作用及特点进行详细讲解。第2章主要对分布式技术、分布式服务架构、云数据库与容器化技术、大数据平台、分布式存储与数据库以及区块链技术进行详细介绍。第3章主要从分布式的基础理论、分布式事务分类以及分布式数据库分类、SequoiaDB数据库展开介绍计算机7.9万字 - 会员
数据质量实践手册:4步构建高质量数据体系
高质量的数据关乎企业运营、合规、决策和业绩的关键,哈佛商业评论的一项研究发现,企业中只有3%的数据符合质量标准,绝大多数公司都在寻求切实可行的指导来提高数据质量。本书作者基于多年在数据、数据分析和人工智能方面的实践经验,阐述了4步构建高质量数据体系。他提出了高质量数据的四阶段DARS方法(定义、评估、实现、持续)和10个数据质量最佳实践案例,以此来提高业务中的数据质量水平,为业务提供数据价值,保证计算机11.7万字
同类书籍最近更新
- 会员
PySpark大数据分析与应用
本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例数据库10.4万字 - 会员
分布式数据库基础与应用
本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书数据库14万字