本书全面阐述了湖仓架构相关知识。首先介绍数据架构及其在构建数据平台中的作用,剖析湖仓架构的概念、特征和优势。接着对比传统架构(数据湖与数据仓库)和现代数据平台,明确湖仓架构在未来数据平台的重要地位。然后讲解行存储与列存储等概念,以及云对象存储、文件格式和表格式等组件,还给出设计存储时的考量因素。接着阐述数据目录、计算引
本书前八章主要介绍人工智能及大数据分析处理相关内容,包括人工智能、深度学习、生成模型、预测、因果推断、系统辨识、大规模预训练模型和强化学习;后四章主要介绍协同优化博弈相关理论方法,具体包括协同优化、大规模整数规划、多目标优化和多智能体博弈。
本书系统阐述了工业控制系统的架构、组成及其面临的信息安全挑战,深入剖析了信息安全的基本概念、风险类型、威胁特点以及防护原则。从网络隔离、访问控制、数据加密、身份认证到应急响应、灾难恢复,本书详细探讨了各个环节的安全策略与技术实现,为读者构建了完整的信息安全防护体系。同时,针对软件安全管理、物理安全与环境保护、安全开发与
本书介绍典型控制系统的性能要求及控制设计的基本方法,并给出相应的仿真与分析。全书共6章,第1~4章从经典控制设计和鲁棒综合控制策略这类可推广至常见的二阶系统的控制设计方法开始,以柔性系统的特性与特殊控制问题为例,向读者展示两种控制方案在类似柔性系统设计中的应用。第5、6章介绍一种非线性控制方案,给出一种高精度要求的空间
随着数据量的爆炸式增长,大数据存储技术在数据科学、人工智能、云计算等领域的重要性日益凸显。大数据不仅为个人生活、企业经营,以及国家与社会的发展带来了机遇,也带来了挑战。本书是一本大数据入门图书,主要介绍了Hive、HBase、Sqoop等内容。本书采用理论与实践相结合的讲解方式,旨在帮助读者摆脱枯燥的理论学习,注重实际
本书以项目实战为核心载体,采用任务驱动教学模式,系统且深入地解析Hadoop生态圈中主流的大数据开发技术。全书精心编排7个项目,从Hadoop的基础理论入门,逐步深入到Hadoop集群环境配置、Hadoop分布式文件系统、MapReduce分布式计算框架,再到MapReduce离线数据处理、基于Hive的离线数据分析,
本书是面向大数据人才培养的高等学校数据科学与大数据技术专业系列教材中的一本,通过把数据思维融入全书各章,并通过Python实现相关案例,使抽象的数据思维具体化,从而加深读者对数据的感性认识,提高读者对数据思维的理解能力。本书首先介绍了大数据相关的概念,然后根据数据处理流程的逻辑顺序,对大数据平台和大数据开发进行了深入介
本书系统地介绍了数据挖掘算法、原理及基于Python的实现方法,将算法原理与案例相结合,帮助读者建立数据挖掘领域的理论基础,提升基本的实践技能。本书共15章,主要包括数据挖掘概述、Python环境的搭建、数据预处理、数据集划分与交叉验证评分、回归、分类、集成学习、参数调优、降维、特征选择与特征联合、流水线、聚类、关联规
本书为大数据分析的入门级双语教材,基于大数据分析应知应会的基本要求,以培养学生三个基本(基本概念、基本认知、基本思维)为中心,采用国外MBA教材的体例和写法,将案例与教材知识点相结合,将专业知识与实践场景相结合。书聚焦大数据分析的基本认知和数据思维的培养,通过大数据分析的基础知识、理论方法、技术工具和实践应用等,帮助读
本书共8个项目,分别讲解Hadoop大数据处理平台、大数据存储技术(HDFS)、大数据离线计算框架(MapReduce&YARN)、大数据数据库(HBase)、大数据数据仓库(Hive)、大数据数据转换(Sqoop)、大数据日志处理(Flume)、大数据实时计算框架(Spark)。