Kafka权威指南
O’Reilly Media, Inc. 介绍
序
第 1 章 初识 Kafka
第 2 章 安装 Kafka
第 3 章 Kafka 生产者——向 Kafka 写入数据
第 4 章 Kafka 消费者——从 Kafka 读取数据
第 5 章 深入 Kafka
第 6 章 可靠的数据传递
第 7 章 构建数据管道
第 8 章 跨集群数据镜像
第 9 章 管理 Kafka
第 10 章 监控 Kafka
第 11 章 流式处理
附录 A 在其他操作系统上安装 Kafka
作者介绍
Flink基础教程
O’Reilly Media, Inc. 介绍
第 1 章 为何选择 Flink
第 2 章 流处理架构
第 3 章 Flink 的用途
第 4 章 对时间的处理
第 5 章 有状态的计算
第 6 章 批处理:一种特殊的流处理
附录 其他资源
关于作者
数据科学实战
O’Reilly Media, Inc.介绍
作者介绍
第 1 章 简介:什么是数据科学
第 2 章 统计推断、探索性数据分析和数据科学工作流程
第 3 章 算法
第 4 章 垃圾邮件过滤器、朴素贝叶斯与数据清理
第 5 章 逻辑回归
第 6 章 时间戳数据与金融建模
第 7 章 从数据到结论
第 8 章 构建面向大量用户的推荐引擎
第 9 章 数据可视化与欺诈侦测
第 10 章 社交网络与数据新闻学
第 11 章 因果关系研究
第 12 章 流行病学
第 13 章 从竞赛中学到的:数据泄漏和模型评价
第 14 章 数据工程:MapReduce、Pregel、Hadoop
第 15 章 听听学生们怎么说
第 16 章 下一代数据科学家、自大狂和职业道德
SQL反模式
版 权 声 明
读 者 感 言
译 者 序 一
译 者 序 二
第一部分 逻辑型数据库设计反模式
第二部分 物理数据库设计反模式
第三部分 查询反模式
第四部分 应用程序开发反模式
第五部分 附录
SQL必知必会(第4版)
第1课 了解SQL
第2课 检索数据
第3课 排序检索数据
第4课 过滤数据
第5课 高级数据过滤
第6课 用通配符进行过滤
第7课 创建计算字段
第8课 使用函数处理数据
第9课 汇总数据
第10课 分组数据
第11课 使用子查询
第12课 联结表
第13课 创建高级联结
第14课 组合查询
第15课 插入数据
第16课 更新和删除数据
第17课 创建和操纵表
第18课 使用视图
第19课 使用存储过程
第20课 管理事务处理
第21课 使用游标
第22课 高级SQL特性
附录A 样例表脚本
附录B 流行的应用程序
附录C SQL语句的语法
附录D SQL数据类型
附录E SQL保留字
常用SQL语句速查
Spark快速大数据分析
O’Reilly Media, Inc. 介绍
推荐序
译者序
序
第 1 章 Spark 数据分析导论
第 2 章 Spark 下载与入门
第 3 章 RDD 编程
第 4 章 键值对操作
第 5 章 数据读取与保存
第 6 章 Spark 编程进阶
第 7 章 在集群上运行 Spark
第 8 章 Spark 调优与调试
第 9 章 Spark SQL
第 10 章 Spark Streaming
第 11 章基于 MLlib 的机器学习
作者简介
数据科学入门
O’Reilly Media, Inc. 介绍
第 1 章 导论
第 2 章 Python 速成
第 3 章 可视化数据
第 4 章 线性代数
第 5 章 统计学
第 6 章 概率
第 7 章 假设与推断
第 8 章 梯度下降
第 9 章 获取数据
第 10 章 数据工作
第 11 章 机器学习
第 12 章 k 近邻法
第 13 章 朴素贝叶斯算法
第 14 章 简单线性回归
第 15 章 多重回归分析
第 16 章 逻辑回归
第 17 章 决策树
第 18 章 神经网络
第 19 章 聚类分析
第 20 章 自然语言处理
第 21 章 网络分析
第 22 章 推荐系统
第 23 章 数据库与 SQL
第 24 章 MapReduce
第 25 章 数据科学前瞻
作者简介
Python数据挖掘入门与实践
译者序
第 1 章 开始数据挖掘之旅
第 2 章 用scikit-learn估计器分类
第 3 章 用决策树预测获胜球队
第 4 章 用亲和性分析方法推荐电影
第 5 章 用转换器抽取特征
第 6 章 使用朴素贝叶斯进行社会媒体挖掘
第 7 章 用图挖掘找到感兴趣的人
第 8 章 用神经网络破解验证码
第 9 章 作者归属问题
第 10 章 新闻语料分类
第 11 章 用深度学习方法为图像中的物体进行分类
第 12 章 大数据处理
附录 接下来的方向
Hadoop安全:大数据平台隐私保护
O’Reilly Media, Inc. 介绍
业界评论
序
目标读者
排版约定
使用代码示例
Safari® Books Online
联系我们
免责声明
电子书
1.1 安全概览
1.1.1 机密性
1.1.2 完整性
1.1.3 可用性
1.1.4 验证、授权和审计
1.2 Hadoop安全:简史
1.3 Hadoop组件和生态系统
1.3.1 Apache HDFS
1.3.2 Apache YARN
1.3.3 Apache MapReduce
1.3.4 Apache Hive
1.3.5 Cloudera Impala
1.3.6 Apache Sentry
1.3.7 Apache HBase
1.3.8 Apache Accumulo
1.3.9 Apache Solr
1.3.10 Apache Oozie
1.3.11 Apache ZooKeeper
1.3.12 Apache Flume
1.3.13 Apache Sqoop
1.3.14 Cloudera Hue
1.4 小结
第一部分 安全架构
第 2 章 保护分布式系统
2.1 威胁种类
2.1.1 非授权访问/伪装
2.1.2 内在威胁
2.1.3 拒绝服务
2.1.4 数据威胁
2.2 威胁和风险评估
2.2.1 用户评估
2.2.2 环境评估
2.3 漏洞
2.4 深度防御
2.5 小结
第 3 章 系统架构
3.1 运行环境
3.2 网络安全
3.2.1 网络划分
3.2.2 网络防火墙
3.2.3 入侵检测和防御
3.3 Hadoop角色和隔离策略
3.3.1 主节点
3.3.2 工作节点
3.3.3 管理节点
3.3.4 边界节点
3.4 操作系统安全
3.4.1 远程访问控制
3.4.2 主机防火墙
3.4.3 SELinux
3.5 小结
第 4 章 Kerberos
4.1 为什么是Kerberos
4.2 Kerberos概览
4.3 Kerberos工作流:一个简单示例
4.4 Kerberos信任
4.5 MIT Kerberos
4.5.1 服务端配置
4.5.2 客户端配置
4.6 小结
第二部分 验证、授权和审计
第 5 章 身份和验证
5.1 身份
5.1.1 将Kerberos主体映射为用户名
5.1.2 Hadoop用户到组的映射
5.1.3 Hadoop用户配置
5.2 身份验证
5.2.1 Kerberos
5.2.2 用户名和密码验证
5.2.3 令牌
5.2.4 用户模拟
5.2.5 配置
5.3 小结
第 6 章 授权
6.1 HDFS授权
HDFS扩展ACL
6.2 服务级授权
6.3 MapReduce和YARN的授权
6.3.1 MapReduce(MR1)
6.3.2 YARN (MR2)
6.4 ZooKeeper ACLs
6.5 Oozie授权
6.6 HBase和Accumulo的授权
6.6.1 系统、命名空间和表级授权
6.6.2 列级别和单元级别授权
6.7 小结
第 7 章 Apache Sentry(孵化中)
7.1 Sentry概念
7.2 Sentry服务
Sentry服务配置
7.3 Hive授权
Hive Sentry的配置
7.4 Impala授权
Impala的Sentry配置
7.5 Solr授权
Solr的Sentry配置
7.6 Sentry特权模型
7.6.1 SQL特权模型
7.6.2 Solr特权模型
7.7 Sentry策略管理
7.7.1 SQL命令
7.7.2 SQL策略文件
7.7.3 Solr策略文件
7.7.4 策略文件的验证和校验
7.7.5 从策略文件迁移
7.8 小结
第 8 章 审计
8.1 HDFS审计日志
8.2 MapReduce审计日志
8.3 YARN审计日志
8.4 Hive审计日志
8.5 Cloudera Impala审计日志
8.6 HBase审计日志
8.7 Accumulo审计日志
8.8 Sentry审计日志
8.9 日志聚合
8.10 小结
第三部分 数据安全
第 9 章 数据保护
9.1 加密算法
9.2 静态数据加密
9.2.1 加密和密钥管理
9.2.2 HDFS静态数据加密
9.2.3 MapReduce2中间数据加密
9.2.4 Impala磁盘溢出加密
9.2.5 全盘加密
9.2.6 文件系统加密
9.2.7 Hadoop中重要数据的安全考虑
9.3 动态数据加密
9.3.1 传输层安全
9.3.2 Hadoop动态数据加密
9.4 数据销毁和删除
9.5 小结
第 10 章 数据导入安全
10.1 导入数据的完整性
10.2 数据导入的机密性
10.2.1 Flume加密
10.2.2 Sqoop加密
10.3 导入工作流
10.4 企业架构
10.5 小结
第 11 章 数据提取和客户端访问安全
11.1 Hadoop命令行接口
11.2 保护应用安全
11.3 HBase
11.3.1 HBase shell
11.3.2 HBase REST网关
11.3.3 HBase Thrift网关
11.4 Accumulo
11.4.1 Accumulo shell
11.4.2 Accumulo代理服务
11.5 Oozie
11.6 Sqoop
11.7 SQL访问
11.7.1 Impala
11.7.2 Hive
11.8 WebHDFS/HttpFS
11.9 小结
第 12 章 Cloudera Hue
12.1 Hue HTTPS
12.2 Hue身份验证
12.2.1 SPNEGO后端
12.2.2 SAML后端
12.2.3 LDAP后端
12.3 Hue授权
12.4 Hue SSL客户端配置
12.5 小结
第四部分 综合应用
第 13 章 案例分析
13.1 案例分析:Hadoop 数据仓库
13.1.1 环境搭建
13.1.2 用户体验
13.1.3 小结
13.2 案例分析:交互式HBase Web应用
13.2.1 设计与架构
13.2.2 安全需求
13.2.3 集群配置
13.2.4 实现中的注意事项
13.2.5 小结
统一授权
数据管控
原生数据保护
结语
关于作者
Hadoop数据分析
O’Reilly Media, Inc. 介绍
第一部分 分布式计算入门
第 1 章 数据产品时代
第 2 章 大数据操作系统
第 3 章 Python 框架和 Hadoop Streaming
第 4 章 Spark 内存计算
第 5 章 分布式分析和模式
第二部分 大数据科学的工作流和工具
第 6 章 数据挖掘和数据仓储
第 7 章 数据采集
第 8 章 使用高级 API 进行分析
第 9 章 机器学习
第 10 章 总结:分布式数据科学实战
附录 A 创建 Hadoop 伪分布式开发环境
附录 B 安装 Hadoop 生态系统产品
术语表
关于作者