社交网站的数据挖掘与分析 (O’Reilly精品图书系列)

社交网站的数据挖掘与分析 (O’Reilly精品图书系列)
作者:
(美)Matthew A Russell 著
译者:
师蓉
语言:
中文
类型:
EPUB
页数:
301页
大小:
8.49 MB
出版社:
机械工业出版社
出版时间:
2012-02-09
ISBN:
9787111369608
分类:

内容简介

Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。
你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。

每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。
你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。

•获得对社交网络世界的直观认识

•使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据

•学习如何应用便捷的Python工具来交叉分析你所收集的数据

•通过XHTML朋友圈探讨基于微格式的社交联系

•应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术

•通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化

目录

前言1
第1章绪论:Twitter 数据的处理9
Python 开发工具的安装9
Twitter 数据的收集和处理11
小结24
第2章微格式:语义标记和常识碰撞26
XFN 和朋友27
使用XFN 来探讨社交关系29
地理坐标:兴趣爱好的共同主线37
(以健康的名义)对菜谱进行交叉分析41
对餐厅评论的搜集43
小结45
第3章邮箱:虽然老套却很好用47
mbox:Unix 的入门级邮箱48
mbox+CouchDB= 随意的Email 分析54
将对话线程化到一起70
使用SIMILE Timeline 将邮件“事件”可视化79
分析你自己的邮件数据82
小结84
第4章Twitter :朋友、关注者和Setwise 操作85
REST 风格的和OAuth-Cladded API86
干练而中肯的数据采集器90
友谊图的构建108
小结116
第5章Twitter:tweet ,所有的tweet ,只有tweet 118
笔PK 剑:和tweet PK 机枪(?!?)118
对tweet 的分析(每次一个实体)121
并置潜在的社交网站(或#JustinBieber VS #TeaParty)144
对大量tweet 的可视化155
小结163
第6章LinkedIn :为了乐趣(和利润?)将职业网络聚类164
聚类的动机165
按职位将联系人聚类167
获取补充个人信息183
从地理上聚类网络188
小结192
第7章Google Buzz:TF-IDF 、余弦相似性和搭配194
Buzz=Twitter+ 博客(???)195
使用NLTK 处理数据198
文本挖掘的基本原则201
查找相似文档208
在二元语法中发Buzz 215
利用Gmail 221
在中断之前试着创建一个搜索引擎……225
小结226
第8章博客及其他:自然语言处理(等)228
NLP :帕累托式介绍228
使用NLTK 的典型NLP 管线231
使用NLTK 检测博客中的句子234
对文件的总结237
以实体为中心的分析:对数据的深层了解245
小结256
第9章Facebook :一体化的奇迹257
利用社交网络数据258
对Facebook 数据的可视化274
小结294
第10 章语义网:简短的讨论296
发展中的变革296
人不可能只靠事实生活297
期望301

下载权限
查看
  • 免费下载
    评论并刷新后下载
    登录后下载
  • {{attr.name}}:
您当前的等级为
登录后免费下载登录 小黑屋反思中,不准下载! 评论后刷新页面下载评论 支付以后下载 请先登录 您今天的下载次数(次)用完了,请明天再来 支付积分以后下载立即支付 支付以后下载立即支付 您当前的用户组不允许下载升级会员
您已获得下载权限 您可以每天下载资源次,今日剩余
免责申明
1. 本站分享的所有书籍均来源于自互联网,我们只进行收集整理,并不对书籍内容进行更改。
2. 部分书籍中可能有书籍压制者放置的广告,这并不是本站所为,请注意甄别。
3. 我们分享这些书籍,纯粹是出于知识分享的热情,以及对互联网分享精神的高度认同和践行,没有任何商业目的。
4. 本站分享的所有书籍,仅供个人学习研究使用,请勿用于任何商业用途,否则产生的一切法律纠纷与本站无关。
5. 如果这些书籍让你有所收获,在条件允许的情况下,请一定购买正版书籍,这是对创作者最好的支持。
6. 如果您是此书籍的版权所有者,且您不希望此作品出现在本站,请联系我们,我们将在收到您的请求后48时间内予以删除。

📖 支持知识自由流动

这本书的持续提供,需要服务器运行成本支持(约 3.7元/小时

给TA打赏
共{{data.count}}人
人已打赏
📱 超值套餐推荐
19元180G流量卡 · 运营商正规授权
全国通用 · 长期有效 · 运营商可查 · 随时可退
自助办理 →
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索