社交網站數據如同深埋地下的“金礦”,如何利用這些數據來發(fā)現哪些人正通過社交媒介進行聯系?他們正在談論什么?或者他們在哪兒?《社交網站的數據挖掘與分析(原書第2版)》第2版對上一版內容進行了全面更新和修訂,它將揭示回答這些問題的方法與技巧。你將學到如何獲取、分析和匯總散落于社交網站(包括Facebook、Twitter、LinkedIn、Google+、 GitHub、郵件、網站和博客等)的數據,以及如何通過可視化找到你一直在社交世界中尋找的內容和你聞所未聞的有用信息?!?借助IPython Notebook、自然語言工具包、NetworkX和其他科學計算工具挖掘主流社交網站■ 使用高級文本挖掘技術(如聚類和TF-IDF)來提取人類語言數據中有價值的知識■ 通過發(fā)現GitHub上人、編程語言和代碼工程間的親密性,構建興趣圖譜■ 利用D3.js進行交互式可視化,充分發(fā)揮HTML5和JavaScript工具包的靈活特性■ 以“問題-解決方案-討論”的方式詳細講解深入挖掘Twitter數據的實用技術,并提供代碼示例《社交網站的數據挖掘與分析(原書第2版)》的配套代碼在公開的GitHub代碼庫中進行維護,可以通過一站式虛擬機來訪問,你只需要使用方便易用的IPython Notebook,即可進入愉快的交互式學習情景。