注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件社交媒體數(shù)據(jù)挖掘與分析

社交媒體數(shù)據(jù)挖掘與分析

社交媒體數(shù)據(jù)挖掘與分析

定 價:¥79.00

作 者: [美] 加博爾·薩博(Gabor Szabo) 著,李凱,呂天陽 譯
出版社: 機械工業(yè)出版社
叢編項: 數(shù)據(jù)科學與工程技術叢書
標 簽: 暫缺

ISBN: 9787111643685 出版時間: 2020-01-01 包裝: 平裝
開本: 16開 頁數(shù): 219 字數(shù):  

內(nèi)容簡介

  《社交媒體數(shù)據(jù)挖掘與分析》由工作在大規(guī)模社交媒體數(shù)據(jù)處理一線的研發(fā)人員撰寫,旨在以更為友好、基礎、實用的方式幫助你理解在線社交媒體。《社交媒體數(shù)據(jù)挖掘與分析》圍繞著如何探索和理解社交媒體系統(tǒng)的基本組成部分進行組織,從用戶角度深入剖析收集和應用社交媒體數(shù)據(jù)的機制,并通過建立在真實數(shù)據(jù)集上的代碼及分析案例詳細闡述相關數(shù)據(jù)挖掘方法、技術和工具?!渡缃幻襟w數(shù)據(jù)挖掘與分析》共7章,第1章介紹典型用戶在社交媒體服務上的行為及其在不同服務中的普遍相似性;第2章主要討論創(chuàng)造了社交網(wǎng)絡的用戶之間的連接;第3章主要探討時間在社交系統(tǒng)中所扮演的角色,并且介紹幫助你理解其作用的工具;第4章回顧自然語言處理技術;第5章介紹分析大型數(shù)據(jù)集的挑戰(zhàn);第6章展示如何用機器學習技術預測人們喜歡哪類電影,并對預測結果進行評估;第7章由淺入深地分析全書中用于分析不同問題的通用統(tǒng)計模式,以及如何使用類似的分析技術去理解它們。

作者簡介

  加博爾·薩博(Gabor Szabo),致力于社交網(wǎng)絡、自組織在線生態(tài)系統(tǒng)、交通運輸系統(tǒng)和自動駕駛領域的大規(guī)模數(shù)據(jù)分析和建模問題。此前任職于哈佛醫(yī)學院、圣母大學和惠普實驗室,期間的研究重點是描述在線社區(qū)和生物系統(tǒng)中的隨機組織網(wǎng)絡。在此之后,他建立了分布式算法來理解和預測Twitter中的用戶行為。他創(chuàng)建了Lyft拼車網(wǎng)絡的資源分配模型,最近領導著特斯拉自動輔助駕駛( Tesla's Autopilot)項目的一個團隊。格爾·波拉特坎(Gungor Polatkan),機器學習專家和工程領導者,參與構建了Linkedln和Twitter的服務于個性化內(nèi)容的大規(guī)模分布式數(shù)據(jù)管道。最近,他領導著Linkedln的AI后端的設計與實現(xiàn),并將其推薦引擎從無到有地提升為能夠從5億多用戶中學習數(shù)十億個系數(shù)的超個性化模型。他在Linkedln部署了早一批深度排名模型,用于Linkedln的垂直搜索,改進了其人才搜索功能。他樂于領導團隊、指導工程師,并在產(chǎn)品的快速迭代過程中培育技術嚴謹和工匠精神的文化。在加入Linkedln之前,他曾在Twitter、普林斯頓大學、谷歌、MERL和加州大學伯克利分校的幾個著名的應用研究小組工作。他在ML&AI期刊和會議發(fā)表并評審過論文,如UAI、ICML和PAMI。P.奧斯卡·柏金(P.Oscar Boykin),在Stripe致力于機器學習基礎設施的建設,建立了預測大規(guī)模欺詐行為的系統(tǒng)。在加入Stripe之前,Oscar在Twitter工作了4年多的時間,先是致力于廣告的建模和預測,而后投身于數(shù)據(jù)基礎設施系統(tǒng)的建設。在Twitter,Oscar與他人合作開發(fā)了許多開源scala庫,包括Scalding、Algebird、Summingbird和Chill。在加入Twitter之前,Oscar是佛羅里達大學電子與計算機工程系的助理教授。Oscar在加州大學洛杉磯分校獲得物理學博士學位,作為合著者在學術期刊和會議上發(fā)表了數(shù)十篇論文。安東尼奧斯·查基奧普洛斯(Antonios Chalkiopoulos),一位快速和大型數(shù)據(jù)分布式系統(tǒng)專家,具有在媒體、物聯(lián)網(wǎng)、零售和金融行業(yè)交付生產(chǎn)級數(shù)據(jù)管道的經(jīng)驗。Antonios是大數(shù)據(jù)領域的專著作者、開源社區(qū)的貢獻者、Landoop LTD的聯(lián)合創(chuàng)始人和CEO。Landoop LTD為動態(tài)數(shù)據(jù)創(chuàng)建了創(chuàng)新性的、曾獲獎勵的Lenses平臺。該平臺保證了流數(shù)據(jù)的可見、可控,它通過直觀的Web接口支持數(shù)據(jù)發(fā)現(xiàn),并為數(shù)據(jù)的移動、監(jiān)控、預警、管理、多重租賃、安全提供了全面的SQL支持,為構建和管理實時數(shù)據(jù)管道和微服務提供了完整的用戶體驗。

圖書目錄

譯者序
前言
致謝
作者簡介
技術編輯簡介
第1章 用戶:誰參與社交媒體
1.1 測量Wikipedia中用戶行為的變化
1.1.1 用戶活動的多樣性
1.1.2 人類活動中的長尾效應
1.2 隨處可見的長尾效應:80/20定律
1.3 Twitter上的在線行為
1.3.1 檢索用戶的Tweet
1.3.2 對數(shù)分區(qū)
1.3.3 Twitter上的用戶活動
1.4 總結
第2章 網(wǎng)絡:社交媒體如何運行
2.1 社交網(wǎng)絡的類型和屬性
2.1.1 用戶何時創(chuàng)建連接:顯式網(wǎng)絡
2.1.2 有向圖與無向圖
2.1.3 節(jié)點和邊的屬性
2.1.4 加權圖
2.1.5 由活動構建圖:隱式網(wǎng)絡
2.2 網(wǎng)絡可視化
2.3 度:贏家通吃
2.3.1 連接計數(shù)
2.3.2 用戶連接的長尾分布
2.3.3 超越理想網(wǎng)絡模型
2.4 捕獲相關:三角結構、簇和同配性
2.4.1 局部三角結構和簇
2.4.2 同配性
2.5 總結
第3章 時序過程:用戶何時使用社交媒體
3.1 傳統(tǒng)模型如何描述事件發(fā)生的時間
3.2 事件間隔時間
3.2.1 與無記憶過程的對比
3.2.2 自相關
3.2.3 與無記憶過程的偏離
3.2.4 用戶活動中的時間周期
3.3 個體行為的爆發(fā)
3.4 預測長期指標
3.4.1 發(fā)現(xiàn)趨勢
3.4.2 發(fā)現(xiàn)季節(jié)性
3.4.3 利用ARIMA預測時間序列
3.5 總結
第4章 內(nèi)容:社交媒體中有什么
4.1 定義內(nèi)容:聚焦于文本和非結構數(shù)據(jù)
4.1.1 從文本生成特征:自然語言處理基礎
4.1.2 文本中詞條的基本統(tǒng)計
4.2 使用內(nèi)容特征識別主題
4.2.1 話題的流行度
4.2.2 用戶個體興趣有多么多樣化
4.3 從高維文本中抽取低維信息
4.4 總結
……
第5章 處理大型數(shù)據(jù)集
第6章 學習、映射和推薦
第7章 結論

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.autoforsalebyowners.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號