本書是一本全面系統(tǒng)地講述計算機自然語言處理的優(yōu)秀教材。本書英文版出版之后好評如潮,國外許多著名大學紛紛把本書選為自然語言處理和計算語言學課程的主要教材,該書被譽為該領域教材的“黃金標準”。本書包含的內容十分豐富,分為四個部分,共21章,深入細致地探討了計算機處理自然語言的詞匯、句法、語義、語用等各個方面的問題,介紹了自然語言處理的各種現(xiàn)代技術。從層次的角度看,本書的論述是按照自然語言的不同層面逐步展開的,首先論述單詞的自動形態(tài)分析,接著論述自動句法分析,然后論述各種語言單位的自動語義分析,最后論述連貫文本的自動分析、對話與會話的智能代理以及自然語言生成。從技術的角度看,本書介紹了正則表達式、有限狀態(tài)自動機、文本-語音轉換、發(fā)音與拼寫的概率模型、詞類自動標注、N元語法、隱馬爾可夫模型、上下文無關語法、特征與合一、詞匯化剖析與概率剖析、一階謂詞演算、詞義排歧、修辭結構理論、機器翻譯等非常廣泛的內容。本書具有“覆蓋全面、注重實用、強調評測、語料為本”四大特色。在本書的配套網站上,還提供了相關的資源和工具,便于讀者在實踐中進一步提高。本書不僅可以作為高等學校自然語言處理和計算語言學等課程的本科生和研究生教材,而且也是從事自然語言處理相關領域的研究人員和技術人員的必備參考。