91丨露脸丨熟女,91乱伦,精品国产乱码一区二区

NLP|自然語言處理-語法解析指南：算法和技術(shù)（第9部分）

原創(chuàng)|使用教程|編輯：鄭恭琳|2018-01-08 10:57:33.000|閱讀 1151 次

概述：隨著這個大系列的結(jié)束，我們希望解決大部分關(guān)于解析術(shù)語和算法的疑問，比如術(shù)語的含義以及為什么選擇某種算法。

# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>

相關(guān)鏈接：

我們已經(jīng)到了最后！如果您是第一次遇到這個系列，請查看上面的其他帖子。

解析算法

我們最后的重點是自下而上的算法。

自下而上算法

自下而上策略的主要成功是許多不同LR解析器的家族。雖然LR解析器比傳統(tǒng)的LL（1）語法更強大，但它們相對不受歡迎的原因是，歷史上它們難以建立。因此，除了對CYK解析器的簡要描述之外，我們主要關(guān)注它們。

這意味著我們避免談?wù)摳ㄓ玫膕hift-reduce分析器類，它也包含LR分析器。

Shift-Reduce算法分兩步工作：

Shift：從輸入中讀取一個token，這將成為一個新的（暫時孤立的）節(jié)點。
Reduce：一旦適當(dāng)?shù)囊?guī)則匹配，加入結(jié)果樹與先行的現(xiàn)有子樹。

基本上，Shift步驟讀取輸入直到完成，而Reduce步驟連接子樹，直到構(gòu)建最終的分析樹。

CYK解析器

Cocke-Younger-Kasami（CYK）算法由三位作者獨立制定。它的顯著性是由于最糟糕的表現(xiàn)（O（n3））造成的，盡管它在大多數(shù)常見的情況下受到相對較差的表現(xiàn)的阻礙。

然而，該算法的真正缺點是它需要以表示。

這是因為該算法依賴于這種特殊形式的屬性，能夠?qū)⑤斎敕殖蓛砂雭韲L試匹配所有的可能性。從理論上講，任何上下文無關(guān)的語法都可以轉(zhuǎn)化為相應(yīng)的CNF，但這種手段很少實用。想象一下，你不能使用左遞歸規(guī)則，然后被要求學(xué)習(xí)一種特殊的形式這一事實令人煩惱。

CYK算法主要用于特定問題；例如，會員問題：確定一個字符串是否與某個語法兼容。它也可以在自然語言處理中使用，以找到許多選項之間最可能的解析。

出于所有實際的目的，如果您需要解析所有上下文無關(guān)的語法，并且性能很差，那么您需要使用Earley解析器。

LR分析器

LR（從左到右讀取輸入；最右邊的派生）分析器是自下而上的分析器，可以以線性時間處理確定性的上下文無關(guān)語言，而且無需回溯。LR解析器的發(fā)明歸功于著名的Donald Knuth。

傳統(tǒng)上，他們已經(jīng)被比較，并與LL解析器競爭。有一個類似的分析需要解析一個語言的前瞻tokens的數(shù)量。一個LR（k）解析器可以解析需要解析前向k個tokens的語法。然而，LR語法的限制性較小，因此比相應(yīng)的LL語法更強大。例如，不需要排除左遞歸規(guī)則。

從技術(shù)上講，LR語法是LL語法的超集。這樣做的一個結(jié)果是你只需要LR（1）語法，所以通常，（k）被省略。

它們也是基于表格的，就像LL解析器一樣，但是它們需要兩個復(fù)雜的表格。非常簡單地說：