轉(zhuǎn)帖|行業(yè)資訊|編輯:鄭恭琳|2016-09-05 15:05:10.000|閱讀 290 次
概述:將自然語(yǔ)言處理(NLP)的先進(jìn)成果,從前沿研究的小世界里拿出來(lái),送到普通的數(shù)據(jù)科學(xué)家和軟件工程師手中,這已經(jīng)成為一場(chǎng)運(yùn)動(dòng)。7月20日,谷歌也加入進(jìn)來(lái),發(fā)布了測(cè)試版的云自然語(yǔ)言API。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
谷歌的NLP API讓用戶可以利用如下三個(gè)核心的NLP特性:
這些工具使用了谷歌的深度機(jī)器學(xué)習(xí)算法,這也是其API與其他自建的數(shù)據(jù)科學(xué)工具的不同之處。
NLP軟件是一種構(gòu)建用來(lái)理解人類語(yǔ)言或文本的程序。像谷歌和IBM這樣的科技巨頭發(fā)布了大量便于開(kāi)發(fā)人員使用的API,讓這類軟件進(jìn)入了主流應(yīng)用。在谷歌的一篇博文中,開(kāi)發(fā)工程師Sara Robinson使用該API的實(shí)體識(shí)別特性識(shí)別《哈利·波特》中的人物和地點(diǎn)(因?yàn)樗粫?huì)念咒語(yǔ))。接下來(lái),她比較了自己開(kāi)發(fā)并維護(hù)所有軟件和使用NLP API的差別:
『我可以編寫(xiě)自己的算法,找出這個(gè)句子里的人物和地點(diǎn),但是那會(huì)很困難。而且,考慮到相同的實(shí)體會(huì)使用不同的詞語(yǔ)描述,如果我希望針對(duì)涉及到的每個(gè)實(shí)體收集更多的數(shù)據(jù),或者在成千上萬(wàn)的句子里分析實(shí)體,則會(huì)更加困難。』
按照Robinson的說(shuō)法,從頭構(gòu)建NLP軟件特別困難,因?yàn)榧词故窃陂_(kāi)始真正的工具開(kāi)發(fā)工作之前,數(shù)據(jù)收集、預(yù)處理和訓(xùn)練就有太多的事項(xiàng)需要注意。像谷歌提供的這種NLP API,讓用戶可以利用NLP算法的強(qiáng)大功能,而又不必應(yīng)對(duì)復(fù)雜的高等數(shù)學(xué)計(jì)算、工程和數(shù)據(jù)建模所帶來(lái)的巨大開(kāi)銷。
Watson的Conversation API也是最近出現(xiàn)的NLP API。借助該API,你可以使用NLP解釋不同的用戶指令,并將這些指令傳達(dá)給不同的智能家居軟件,比如控制燈光的應(yīng)用。Watson API有交互式的Swagger文檔,你可以在里面測(cè)試類似“開(kāi)燈”和“天氣怎么樣”這樣的請(qǐng)求。谷歌的NLP API面向更為廣泛的NLP使用場(chǎng)景,而Watson的API主要是為人通過(guò)文本或語(yǔ)言同機(jī)器通信提供便利。它基于日益流行的IoT(物聯(lián)網(wǎng))技術(shù)構(gòu)建。在IoT環(huán)境里,NLP是同智能汽車、家居、甚至衛(wèi)生紙筒通信的理想介質(zhì)。
Facebook采取了一種更為直接的路線,即向更大的技術(shù)社區(qū)公布內(nèi)部使用的NLP代碼。今年7月,他們把詞匯表征學(xué)習(xí)和句子分類庫(kù)fastText的所有源代碼都發(fā)布在了GitHub上。雖然開(kāi)發(fā)人員不會(huì)完全忠于一個(gè)干凈的API,但能夠從Facebook的代碼創(chuàng)建分支,讓開(kāi)發(fā)人員可以在更高的層面上參與到現(xiàn)有的NLP數(shù)據(jù)科學(xué)社區(qū)。在社區(qū)環(huán)境里,這個(gè)庫(kù)很容易衍生出更多的NLP API和庫(kù)。無(wú)論形式如何,可以確定的是,NLP離普通大眾越來(lái)越近。
本文來(lái)源:
英文原文:
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn