自拍偷拍国产精品,亚洲无码午夜,美女AV片

IBM SPSS Modeler數(shù)據(jù)庫(kù)內(nèi)建模

原創(chuàng)|行業(yè)資訊|編輯：陳俊吉|2017-03-03 16:19:35.000|閱讀 164 次

概述：如何使用數(shù)據(jù)庫(kù)內(nèi)算法進(jìn)行建模的過(guò)程，經(jīng)常會(huì)有朋友問(wèn)說(shuō)，使用這里的決策樹(shù)算法和使用IBM SPSS Modeler封裝好的決策樹(shù)算法，結(jié)果會(huì)有什么不同？

# 界面/圖表報(bào)表/文檔/IDE等千款熱門(mén)軟控件火熱銷(xiāo)售中 >>

支持對(duì)數(shù)據(jù)庫(kù)供應(yīng)商的數(shù)據(jù)挖掘工具和建模工具進(jìn)行整合，其中包括IBM Netezza、IBM DB2 InfoSphere Warehouse、Oracle Data Miner和Microsoft Analysis Services。實(shí)現(xiàn)了在IBM SPSS Modeler的分析功能和易用性將與數(shù)據(jù)庫(kù)的功能和性能相結(jié)合，同時(shí)還兼備數(shù)據(jù)庫(kù)供應(yīng)商提供的數(shù)據(jù)庫(kù)自有算法。模型在數(shù)據(jù)庫(kù)創(chuàng)建，然后可以借助界面以正常方式瀏覽模型并為之評(píng)分。

那么使用IBM SPSS Modeler訪問(wèn)數(shù)據(jù)庫(kù)自有算法有什么優(yōu)勢(shì)呢？主要是兩方面：

1.數(shù)據(jù)庫(kù)內(nèi)的算法常常與數(shù)據(jù)庫(kù)服務(wù)器緊密集成，這有助于提高性能。

2.在“數(shù)據(jù)庫(kù)內(nèi)”構(gòu)建和存儲(chǔ)的模型不僅由可訪問(wèn)數(shù)據(jù)庫(kù)的應(yīng)用程序共享，且更易于在這些應(yīng)用程序中部署。

接下來(lái)我們以Microsoft Analytics Services為例，介紹如何配置以及使用數(shù)據(jù)庫(kù)內(nèi)建模功能。

支持集成下列Analysis Services算法包括：

· 決策樹(shù)

· 聚類

· 關(guān)聯(lián)規(guī)則

· 樸素貝葉斯

· 線性回歸

· 神經(jīng)網(wǎng)絡(luò)

· Logistic回歸

· 時(shí)間序列

· 序列聚類

安裝與配置：

在您的機(jī)器上，必須安裝以下模塊：

· IBM SPSS Modeler Client

· IBM SPSS Modeler Server

· Microsoft Analysis Services,與相應(yīng)數(shù)據(jù)庫(kù)建立ODBC連接。

1. 配置IBM SPSS Modeler：

在IBM SPSS Modeler中，在菜單欄的工具-->選項(xiàng)-->幫助應(yīng)用程序，選擇Microsoft面板，如下圖：

勾上之后，會(huì)在下面的面板節(jié)點(diǎn)上多了一項(xiàng)數(shù)據(jù)庫(kù)建模，列出了Microsoft Analysis Services支持的數(shù)據(jù)庫(kù)內(nèi)建模算法，如下圖：

2.配置 SQL Server

該配置可實(shí)現(xiàn)在數(shù)據(jù)庫(kù)內(nèi)進(jìn)行評(píng)分。

在 SQL Server 主機(jī)上創(chuàng)建以下注冊(cè)表鍵：

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\MSSQLServer\Providers\MSOLAP

為該鍵添加如下 DWORD 鍵值：

AllowInProcess 1

完成上述更改后，重新啟動(dòng)SQL Server。

3.配置Microsoft Analysis Services

建立IBM SPSS Modeler 與Microsoft Analysis Services 進(jìn)行通信。

通過(guò)MS SQL Server Management Studio 登錄到分析服務(wù)器。

訪問(wèn)“屬性”對(duì)話框，右鍵單擊服務(wù)器名稱，然后選擇屬性。

選中顯示高級(jí)（所有）屬性復(fù)選框。

更改以下屬性：

將 DataMining\AllowAdHocOpenRowsetQueries 的值更改為 True（缺省值為False）。

將 DataMining\AllowProvidersInOpenRowset 的值更改為 [all] （無(wú)缺省值）。

4.為SQL Server 創(chuàng)建 ODBC DSN

通過(guò)使用 Microsoft SQL Native Client ODBC 驅(qū)動(dòng)程序，創(chuàng)建一個(gè)指向數(shù)據(jù)挖掘過(guò)程中使用的 SQL Server 數(shù)據(jù)庫(kù)的 ODBC DSN。余下的驅(qū)動(dòng)程序設(shè)置應(yīng)使用缺省設(shè)置。

對(duì)于此DSN，請(qǐng)確保選中了使用集成的 Windows 認(rèn)證。

5.啟用 SQL 生成和優(yōu)化

從IBM SPSS Modeler菜單中選擇：工具—>流屬性—>選項(xiàng)—>優(yōu)化面板，勾選上所有選項(xiàng)內(nèi)容如下圖：

使用Microsoft Analysis Services 算法生成模型

以上內(nèi)容配置完成后，即可使用數(shù)據(jù)庫(kù)內(nèi)的算法生成模型。如下圖：

源節(jié)點(diǎn)從SQL Server數(shù)據(jù)庫(kù)中讀取，終端節(jié)點(diǎn)又寫(xiě)回到SQL Server數(shù)據(jù)庫(kù)中，中間使用的是Microsoft的決策樹(shù)算法，整個(gè)計(jì)算過(guò)程都在數(shù)據(jù)庫(kù)中實(shí)現(xiàn)。

介紹到這里，我們就了解了，如何使用數(shù)據(jù)庫(kù)內(nèi)算法進(jìn)行建模的過(guò)程，經(jīng)常會(huì)有朋友問(wèn)說(shuō)，使用這里的決策樹(shù)算法和使用IBM SPSS Modeler封裝好的決策樹(shù)算法，結(jié)果會(huì)有什么不同？預(yù)測(cè)結(jié)果當(dāng)然是會(huì)有差異的了。本身決策樹(shù)算法就包含多種，像C&R、CHAID、C5.0、QUEST等，每個(gè)算法計(jì)算邏輯就不一樣，因此計(jì)算得到的結(jié)果自然也不一樣，前面我們已經(jīng)介紹過(guò)C&R、CHAID、C5.0這三種算法，他們核心的差異就是選擇最佳分組變量和分割點(diǎn)的標(biāo)準(zhǔn)，而Microsoft Analysis Services決策樹(shù)是使用線性回歸來(lái)確定決策樹(shù)分割位置，它可以用于分類屬性和連續(xù)屬性的預(yù)測(cè)建模。那么到底選擇什么算法為優(yōu)呢，前面已經(jīng)介紹了，使用數(shù)據(jù)庫(kù)內(nèi)建模的好處，大家可以綜合考慮，結(jié)合實(shí)際場(chǎng)景和數(shù)據(jù)預(yù)測(cè)結(jié)果的評(píng)估再做選擇。