翻譯|使用教程|編輯:陳津勇|2019-10-29 10:31:37.413|閱讀 1065 次
概述:?在本教程中,您將使用自動化機器學習在Power BI中創建和應用二進制預測模型。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
本教程包括創建Power BI數據流的指導,以及使用數據流中定義的實體直接在Power BI中培訓和驗證機器學習模型。然后,我們使用該模型對新數據進行評分以生成預測。
首先,您將創建一個Binary Prediction機器學習模型,根據在線購物者的一組在線會話屬性來預測他們的購買意圖。本練習使用基準機器學習數據集。一旦一個模型被訓練,Power BI將自動生成一個解釋模型結果的驗證報告。然后您可以查看驗證報告,并將模型應用到您的數據中進行評分。
學習本教程前,請下載Power BI Desktop或Power BI Pro,以便同步操作加深學習印象。
下載Power BI Desktop 下載Power BI Pro
本教程包括以下步驟:
使用輸入數據創建數據流
創建和訓練機器學習模型
查看模型驗證報告
將模型應用于數據流實體
使用Power BI報表中模型的評分輸出
使用輸入數據創建數據流
本教程的第一部分是使用輸入數據創建數據流。如以下各節所示,該過程采取了一些步驟,從獲取數據開始。
獲取數據
創建數據流的第一步是準備好數據源。在我們的案例中,我們使用來自一系列在線會話的機器學習數據集,其中一些最終達到了購買目的。數據集包含一組關于這些會話的屬性,我們將使用它們來訓練我們的模型。
您可以從UC Irvine網站下載數據集。就本教程而言,我們還可以通過提供此功能。
創建實體
要在數據流中創建實體,請登錄Power BI服務,并導航到啟用了AI的專用容量的工作區。
如果還沒有工作區,可以通過在Power BI服務的左側導航菜單中選擇“工作區”來創建一個工作區,然后在出現的面板底部選擇“創建應用程序工作區 ”。這將在右側打開一個面板,以輸入工作區詳細信息。輸入工作空間名稱,然后選擇高級。使用單選按鈕確認工作空間使用“專用容量”,并且已將其分配給已打開AI的專用容量實例。然后選擇保存。
創建工作空間后,可以選擇“歡迎”屏幕右下角的“ 跳過 ”,如下圖所示。
選擇工作區右上方的Create按鈕,然后選擇Dataflow。
選擇添加新實體。這將在瀏覽器中啟動Power Query編輯器。
選擇Text/CSV File作為數據源,如下圖所示。
在接下來出現的“ 連接到數據源”頁面中,將以下指向online_shoppers_intention.csv的鏈接粘貼到“ 文件路徑”或“ URL”框中,然后選擇“ 下一步”:
//raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv
Power Query Editor顯示CSV文件中數據的預覽。您可以通過更改右側窗格中“名稱”框中的值,將查詢重命名為更友好的名稱。例如,您可以將查詢名稱更改為Online Visitors。
Power Query會自動推斷列的類型。您可以通過單擊列標題頂部的屬性類型圖標來更改列類型。在此示例中,我們將“收入”列的類型更改為“真/假”。
選擇“保存并關閉”按鈕以關閉Power Query Editor。提供數據流的名稱,然后在對話框上選擇“保存 ”,如下圖所示。
創建和訓練機器學習模型
要添加機器學習模型,請在“動作”列表中為包含您的訓練數據和標簽信息的基本實體選擇“應用ML模型”按鈕,然后選擇“添加機器學習模型”。
創建機器學習模型的第一步是識別歷史數據,包括您想要預測的結果字段。模型將通過學習這些數據來創建。
對于我們使用的數據集,這是收入字段。選擇Revenue作為“輸出字段”值,然后選擇Next。
接下來,我們必須選擇要創建的機器學習模型的類型。Power BI分析您已經確定的結果字段中的值,并建議可以創建哪些類型的機器學習模型來預測該字段。
在本例中,由于我們正在預測用戶是否會購買的二進制結果,因此建議使用二進制預測。因為我們對預測用戶購買感興趣,所以選擇True作為您最感興趣的收入結果。此外,您可以為自動生成的報告中使用的結果提供友好的標簽,該報告將總結模型驗證的結果。然后選擇Next。
接下來,Power BI對您的數據樣本進行初步掃描,并提出可能產生更準確預測的輸入建議。如果Power BI不建議使用該字段,則會在其旁邊提供說明。您可以選擇更改選擇,以僅包括您要模型研究的字段,或者可以通過選擇實體名稱旁邊的復選框來選擇所有字段。選擇下一步接受輸入。
在最后一步,我們必須為模型提供一個名稱。將模型命名為“購買意圖預測”。您可以選擇減少培訓時間以查看快速結果,也可以選擇增加培訓時間以獲得最佳模型。然后選擇保存并訓練以開始訓練模型。
培訓過程將首先對歷史數據進行采樣和標準化,然后將數據集劃分為兩個新實體,即購買意向預測培訓數據和購買意向預測測試數據。
根據數據集的大小,訓練過程可能需要幾分鐘到上一個屏幕選擇的訓練時間。此時,您可以在數據流的“ 機器學習模型”選項卡中看到該模型。就緒狀態表示該模型已排隊等待訓練或正在訓練中。
您可以通過數據流的狀態來確認正在對模型進行訓練和驗證。這將在工作區的Dataflows選項卡中顯示為正在進行的數據刷新。
模型訓練完成后,數據流將顯示更新的刷新時間。您可以通過導航到數據流中的“機器學習模型”選項卡來確認模型已訓練。您創建的模型應顯示為“已訓練”狀態,并且“最后一次訓練時間”現在應該更新了。
查看模型驗證報告
要查看模型驗證報告,請在機器學習模型選項卡中,選擇模型的“操作”列中的“查看培訓報告”按鈕。該報告描述了您的機器學習模型可能如何執行。
在報告的“ 模型性能”頁面中,選擇“查看最重要的預測變量”以查看模型的最重要的預測變量。您可以選擇一個預測變量,以查看結果分布如何與該預測變量關聯。
您可以使用“模型性能”頁面上的“概率閾值”切片器來檢查其對模型的“精確度”和“調用”的影響。
報告的其他頁面描述了該模型的統計性能指標。
該報告還包括“培訓詳細信息”頁面,該頁面描述了運行的不同迭代,如何從輸入中提取特征以及所使用的最終模型的超參數。
將模型應用于數據流實體
選擇報告頂部的“應用模型”按鈕以調用此模型。在“應用”對話框中,可以指定目標實體,該目標實體具有應該將模型應用于其的源數據。
出現提示時,您必須刷新數據流才能預覽模型的結果。
應用模型將創建兩個新實體,后綴分別為<model_name>和<model_name>。在我們的案例中,將模型應用于“在線訪問者”實體將創建“在線訪問者豐富的購買意圖預測”,其中包括該模型的預測輸出;以及“在線訪問者豐富的購買意圖預測”說明,其中包含針對該預測的特定記錄最高影響者。
應用二進制預測模型將添加四列,其中包含預測的結果、概率得分、預測的最高記錄特定影響者以及解釋索引,每列均以指定的列名作為前綴。
數據流刷新完成后,您可以選擇“在線訪問者充實的購買意圖預測”實體來查看結果。
在Power BI報表中使用模型的評分輸出
要使用機器學習模型的評分輸出,可以使用數據流連接器從Power BI桌面連接到數據流?,F在,可以使用“在線訪問者豐富的購買意圖預測”實體將來自模型的預測合并到Power BI報表中。
*想要獲得Power BI Desktop、Power BI Pro更多資源或正版授權的朋友,可以咨詢了解哦~
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自: