翻譯|行業資訊|編輯:況魚杰|2020-05-11 14:12:43.490|閱讀 1174 次
概述:隨著我們從流程中收集越來越多的觀測數據,我們可能需要新的工具來提供有意義的見解。 您可以將現代機器學習技術與傳統統計工具一起添加,以分析,改善和控制您的流程。 讓我們看一個以二進制邏輯回歸開始,以分類和回歸樹(CART?)結尾的示例。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
隨著我們從流程中收集越來越多的觀測數據,我們可能需要新的工具來提供有意義的見解。 您可以將現代機器學習技術與傳統統計工具一起添加,以分析,改善和控制您的流程。 讓我們看一個以二進制邏輯回歸開始,以分類和回歸樹(CART®)結尾的示例。
編者注:該文章的早期版本顯示了Salford Predictive Modeler中的CART,已于2018年3月發布。我們對其進行了更新,以在Minitab的最新版本中顯示CART。
更多新功能可下載Minitab 19使用!
尋找紙漿漂白過程中過度變化的根本原因
在我們的示例中,我們看到產品中有2.9%存在缺陷。要開始查看此過程中出現不可接受百分比缺陷的根本原因,您可以從Minitab中的Binary Logistic回歸開始,其中響應變量可以觀察值是否存在缺陷。不幸的是,對于這些數據,下面殘差圖中的瘋狂模式表明二進制logistic回歸模型可能不夠充分。
CART方法
CART是一種決策樹算法,通過創建一組是/否規則進行工作,這些規則根據預測變量(X)的設置將響應(Y)變量分為多個分區。使用Minitab中的CART功能之后,發現預測變量之一——放電pH是造成缺陷的重要因素。
如果排放pH <= 7.739,則估計的缺陷可能性相對較高(17.7%)。 如果放電pH> 7.739,則幾乎沒有缺陷發生。
下面的Minitab圖說明了此規則起作用的原因。CART模型找到最能將Response = Pass與Response = Fail組區分開的變量和設置。在這里,該變量和設置是排出pH為7.739。
接下來可以繼續發展CART樹,以最終找到導致此過程中出現缺陷的更多設置組合。將問題縮小到至關重要的幾個X后,就可以放置控件以減少出現缺陷的機會。在這種情況下,完整的CART分類模型會確定放電pH和生產率的某些特定組合,這些組合會導致缺陷數量不成比例,如下圖所示。
心動了嗎?想要自己嘗試看看嗎?
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自:minitab