翻譯|使用教程|編輯:況魚杰|2020-06-28 11:40:51.540|閱讀 1264 次
概述:數據的正態分布遵循鐘形對稱模式。大多數觀察值都接近平均值,并且越來越遠離平均值的觀察值也越來越少。它表明,有一些方法可以解決原始數據的瘋狂問題。許多情況下的數據都遵循正態分布。但是,要衡量的許多事情都不遵循這種模式。據說它們具有非正態分布。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
Minitab Statistical Software是一款無與倫比的可視化統計分析軟件,它會審視當前及過往的數據,以找出趨勢并預測規律、發現變量之間隱藏的關系、可視化數據交互作用并識別重要因素,從而解答最棘手的問題、應對最嚴峻的難題。
正常數據? 非正常數據? 在分布中尋找模式
數據的正態分布遵循鐘形對稱模式。大多數觀察值都接近平均值,并且越來越遠離平均值的觀察值也越來越少。它表明,有一些方法可以解決原始數據的瘋狂問題。許多情況下的數據都遵循正態分布。但是,要衡量的許多事情都不遵循這種模式。據說它們具有非正態分布。
但是,對于正態和非正態數據,如果我們從總體中重復獲取大小為n的獨立隨機樣本,則當n大時,樣本均值的分布將接近正態分布。
多大的樣本量就足夠了?
這要看情況。總體分布已經越接近于正態分布,證明該定理所需的樣本就越少。一般來說,樣本大小為30或更大被認為足以使中心極限定理生效。 但是,嚴重偏斜或具有多種模式的總體可能需要更大的樣本量。
示例1:滾動模具顯示正態分布
假設您有一個6面模具。滾動任何數字的概率為1/6。滾動任何一個數字的概率與滾動其他五個數字的概率相同。在Minitab統計軟件中,您可以利用隨機數據生成器為您的第一卷模具模擬500種不同的結果。 單擊計算>隨機數據>整數…,并使其生成500行,其中最小值為1,最大值為6。
直方圖可用于可視化這500個“第一卷”。 在這種情況下,樣本大小為1。并且由于滾動每個數字的幾率相等,因此分布相對平坦。請看下圖中的藍色條形圖與代表正態分布的紅色曲線圖相比如何? 這不正常。
現在,讓我們獲取更多樣本,看看這些樣本的平均值的直方圖發生了什么。這次,將模擬模子滾動兩次,并重復此過程500次。現在樣本大小為2。我們使用Calc> Row Statistics…計算每對的平均值。見下文。在這里,每一行代表大小為2的樣本及其均值。 當樣本量足夠大時,將遵循正態分布。讓我們創建一個獲取想法的直方圖。它開始看起來更加正常。現在,讓我們擲骰子5、10、20和30次。
每組均值的直方圖顯示,隨著樣本數量的增加,樣本均值的分布越來越接近正態分布。
示例2:指數分布
指數分布模擬事件之間的時間。無論產品是全新的,一年或更舊的(無論是全新的還是一歲的),它都是隨時可能發生故障的產品或產品生命周期的一個很好的模型。它開始老化并在預期的應用中磨損。這是估算晶體管失效時間的概率密度曲線的示例。
顯然,這不是正態分布。但是,當您使用樣本量5生成指數數據時,計算均值,然后創建均值的直方圖會怎樣?樣本量10、20和30怎么樣?
就像滾動模具一樣,隨著樣本數量的增加,均值的分布更接近正態分布。
如果您感興趣,可以下載Minitab來試試!當然,你有任何其他想了解的信息,可以點擊咨詢在線客服>>
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自:minitab