異常值也稱離羣值,具體地說,判斷標準依據實際情況,根據業務知識及實際需要而定.
要是一般地說,可以用公式計算:
upperadjacentvalue=75thpercentile+(75thpercentile–25thpercentile)*1.5
loweradjacentvalue=25thpercentile–(75thpercentile–25thpercentile)*1.5
翻譯過來:
上界=75%分位數+(75%分位數-25%分位數)*1.5
下界=25%分位數-(75%分位數-25%分位數)*1.5
比上界大的,和比下界小的都是異常值.