數據解析異常是怎麼回事

數據解析異常是怎麼回事

異常值也稱離羣值,具體地說,判斷標準依據實際情況,根據業務知識及實際需要而定.

要是一般地說,可以用公式計算

upperadjacentvalue=75thpercentile+(75thpercentile–25thpercentile)*1.5

loweradjacentvalue=25thpercentile–(75thpercentile–25thpercentile)*1.5

翻譯過來:

上界=75%分位數+(75%分位數-25%分位數)*1.5

下界=25%分位數-(75%分位數-25%分位數)*1.5

比上界大的,和比下界小的都是異常值.