Pearson's Chi-squared test
Pearson's Chi-squared test

本篇內容包括:

  • 卡方檢定
  • 卡方獨立性檢定
  • Pearson’s卡方檢定
  • 列聯表相關係數(contingency table)
  • 帶有瑕疵的數據資料

有時候就算給你全部公式,其實你也不一定會用,用了也不知道數據跑出來對不對,甚至知其然而不知其所以然,所以這幾篇有關用R語言來實踐統計分析,難不難,見仁見智。

在這裡的案例數據和統計分析結果,可不是隨便蝦掰出來的,特別是統計分析結果,都是經過驗證的,也就是用R跑出來的數據和使用SPSS是一樣的,甚至 P-value 值的精準度更高(小數點以後更多位,但其實巫山小路用,沒太大影響),那麼你會不會又有一種感覺?原來不只要會統計和R,連SPSS都要略懂呢!是不用那麼跨張啦!只是用對的方法就會產生對的結果。當然我也不是統計專門老師,若有錯還請見諒。

但有一點可以確定的是,如果沒有使用實際案例,只談統計理論、公式或R函數的話,那麼跟實作出結果通常會有一段不小的差距。

卡方檢定(Chi Square Test)

想到卡方檢定,你想到什麼呢?簡單的說,在於驗證類別資料出現的頻率,是不是會隨著另一個類別資料的不同有所不同。

例如:牛肉麵店顧客的性別和居住地區分佈如下

北部 中部 南部 總計
48 100 85 233
84 144 120 348
總計 66 244 205 581

想更了解R語言的資料結構,請試著練習看看,將上方資料以輸入到R裡面吧!

案例:請問牛肉麵店顧客點餐種類和居住地區有無關係?

H0:顧客點餐種類和居住地區無關
H1:顧客點餐種類和居住地區有關

列聯相關係數

函數:xtabs(formula = ~., data = parent.frame(), subset, sparse = FALSE, na.action, addNA = FALSE, exclude = if(!addNA) c(NA, NaN), drop.unused.levels = FALSE)

居住地區和點餐種類交叉表(contingency table)

mytable <- xtabs(~ collegedata$居住地區 + collegedata$點餐種類, data = collegedata)

chi-squared顯示列聯相關係數
chi-squared顯示列聯相關係數

Pearson’s卡方檢定(獨立性檢定)

函數:chisq.test(x, y = NULL, correct = TRUE, p = rep(1/length(x), length(x)), rescale.p = FALSE, simulate.p.value = FALSE, B = 2000)

chisq.test(mytable)

Pearson's卡方檢定
Pearson’s卡方檢定

P-value = 0.1252 > 0.05 無法拒絕H0,所以顧客點餐種類和居住地區無關。

案例:全校學生居住地區和入學方式是否有關係?

H0:全校學生居住地區和入學方式無關
H1:全校學生居住地區和入學方式有關

帶有瑕疵的數據資料

居住地區和入學方式交叉表(contingency table)

mytable <- xtabs(~ collegedata$地區 + collegedata$入學方式, data = collegedata)

卡方居住地區和入學方式交叉表(contingency table)
卡方居住地區和入學方式交叉表(contingency table)

Pearson’s卡方檢定

chisq.test(mytable)

Pearson's Chi-squared test
Pearson’s Chi-squared test

檢定是跑出來了,可是怎麼有一點怪怪的呢?出現了一個警告訊息

Warning message:
In chisq.test(mytable) : Chi-squared approximation may be incorrect

為什麼呢?

卡方各一個格子,期望值儘量要大於5
卡方各一個格子,期望值儘量要大於5

因為要使用卡方檢定其實有些小細節要注意,像每一個格子的期望值儘量要大於5,期望次數低於5的格子數不能多於20%。

那麼想看看接著該如何處理?

前一篇文章上班族的小確幸,用烘焙DIY打賞自已的味蕾
下一篇文章小資族變身水電工的輕體驗
學經歷 淡江大學資訊管理研究所 諸銘科技軟體發開部經理與教育事業部總監 專長 網路創業、網路行銷、創業貸款、個資保護、資訊安全、程式設計(ASP.NET VB.NET MVC C# Core 6) 資安與個資證照:CompTia Security+ , ISO 27701。 演講與課程經歷 工研院講師 勞動部微型創業鳳凰貸款顧問 台北市社會局 衛福部中央健保署 新北市政府勞工局 管科會 中國生產力中心 中衛中心 中山管理教育基金會 中華軟協 南科產協 青創會 青創會內訓 臺北青年職涯發展中心 經濟部樂活創業人才班 中小企業總會 外貿協會 高雄醫學大學 雲林科技大學 台北醫學大學 銘傳大學 明新科大 中台科大 台灣科技大學 師範大學 大葉大學 台北城市大學 聖約翰科技大學 萬能科技大學 輔英科大 明新科大 美和科大 嘉南藥理大學 東南科大 亞太創意技術學院 格致商工 霧峰農工 三重商工 新店戒護所 台南就業處 台灣知識庫 台北景福扶輪社 富邦人壽 台北國際書展

回覆留言

Please enter your comment!
Please enter your name here