Paradacsa Simpson

Ón Vicipéid, an chiclipéid shaor.
Jump to navigation Jump to search

Is paradacsa é Paradacsa Simpson a bhaineann le saobh-comhghaolú (spurious correlation) sa staidreamh agus mí-chruinneas san réasúnaíocht.

Tá ollscoil ann, ina n-éironn níos fearr ag na cailín i ngach dámh, ach ar an iomlán, tá na buachaillí níos fearr. Mar shampla, sa Stair, tá ráta pas, sna scrúdaithe, de 90% ag na cailíní, i gcomparáid le 80% dos na buachaillí. Is mar an gcéanna é sa bhFisic – cailíní (33%) agus buachaillí (10%).

Ag braith ar an eolas sin, tá sé réasúnta a ghlacadh go bhfuil ráta pas na gcailíní san ollscoil (níl ach an dá dhámh Stair agus Fisic ann) níos fearr ná an ráta dos na buachaillí. Ach a mhalairt atá, mar tá ráta pas na mbuachaillí (70%) níos mó ná ráta pas na gcailíní (56%).

Nuair a iniúchaimid na figiúírí i Tábla 1, tá sé soiléir go bhfuil an mhatamaitic ceart agus go raibh dul amú orainn.

Tagann na rátaí pas san ollscoil ón meán ualaithe (weighted mean) mar seo a leanas

   Buachaillí     [600@80% + 100@10%] / [600+100] = 70%
   Cailíní          [200@90% + 300@33%] / [200+300] = 56%.

Is léir ón bhFigiúr go n-iompaíonn na meánrataí idir buachaillí agus cailíní sa chaoi is go bhfuil an ráta do na buachaillí san ardréim.

Tá mí-chrothromaíocht sna ualaigh – an líon is mó de na buachaillí ag dul leis an ráta is mó agus formhór na gcailíní ag dul leis an ráta is lú agus tá bearna an-mhór idir na rátaí pas sa Stair sa don bhFisic. Is rud neamh-ghnáthach é seo. I staidéar [1] ar táblaí (2 x 2 x 2) mar atá anseo, tá dóchúlacht de 1/60 go mbeadh an dáileadh idir na tréithe ionas go sásófaí coinníollacha paradacsa Simpson (faoi choinníollacha áirithe).

Scríobh Edward H. Simpson,[2] faoin ábhar seo i 1951, ach bhí sé ar eolas ag staitisteoirí roimhe sin. Mar shampla Karl Pearson, et al., i 1899, [3] agus Udny Yule, in 1903[4] .

Fig. 1 Paradacsa Simpson
Tábla 1: Paradacsa Simpson
Dámh Scrúdú Buachaillí Cailíni
Stair Pas 480 180
Teip 120 20
Pas+Teip 600 200
Ráta Pas 80% 90%
Fisic Pas 10 100
Teip 90 200
Pas+Teip 100 300
Ráta Pas 10% 33%
Stair + Fisic Pas 490 280
Teip 210 220
Pas+Teip 700 500
Ráta Pas 70% 56%


Tagairtí[cuir in eagar | athraigh foinse]

  1. Marios G. Pavlides and Michael D. Perlman (August 2009). "How Likely is Simpson’s Paradox?". The American Statistician 63 (3): 226–233. doi:10.1198/tast.2009.09007. 
  2. Simpson, Edward H. (1951). "The Interpretation of Interaction in Contingency Tables". Journal of the Royal Statistical Society, Ser. B 13: 238–241. 
  3. "Genetic (reproductive) selection: Inheritance of fertility in man" (1899). Philosophical Translations of the Royal Statistical Society, Ser. A 173: 534–539. 
  4. G. U. Yule (1903). "Notes on the Theory of Association of Attributes in Statistics". Biometrika 2: 121–134. doi:10.1093/biomet/2.2.121.