Dlí Zipf

Ón Vicipéid, an chiclipéid shaor.

Is éard is Dlí Zipf ann ná dlí eimpíreach foirmlithe trí bhaint a úsáid as staidreamh mhatamaiticiúil, tagraíonn sé don bhfíric gur féidir le cuid mhaith cineálacha shonraí sna heolaíochtaí fisiceacha agus sóisialta a chomhfhogasú leis an dáileachán a fhaightear i nDlí Zipf, atá neasghaolta le dóchúlacht cumhachta de dhlí na cumhachta. Tá an dlí ainmnithe i ndiaidh an teangeolaí George Kingsley Zipf a chéad mhol é (Zipf 1935, 1949), cé go bhfuil fianaise ann gur thug J.B. Estoup an rialtacht faoi deara roimh Zipf.

Minicíocht na bhfocal, i rang-ord, sa leagan bunaidh de Ulysses le James Joyce.

Inspreagadh[cuir in eagar | athraigh foinse]

Deir Dlí Zipf go mbíonn minicíocht focal ar bith i gcorpas teanga nádúrtha i gcomhréir contrártha len a rang nó a ord i dtábla minicíochta. Dá bhrí sin, tarlóidh an focal is minice thart ar dhá uair níos mó ná an dara fhocal is minice, a tharlóidh dhá uair chomh minic agus an ceathrú focal is minice, srl. Ag baint úsáide as Dlí Zipf, rinneadh anailís ar obair Ulysses le James Joyce, fuarthas amach gur tharla an focal;

  • is coitianta 8,000 uair;
  • an deichiú focal 800 uair;
  • an céadú focal, 80 uair;
  • Agus an míliú focal, 8 n-uaire.


Is iomaí modh agus teoiric ata ann le teanga a theagasc. Ar cheann acu tá ceachtanna agus ábhar teagaisc a bhunú ar na focail is coitianta a úsáidtear sa teanga. Rinne an tAthair Colmán Ó hUllacháin agus a chomhghleacaithe i dTeanglann Rinn Mhic Gormáin taighde ceannródaíocht ar an ghné seo den Ghaeilge sna seascaidí. Foilsíodh torthaí an taighde sin i 'Buntús Gaeilge' (An Roinn Oideachais 1966) . D'fhoilsigh 'Breacadh', eagraíocht a bunaíodh sa bhliain 20000 le tacaíocht a thabhairt do Chóistí Gairmoideachais a gcuid seirbhísí do dhaoine fásta a chur ar fail trí Ghaeilge sa Ghaeltacht, 'Líostaí Bhreachadh'. Is éard is 'Líostaí Bhreachadh' na leabhar ina bhfuil liostaí na bhfocal is coitianta sa teanga bailithe le chéile in ord minicíochta. Tá na focail is coitianta ón nuachtán 'Lá', agus an nuachtán 'Foinse' luaite sa tionscnamh seo. As 200,000 focal i 'Foinse' bhí 11,907 (circa) focail éagsúil ón a chéile. Tharla an 100 focal is coitianta 51.4% uair, an 200 focal is coitianta 60.02%, an 300 is coitianta 65.04% an 400 is coitianta 68.53% agus an 500 focal is coitianta 71.16% uair. Seo a leanas liosta na bhfocal ó 1 go 10 is minicí;

Suíomh Focal
1 an
2 a
3 ar
4 na
5 i
6 agus
7 ag
8 go
9 le
10