Jump to content

Corpas téacs

Ón Vicipéid, an chiclipéid shaor.

Is éard is corpas teanga ann ná sraith leathan, struchtúrtha de shamplaí ón bhfíorshaol d'úsáid teanga. Is féidir na samplaí seo a fháil ó théacsanna scríofa (na cinn is coitianta), nó ó shamplaí béil (tras - scríofa de ghnáth ). [1] Is féidir le corpais a bheith téacsúil, nuair a bhíonn téacsanna ó bhéal nó scríofa á dtiomsú, nó ó thagairt, nuair a thaifeadann siad comhchordachtaí a bhaintear as téacsanna. Sa Spáinnis, sampla de chorpas tagartha é an Corpus Básico del Español de Chile . [2]

Corpus Diacrónico del Español (CORDE) (Corpas na Spáinnise).

Is éard is corpas teanga ann ná sraith réasúnta mór téacsanna, a cruthaíodh go neamhspleách ar a bhfoirmeacha nó a n-úsáidí féideartha. Is é sin le rá, ó thaobh a struchtúir, a éagsúlachta agus a chastachta de, ní mór do chorpas teanga, nó a modhanna, a léiriú chomh cruinn agus is féidir; ó thaobh a húsáide de, ní mór dó a chinntiú go bhfuil a léiriú fíor. Tá cosúlachtaí ag corpais le téacsanna toisc go bhfuil siad comhdhéanta díobh, ar an láimh eile, ní téacsanna iontu féin iad, mar murab ionann agus iad, ní fiú anailís a dhéanamh orthu ina n-iomláine. Tá tús agus deireadh le téacs, agus tá sé comhtháite agus ciallmhar go pointe níos mó nó níos lú, agus níl saintréithe den sórt sin ag corpas toisc nach bhfuil struchtúr aige, ach comhdhéanamh amháin. Ar an ábhar sin, moltar anailís a dhéanamh ar chorpas ag baint úsáide as ár n-uirlisí agus modheolaíocht féin.

Mar gheall ar a mhéid, a n-inrochtaineacht, a n-eolas teangeolaíoch agus ciclipéideach, iontaofacht an-ard agus tréithe eile, tá tiomsú na gcorpas ar cheann de na príomh-mhodhanna agus uirlisí taighde teanga sa teangeolaíocht, murab é an príomhodh. [3]

Spreag an gá atá leis na samplaí a bailíodh go héifeachtúil agus go heacnamaíoch a phróiseáil (ag cura a méid ollmhór san áireamh), forbairt ar cheann de na brainsí is bisiúla den teangeolaíocht chomhaimseartha: an teangeolaíocht ríomhaireachtúil. Faoi láthair, bailítear agus stóráiltear na corpais go leictreonach..

Naisc sheachtracha

[cuir in eagar | athraigh foinse]
  1. Werner (1985). "Lingüística Moderna: Terminología y Bibliografía" (in Español). Madrid: Gredos. ISBN 84-249-1005-2. 
  2. Castillo Fadić (2020-12-21). "Corpus Básico del Español de Chile ©: metodología de procesamiento y análisis". Lexis 44 (2): 483–523. doi:10.18800/lexis.202002.004. ISSN 0254-9239. Dáta rochtana: 2021-03-08. 
  3. Jurgita Mikelionienė. “KOMPIUTERINĖ LINGVISTIKA. Palyginamojo tekstyno kūrimo principai, problemos ir panaudojimo galimybės.”. STUDIES ABOUT LANGUAGES. 2002. NO. 3. Dáta rochtana: 7 de abril de 2015.