Corpus-hizkuntzalaritza

Corpus-hizkuntzalaritza hizkuntza "testu-errealetan" dauden adibideen arabera ikertzeaz arduratzen da. Metodo honek, lengoaia natural bat zuzentzen duten arau multzo abstraktuak inferitzen dituen ikuspegi bat aurkezten du, lengoaia horri dagozkion testuak aztertuz, gainera, lengoaia horrek beste lengoaia batzuekiko dituen harremanak ezartzen saiatzen da. Antzina testu-corpusak eskuz egiten ziren, baina gaur egun prozesu automatiko baten bidez eskuratzen dira gehienetan.

Filologiaren arloan corpusak ahozkoak zein idatzizkoak diren testuak eta hauek biltzen dituzten dokumentuak eratzen dituzte, era berean, testu guztiak behar bezala izan behar dira biltegiratuak. Corpus hauek hizkuntzalaritza aplikatuan erabiltzen diren ereduak osatzen dituzte, bestek beste, ikertzen ari denaren ezaugarriak ikertu eta analizatzeko. Corpus bat, corpus horrekin lortu nahi diren helburuen arabera definitu behar da. 

Corpus-hizkuntzalaritzaren aldekoak uste dute hizkuntzaren analisi fidagarrienak testuinguru natural batean sortzen diren laginen gainean egiten diren analisietan sortzen direla. Corpus-hizkuntzalaritzaren barnean ikuspegi desberdinak daude corpus-etiketatzearen balioari dagokionez, John Sinclairrek[1] adibidez, etiketazte murriztu baten alde egiten du, testuek "beraien kabuz hitz egin dezaten", Survey of English Usage[2] eta beste batzuek etiketatze handiago baten alde egiten duten bitartean, hizkuntzaren ulermena hobetzeko asmoarekin.

  1. Sinclair, J. 'The automatic analysis of corpora', in Svartvik, J. (ed.) Directions in Corpus Linguistics (Proceedings of Nobel Symposium 82). Berlin: Mouton de Gruyter. 1992.
  2. Wallis, S. 'Annotation, Retrieval and Experimentation', in Meurman-Solin, A. & Nurmi, A.A. (ed.) Annotating Variation and Change. Helsinki: Varieng, [University of Helsinki]. 2007.e-Published

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search