•  
  •  
 

e-Scripta Romanica

Title

In search of the spoken word in Spanish written diachronic corpora: A comparison with English corpora

Spanish Title

En busca de lo hablado en lo escrito en los corpus diacrónicos del español: una comparativa con los corpus anglosajones

Abstract

The present work analyses the diachronic corpora of Spanish available to date, paying especial attention to the scarce representation of the spoken language in them. Although it is true that the creation of diachronic corpora of Spanish has progressed significantly over the last forty years, there is still room for improvement, especially as regards peninsular Spanish, as well as the inclusion of documents that allow diatopic, diaphasic and diastratic analyses from the diachronic perspective. This piece of research provides data from three English diachronic corpora along these lines, which might be taken as a point of departure for the creation of similar tools in Spanish.

Spanish Abstract

El presente trabajo indaga en los corpus diacrónicos del español disponibles hasta la fecha, prestando especial atención a la escasa representación en los mismos de textos que se aproximan al plano oral. Si bien es cierto que la creación de corpus diacrónicos del español ha avanzado significativamente durante los últimos cuarenta años, todavía hay cabida para mejoras, especialmente en el ámbito del español peninsular y en lo que se refiere a la inclusión de textos que permitan estudios de las variedades diatópicas, diafásicas y diastráticas desde la perspectiva diacrónica. Esta investigación ofrece además datos sobre tres corpus diacrónicos en lengua inglesa centrados en esta línea, que se podrían tomar como modelo para la creación de herramientas similares para el español.

Keywords

diachronic corpora of Spanish, diachronic corpora of English, spokenness, writtenness, colloquial language

Spanish Keywords

corpus diacrónicos del español, corpus diacrónicos del inglés, oralidad, escrituralidad, habla coloquial

References

ANDERSON, H. & I. EHRENPREIS (1966): “The familiar letter in the eighteenth century: Some generalizations”. The familiar letter in the eighteenth century. H. ANDERSON, P. B. DAGHLIAN & I. EHRENPREIS (eds.). Lawrence: University of Kansas Press, pp. 269-282.

AUSTIN, F. (1998): “Epistolary conventions in The Clift Family Correspondence”. A reader in Early Modern English. M. RYDÉN, I. TIEKEN-BOON VAN OSTADE & M. KYTÖ (eds.). Frankfurt am Main: Peter Lang, pp. 319-347.

ARCHER = A Representative Corpus of Historical English Registers 3.1. 1990-1993/2002/2007/2010. Compilado bajo la supervision de Douglas Biber y Edward Finegan (Northern Arizona University and University of Southern California). Modificado y expandido por el consorcio de universidades que comprende las siguientes: Northern Arizona, Southern California, Freiburg, Heidelberg, Helsinki, Uppsala, Michigan, Manchester, Lancaster, Bamberg, Zurich, Trier, Salford y Santiago de Compostela. Web oficial: http://www.alc.manchester.ac.uk/subjects/lel/research/projects/archer/

BIBER, D. (1988): Variation across speech and writing. Cambridge: Cambridge University Press.

BIBER, D. (2001): “Dimensions of variation among eighteenth-century speechbased and written registers”. Towards a history of English as a history of genres. H. DILLER, & M. GÖRLACH (eds.). Heidelberg: Universitätsverlag C. Winter, pp. 89-109.

BIBER, D. & E. FINEGAN (1988): “Drift in three English genres from the eighteenth to the twentieth centuries: A multidimensional approach”. Corpus linguistics, hard and soft. Proceedings of the 8th International Conference on English Language Research on Computerized Corpora. K. MERJA, O. IHALAINEN & M. RISSANEN (eds.). Amsterdam: Rodopi, pp. 83-101.

BIBER, D. & E. FINEGAN (1989): “Drift and the evolution of English style: A history of three genres”. Language, 65,3, pp. 487-517.

BIBER, D. & E. FINEGAN (1992): “The linguistic evolution of five written and speech-based genres from the seventeenth to the twentieth centuries”. History of Englishes: New methods and interpretations in historical linguistics. M. RISSANEN, O. IHALAINEN, T. NEVALAINEN & I. TAAVITSAINEN (eds.). Berlin y New York: Mouton de Gruyter, pp. 688-704.

BIBER, D. & E. FINEGAN (1997): “Diachronic relations among speech-based and written registers in English”. To explain the present: Studies in the changing English language in honour of Matti Rissanen. T. NEVALAINEN & L. KAHLAS-TARKKA, (eds.). Helsinki: Société Néophilologique, pp. 253-275.

BRIZ, A. Y M. ALBELDA (2009): “Estado actual de los corpus de lengua española hablada y escrita: I+D”. El español en el mundo. Anuario del Instituto Cervantes 2009. Madrid: Instituto Cervantes, pp. 165-226.

BUSTOS TOVAR, J. J. de. (2001): “De la oralidad a la escritura en la transición de la Edad Media al Renacimiento: la textualización del diálogo conversacional”. Criticón, 81- 82, pp. 191-206.

CALDERÓN CAMPOS, M. (2015): El español del reino de Granada en sus documentos (1492-1833). Oralidad y escritura. Bern: Peter Lang.

CALDERÓN CAMPOS, M. & M. T. GARCÍA-GODOY (2015): Corpus Diacrónico del Español del Reino de Granada. 1492-1833. En línea en http://www.corderegra.es.

CANO AGUILAR, R. (1996): “Lenguaje ‘espontáneo’ y retórica epistolar en cartas de emigrantes españoles a Indias”. El español hablado y la cultura oral en España e Hispanoamérica. T. KOTSCHI, W. OESTERREICHER & K. ZIMMERMANN (eds.). Madrid: Iberoamericana Vervuert, pp. 375-404.

CONTRERAS SEITZ, M. (2009): “Hacia la construcción de un Corpus Diacrónico del Español del Chile”. RLA, Revista de Lingüística Teórica y Aplicada, 47,2, pp. 111-134.

CULPEPER, J. & M. KYTÖ (1997): “Towards a corpus of dialogues, 1550-1750”. Language in time and space. Studies in honour of Wolfgang Viereck on the occasion of his 60th birthday. H. RAMISCH, & K. WYNNE (eds.). Stuttgart: Franz Steiner Verlag, pp. 60-73.

CULPEPER, J. & M. KYTÖ (2000): “Data in historical pragmatics: Spoken interaction (re)cast as writing”. Journal of Historical Pragmatics, 1,2, pp. 175-199.

CULPEPER, J. & M. KYTÖ (2010): Early Modern English dialogues. Spoken interaction as writing. Cambridge: Cambridge University Press.

DAVIES, M. (2002a): Corpus del Español: 100 million words, 1200s-1900s. En línea en http://www.corpusdelespanol.org.

DAVIES, M. (2002b): “Un corpus anotado de 100.000.000 palabras del español histórico y moderno”. Procesamiento del Lenguaje Natural, 29, pp. 21-27.

ELPASS, S. (2012): The use of private letters and diaries in sociolinguistic investigation. The handbook of historical sociolinguistics. J. M. HERNÁNDEZ-CAMPOY & J. C. CONDE-SILVESTRE (eds.). Oxford: Wiley-Blackwell, pp. 157-168.

ENRIQUE-ARIAS, A. (2009): “Introducción lingüística de corpus y diacronía de las lenguas iberorrománicas”. Diacronía de las lenguas iberorrománicas: nuevas aportaciones desde la lingüística de corpus. A. ENRIQUE ARIAS (ed.). Madrid y Frankfurt: Iberoamericana Vervuert, pp. 11-24.

ENRIQUE-ARIAS, A. (2012): “Biblia medieval: diseño y aplicaciones de un corpus paralelo y alineado del español medieval”. Actas del VIII Congreso Internacional de Historia de la Lengua española: Santiago de Compostela, 14-18 de septiembre de 2009. Vol. I. E. MONTERO CARTELLE Y C. MANZANO ROVIRA (eds.). Santiago de Compostela: Universidad de Santiago de Compostela, pp. 421-432.

FIRTH, J. R. (1951): Papers in linguistics, 1934-1951. Oxford: Oxford University Press.

FRIES, C. C. (1952): The structure of English: An introduction to the construction of English sentences. New York: Harcourt Brace.

GARCÍA-SALIDO, M. & V. VÁZQUEZ-ROZAS (2012): “Los corpus diacrónicos como instrumento para el estudio del origen y distribución de la concordancia de objeto en español”. Scriptum Digital, 1, pp. 67-84.

GRUND, P. (2007): “From tongue to text: The transmission of the Salem witchcraft examination records”. American Speech, 82, 2, pp. 119-150.

HUBER, M. (2007): “The Old Bailey Proceedings, 1764-1834. Evaluating and annotating a corpus of 18th- and 19th-century spoken English”. Annotating variation and change (Studies in Variation, Contacts and Change in English 1). A. MEURMAN-SOLIN & A. NURMI (eds.). Helsinki: University of Helsinki. Disponible en línea: http://www.helsinki.fi/varieng/series/volumes/01/huber/ (fecha de acceso 17/03/2016).

HUBER, M., M. NISSEL, P. MAIWALD & B. WIDLITZKI (2012): The Old Bailey Corpus. Spoken English in the 18th and 19th centuries. Disponible en línea: www.uni-giessen.de/oldbaileycorpus.

KÄDING, F. W. (1897): Häufigkeitswörterbuch der deutschen Sprache. Festgestellt durch einen Arbeitsausschuß der deutschen Stenographie-Systeme. Steglitz: no public.

KOCH, P. (1999): “Court records and cartoons: Reflections of spontaneous dialogue in early Romance texts”. Historical dialogue analysis. A. JUCKER, G. FRITZ Y F. LEBSANFT (eds.). Amsterdam y Philadelphia: John Benjamins, pp. 399-429.

KOCH, P. Y OESTERREICHER, W. (1985): “Sprache der Nähe? Sprache der Distanz. Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte”. Romanistisches Jahrbuch, 36, pp. 15-43.

KOCH, P. Y OESTERREICHER, W. (1990): Gesprochene Sprache in der Romania: Französisch, Italienisch, Spanisch. Tubinga: Niemeyer.

KYTÖ, M. Y CULPEPER, J. (2006): Corpus of English Dialogues 1560–1760.

KYTÖ, M. Y WALKER, T. (2006): “Guide to A Corpus of English Dialogues 1560-1760”. Studia Anglistica Upsaliensia /Acta Universitatis Upsaliensis,130.

LAITINEN, M. (2007): Agreement patterns in English: Diachronic corpus studies on common-number pronouns. (Mémoires de la Société Néophilologique, 71). Helsinki: Société Néophilologique.

LAVOB, W. (1994): Principles of linguistic change: Internal factors. Oxford: Blackwell.

LEECH, G. (1992): “Corpora and theories of linguistic performance”. Directions in corpus linguistics. Proceedings of Nobel Symposium 82, Stockholm, 4-8 August 1991. J. SVARTVIK (ed.). Berlín: De Gruyter, pp. 105-134.

LÓPEZ SERENA, A. (2007): Oralidad y escrituralidad en la recreación literaria del español coloquial. Madrid: Gredos.

MARCOS MARÍN, F. A. (1994): Informática y humanidades. Madrid: Gredos.

NARBONA JIMÉNEZ, A. (1989): Sintaxis española: nuevos y viejos enfoques. Barcelona: Ariel.

NEVALA, M. (2004): Address in Early English correspondence. Its forms and sociopragmatic functions. (Mémoires de la Société Néophilologique de Helsinki 64). Helsinki: Société Néophilologique.

NEVALAINEN, T. (2001): “Continental conventions in Early English correspondence”. Towards a history of English as a history of genres. En H. Diller & M. Görlach (eds.). Heidelberg: Universitätsverlag C. Winter, pp. 203-225.

NEVALAINEN, T. & H. RAUMOLIN-BRUNBERG (2003): Historical sociolinguistics: Language change in Tudor and Stuart England. London: Pearson Education.

NEVALAINEN, T., H. RAUMOLIN-BRUNBERG, J. KERÄNEN, M. NEVALA, A. NURMI & M. PALANDER-COLLIN (1998): Corpus of Early English Correspondence. Department of Modern Languages, University of Helsinki.

NURMI, A. (1999): A social history of periphrastic DO. (Mémoires de la Société Néophilologique de Helsinki, 56). Helsinki: Société Néophilologique.

OESTERREICHER, W. (1996): “Lo hablado en lo escrito”. El español hablado y la cultura oral en España e Hispanoamérica. T. KOTSCHI, W. OESTERREICHER & K. ZIMMERMANN (eds.). Madrid: Iberoamericana Vervuert, pp. 317-340.

OESTERREICHER, W. (2004): Textos entre inmediatez y distancia comunicativas. El problema de lo hablado escrito en el Siglo de Oro. Historia de la lengua española. R. CANO (ed.). Barcelona: Ariel, pp. 729-769.

PALANDER-COLLIN, M. (1999): “Male and female styles in seventeenth-century correspondence: I THINK”. Language Variation and Change, 11, pp. 123-141.

REAL ACADEMIA ESPAÑOLA: Banco de datos (CORDE) [en línea]. Corpus diacrónico del español. http://www.rae.es

REAL ACADEMIA ESPAÑOLA: Banco de datos (CREA) [en línea]. Corpus de referencia del español actual. http://www.rae.es

RISSANEN, M. (1989): “Three problems connected with the use of diachronic corpora”. ICAME Journal, 13, pp. 16-19.

RISSANEN, M. (1999): “Syntax”. The Cambridge history of the English language. R. LASS (ed.). Cambridge: Cambridge University Press, pp. 187-331.

ROJO, G. (2015): Sobre los antecedentes de la lingüística de corpus. Studium grammaticae. Homenaje al Profesor José Antonio Martínez. A. ÁLVAREZ MENÉNDEZ et alii (eds.). Oviedo: Universidad de Oviedo, pp. 675-689.

ROJO, G. (2016): “Los corpus textuales del español”. Enciclopedia lingüística hispánica. J. GUTIÉRREZ-REXACH (ed.). Oxon: Routledge, pp. 285-296.

ROJO, G. (en prensa): “Citius, maius, melius: del CREA al CORPES XXI”. Lingüística de corpus y lingüística histórica iberorrománica. J. KABATEK (ed.). Berlín: de Gruyter.

SÁNCHEZ-PRIETO, B., F. PAREDES-GARCÍA, R. MARTÍNEZ-SÁNCHEZ, R. MIGUEL-FRANCO, M. SIMÓN-PARRA & I. VICENTE-MIGUEL (2009): “El Corpus de Documentos Españoles anteriores a 1700 (CODEA)”. Diacronía de las lenguas iberorrománicas: nuevas aportaciones desde la lingüística de corpus. A. ENRIQUE ARIAS (ed.). Madrid y Frankfurt am Main: Iberoamericana, pp. 25-38.

STOLL, E. (1996): “Competencia escrita de impronta oral en la crónica soldadesca de Pedro Pizarro”. El español hablado y la cultura oral en España e Hispanoamérica. T. Kotschi, W. Oesterreicher & K. Zimmermann (eds.). Madrid: Iberoamericana Vervuert, pp. 427-446.

TIEKEN-BOON VAN OSTADE, I. (2005): “Eighteenth-century English letters: In search of the vernacular”. Linguistica e Filologia, 21, pp. 113-146.

VAAMONDE, G. (2015): “P.S: Post Scriptum: dos corpus diacrónicos de escritura cotidiana”. Procesamiento del Lenguaje Natural, 55, pp.57-64.

YÁÑEZ-BOUZA, N. (2015): “Have you ever written a diary or a journal? Diurnal prose and register variation”. Neuphilologische Mitteilungen, 116,2, pp. 639-664.

First Page

89

Last Page

127

Language

spa

Share

COinS