•  
  •  
 

Acta Universitatis Lodziensis. Kształcenie Polonistyczne Cudzoziemców

Polish Title

Długość przeciętnego polskiego wyrazu w tekstach pisanych w świetle analizy korpusowej

Author ORCID Identifier

https://orcid.org/0000-0002-2037-0469 Moździerz Tomasz

Abstract

Considering the fact that words vary in length within a language and between different languages the author has conducted the research, inspired by Carver’s model of a standard-length word, to answer the question: What is the average length of a Polish word? To achieve that goal, ninety samples, a 1000-words-long each, drawn from the National Corpora of Polish Language have been examined. The texts belonged to different genres and had different publication channel. The average length of a Polish word was established to be 6 characters. Using that value, the number of average words (AV) has been calculated for each analyzed sample. The number of actual words has been juxtaposed with the number of AV. The procedure made possible to reject the null hypothesis and validate the new unit of text measurement. In the last part of the article a number of possible uses of the new concept have been enumerated.

Polish Abstract

W niniejszym artykule podjęto próbę znalezienia odpowiedzi na pytanie: Jak długi jest przeciętny polski wyraz? W tym celu w trakcie dwóch badań przeanalizowano 90 próbek tekstów zaczerpniętych z Narodowego Korpusu Języka Polskiego zawierających po 1000 słów W czasie badań kontrolowano średnią liczbę znaków w każdej próbce, jak również medianę liczby znaków na wyraz. Uzyskane wyniki pozwoliły na określenie długości przeciętnego polskiego wyrazu (PW), która wynosi 6 znaków. Przeliczono też liczbę znaków we wszystkich próbkach i ujęto ją za pomocą PW, porównując długość tekstu wyrażoną słowami faktycznymi i przeciętnymi. Zastosowane procedury statystyczne umożliwiły odrzucenie hipotezy zerowej o braku różnicy między użyciem wyrazów konkretnych, a PW jako miary długości tekstu. W podsumowaniu przedstawiono możliwe zastosowania tego modelu dla celów (glotto)dydaktycznych.

Keywords

Polish language, applied linguistics, language learning/teaching, average length Polish word

Polish Keywords

język polski, glottodydaktyka, słownictwo, przeciętne słowo, trudność tekstu

References

Alderson J., 2000, Assessing Reading, Cambridge.

Andersen S., 2002, Speakers´s information content: length-frequency correlation as partial correlation, “Glottometrica”, nr 3, s. 90–109.

Broda B., Ogrodniczuk M., Nitoń B., Gruszczyński W., 2014, Measuring Readibility of Polish Texts: Baseline Experiments, w: N. Calzolari i in. (red.), Materiały z konferencji LREC 2014 (9th International Conference on Language Resources and Evaluation, Rejkiawik, 26–31 maja 2014), Rejkiavik, s. 573–580.

Brysbaert M., 2019, How many words do we read per minute? A review and meta-analysis of reading rate, [online], https://psyarxiv.com/xynwg/ [29.05.2020]

Carver R.P., 1972, Evidence for the invalidity of the Miller-Coleman Readability Scale, „Journal of Reading Behavior”, nr 4(3), s. 42–47.

Carver R.P., 1976, Word Length, Prose Difficulty and Reading Rate, „Journal of Reading Behavior”, nr 8(2), s. 193–204.

Carver R.P., 1977–1978, Toward a Theory of Reading Comprehension and Rauding, „Reading Research Quarterly”, nr 13(1), s. 8–63.

Carver R.P., 1982, Optimal rate of reading prose, „Reading Research Quarterly”, nr 18(1), s. 56–88.

Carver R.P., 1983, Is reading rate constant or flexible?, „Reading Research Quarterly”, nr 18(2), s. 190–215.

Charzyńska E., Dębowski Ł., 2015, Empirical verification of the Polish formula of text difficulty, „Cognitive Studies”, nr 15, s. 125–132, https://doi.org/10.11649/cs.2015.010

Cooper C.R., Petrosky A.R., 1976, A Psycholinguistic View of the Fluent Reading, „Journal of Reading”, nr 20(3), s. 184–207.

Defrancis J., 1996, Graphemic indeterminacy in writing systems, „Word”, nr 477(3), s. 365–377, https://doi.org/10.1080/00437956.1996.11432455

De Saussure F., 1961, Kurs językoznawstwa ogólnego, Warszawa.

Dębowski Ł., Nitoń B., Broda B., Charzyńska E., 2015, Jasnopis – A Program to Compute Readibility of Texts in Polish based on Psycholinguistic Research, w: B. Sharp, W. Lubaszewski, R. Delmonte (red.), Natural Language Processing and Cognitive Science, Proceedings 2015, Kraków, s. 51–61.

DuBay W.H., 2004, The Principles of Readability [online], https://eric.ed.gov/?id=ED490073 [11.05.2020]

Ellis N.C., 2002, Frequency Effects in Language Processing: A Review with Implications for Theories of Implicit and Explicit Language Acquisition, „Studies in Second Language Acquisition”, nr 24(2), s. 143–188, https://doi.org/10.1017/S0272263102002024

Górski R.L., 2012, Zastosowanie korpusów w badaniu gramatyki, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 291–301.

Górski R.L., Łaziński M., 2012, Reprezentatywność i zrównoważenie korpusu, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 25–37.

Grabe W., 1991, Current Developments in Second Language Reading Research, „TESOL Quarterly”, nr 25(3), s. 357–406.

Grabe W., 2009, Reading in a Second Language, Cambridge.

Gruszczyński W. i in., 2015, Measuring Readability of Polish Texts, w: Z. Vetulani, J. Mariani (red.), Materiały Konferencji LTC 2015 (7th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, Poznań, 27–29 listopada 2015), Poznań, s. 445–449.

Huey E.B., 1908, The Psychology and Pedagogy of Reading, New York.

Juel C., Minden-Cupp C., 2000, Learning to read words: Linguistic units and instructional strategies, „Reading Research Quarterly”, nr 35(4), s. 458–492.

Kuhn M., Schwanenflugel P., Meisinger E., 2010, Aligning Theory and Assessment of Reading Fluency: Automaticity, Prosody, and Definitions of Fluency, „Reading Research Quarterly”, nr 45(2), s. 230–251.

Lado, R., 1955, Patterns of Difficulty in Vocabulary, „Language Learning”, nr 6(1), s. 23–41, https://doi.org/10.1111/j.1467-1770.1955.tb00829.x

Laufer B., 1990, Why Some Words are More Difficult Than Others, „IRAL”, nr 28(4), s. 293–307, https://doi.org/10.1515/iral.1990.28.4.293

Lewandowska-Tomaszczyk B., 2011, Nowe wyzwania w jakościowej i ilościowej metodologii analizy języka, „Biuletyn Polskiego Towarzystwa Językoznawczego”, nr 67, s. 141–165.

Lewandowska-Tomaszczyk B. i in., 2012, Narodowy Korpus Języka Polskiego: geneza i dzień dzisiejszy, w: A. Przepiórkowski, M. Bańko, R.L. Górski, B. Lewandowska-Tomaszczyk (red.), Narodowy Korpus Języka Polskiego, Warszawa, s. 3–9.

Perfetti C., 2007, Reading Ability: Lexical Quality to Comprehension, „Scientific Studies of Reading”, nr 11(4), s. 357–383, https://doi.org/10.1080/10888430701530730

Piekot T., Zarzeczny G., Moroń E., 2019, Standard „plain language” w polskiej sferze publicznej, w: M. Zaśko-Zielińska, K. Kredens (red.), Lingwistyka kryminalistyczna. Teoria i praktyka, Wrocław, s. 197–214.

Ratner N.B., Berko Gleason J., Narasimhan B., 2005, Wprowadzenie do psycholingwistyki – wiedza użytkowników języka, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 15–60.

Reeves L.M., Hirsch-Pasek K., Golinkoff R., 2005, Słowa i znaczenia – od pojęć pierwotnych do złożonych struktur, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 173–240.

Rey A., Ziegler J.C., Jacobs A.M., 2000, Graphemes are perceptual reading units, „Cognition”, nr 75(1), s. 1–12, https://doi.org/10.1016/S0010-0277(99)00078-5

Seidenberg M., 2017, Language at the speed of sight: How we read, why so many can’t, and what can be done about it, Nowy Jork.

Seretny A., 2006, Wskaźnik czytelności tekstu jako pomoc w określaniu stopnia jego trudności, „Ling-Varia”, nr 2(2), s. 87–98.

Seretny A., 2011, Kompetencja leksykalna uczących się języka polskiego jako obcego w świetle badań ilościowych, Kraków.

Seretny A., 2016, Stopień trudności słowa w perspektywie glottodydaktycznej, „Języki Obce w Szkole”, nr 60(1), s. 18–25.

Sigurd B., Eeg-Olofsson M., van de Weijer J., 2004, Word Length, Sentence Length and Frequency – Zipf Revisited, „Studia Linguistica”, nr 58(1), s. 37–52.

Taylor S.E., 1965, Eye Movements in Reading: Facts and Fallacies, „American Educational Research Journal”, nr 2(4), s. 187–202.

Wolf M., Vellutino F., Berko Gleason J., 2005, Psycholingwistyczna analiza czynności czytania, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 439–477.

Wyllys R., 1981, Empirical and Theoretical Bases of Zipf’s Law, „Library Trends”, nr 30(1), s. 53–64.

Yeni-Koshian G., 2005, Percepcja mowy, w: J. Berko Gleason, N.B. Ratner (red.), Psycholingwistyka, Gdańsk, s. 121–173.

http://certyfikatpolski.pl/o-egzaminie/przykladowe-testy-zbiory-zadan/ [08.05.2020].

https://cke.gov.pl/egzamin-osmoklasisty/arkusze/2019-2 [09.05.2020].

http://nkjp.pl/ [07.05.2020].

First Page

177

Last Page

192

Language

pol

Share

COinS