Two regimes in the frequency of words and the origin of complex lexicons: Zipf's law revisited
Visualitza/Obre
Cita com:
hdl:2117/180381
Tipus de documentArticle
Data publicació2001-08
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Zipf's law states that the frequency of a word is a power function of its rank. The exponent of the power is usually accepted to be close to (-)1. Great deviations between the predicted and real number of different words of a text, disagreements between the predicted and real exponent of the probability density function and statistics on a big corpus, make evident that word frequency as a function of the rank follows two different exponents, ~(-)1 for the first regime and ~(-)2 for the second. The implications of the change in exponents for the metrics of texts and for the origins of complex lexicons are analyzed.
CitacióFerrer-i-Cancho, R.; Solé, R. V. Two regimes in the frequency of words and the origin of complex lexicons: Zipf's law revisited. "Journal of quantitative linguistics", Agost 2001, vol. 8, núm. 3, p. 165-173.
ISSN0929-6174
Versió de l'editorhttps://www.tandfonline.com/doi/abs/10.1076/jqul.8.3.165.4101
Col·leccions
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Ferrer-i-Cancho_and_Sole_JQL_2001.pdf | 269,6Kb | Visualitza/Obre |