Лингвистическая статистика, л и н г востатистика, - 1) в широком смысле - область применения статистических методов в языкознании (то есть опирающихся на математическую статистику подсчётов и измерений при изучении языка и речи); 2) в узком смысле -изучение нек-рых математических проблем, связанных с лингвистическим материалом, гл. обр. с типами статистических распределений языковых единиц в тексте. Наиболее распространён метод анализа, основанный на т. н. законе Ципфа, сводящемся к уравнению вида: Fxi=const, где F -частота слова в частотном словаре, a i - ранг этого слова, т. е. номер в списке слов, упорядоченном по уменьшающейся частоте. С поправочными коэффициентами Б. Мандельброта закон подтверждается на многих и разнообразных текстах. Т.о., закон Ципфа выступает как модель описания распределения слов по частоте, однако вводимые на каждый случай поправочные коэффициенты в значительной мере лишают его предсказательной силы. Существуют и другие подобные модели (работы Г. Хердана, Дж. Б. Кэрролла). Проблема связи частоты слова и его ранга смыкается с проблемой оценки лексического богатства текста или совокупности текстов. Обычно Л. с. рассматривается как лингвистическая дисциплина, однако, будучи связанной с языкознанием по материалу, она ещё не наполнилась собственно лингвистическим содержанием. В частности, лингвистическая интерпретация закона Ципфа остаётся предметом дискуссий.