Машинный   фонд   русского   языка -
программа комплексной информатизации исследований в русистике (см.); разработана в нач. 1980-х гг. А. П. Ершовым и Ю. Н. Карауловым; реализуется в Институте русского языка им. В. В. Виноградова РАН. Под комплексной информатизацией научных исследований и прикладных разработок понимается: последовательное оснащение отделов Ин-та рус. языка и организаций-соисполнителей совр. вычислительными машинами с перспективой их объединения в вычислительную сеть; последовательное накопление на машинных носителях и в базах данных главнейших источников, необходимых для научного изучения рус. языка и осуществления прикладных разработок; создание программных средств, необходимых для подготовки научных трудов по филологии и проведения прикладных разработок; развитие прикладных направлений (лексикографии, термино-ведения, автоматической обработки данных на естественном языке) как составной части академической и вузовской русистики, являющихся, с одной стороны, проводником результатов фундаментальных исследований в практику, а с другой -источником  новых  идей и данных для фундаментальной науки. В рамках проекта М.ф. р. я. разрабатываются 9 фондов-составляющих (генеральный словник, словарный, текстовой, грамматический, терминологический, лингвогеографиче-ский, исторический, фонетический и лингвистический программно-источниковый фонды рус. языка) и одна программная система - типовой лингвистический программно-источниковый пакет UNILEX.
Генеральный словник и словарный фонд сосредоточивают в своих базах данных все словари совр. рус. языка. Словарный фонд создаётся одновременно и как информационная система по лексике, и как система автоматизации лексикографических работ. Текстовой фонд— совокупность автоматических конкордансов (словарей особого типа, в к-рых для каждого словарного слова приведены все контексты его употреблений в определённом корпусе текстов) произвольных текстов. Такие конкордансы изготавливаются по мере надобности и хранятся в фонде. Грамматический фонд- информационная система по академическим грамматикам рус. языка. Кроме грамматик, она включает в себя также другие справочные материалы по морфологии, синтаксису и словообразованию. Терминологический фонд- информационная система по совр. научно-технической терминологии. Лингвогеографический фонд включает в себя автоматический вариант «Диалектологического атласа русского языка», а также словарные и текстовые справочные системы по диалектной лексике. Исторический фонд — система автоматизации подготовки к изданию памятников рус. письменности. Ядром фонетического фон-д а является информационная система по фонотеке Ин-та рус. языка. С ней связана система автоматизации фонетических исследований. Лингвистический программн о-и сточниковый фонд включает в себя источники для изучения рус. языка (на машинных носителях) и программные средства для их обработки.
Средствами   комплектации   фондов-составляющих   являются   т. н.   лингвистические   программно-источниковые пакеты, т. е. программные комплексы, управляющие крупными лингвистическими источниками. К ним относятся, напр., автоматические конкордансы, автоматические словари, автоматический вариант «Диалектологического атласа русского языка», информационная система по «Краткой русской грамматике», процессоры рус. языка и другие средства автоматизации и информационного обеспечения лингвистических исследований и разработок.
В 1985-96 в М. ф. р. я. накоплены на машинных носителях и частично в базах данных текстовые источники рус. лит-ры 19-20 вв., главнейшие словари рус. языка, «Краткая русская грамматика» (1989), нек-рые другие материалы справочного характера, созданы текстовые корпусы поэзии, художественной прозы, общественно-политических и технических текстов; разработан программно-источниковый пакет UNILEX для персональных компьютеров, состоящий из 5 подсистем: подсистемы обработки лингвистических данных общего назначения, текстоориентирован-ной подсистемы, словарной подсистемы, телекоммуникативной подсистемы и редакционно-из-дательской подсистемы. Каждая из этих подсистем может использоваться независимо от других.