Выбрать главу

Методы статистического анализа исторических текстов (часть 1)

Геродот, рассказывая о строительстве пирамид, отмечает: «Сколько же денег пошло на железные орудия» [78, кн. 2, № 125].

Современный комментарий: «Во времена Хеопса, т. е. в первой половине III тысячелетия до н. э., египтяне пользовались только медными орудиями» [76, с. 34, коммент. 18].

Предисловие А.Н. Ширяева

(К первому изданию книги «Методы статистического анализа нарративных текстов и приложения к хронологии» в 1990 году)

Сегодня методы прикладной статистики проникают в самые различные области знания, в том числе и в задачи изучения текстов различной природы. При этом под «текстом» могут пониматься последовательности сигналов того или иного типа, длинные коды, возникающие в генетике, графические изображения (которые можно закодировать и представить в виде «текста»), а также и реальные нарративные тексты (например, исторические хроники, первоисточники, документы и т. п.)

Одна из важных возникающих здесь задач состоит в распознавании зависимых текстов, т. е. «похожих» текстов, имеющих в некотором смысле общую природу, общее происхождение. Например, в задаче распознавания образов важно обнаружить среди большой совокупности «изображений» такое, которое максимально «близко» к заранее заданному: в задаче изучения длинных последовательностей сигналов важно уметь обнаруживать «однородные подпоследовательности» и места их стыковок. Сюда относится, в частности, и известная задача о разладке, решению которой в математической статистике, статистике случайных процессов уделяется большое внимание.

Применительно к проблемам изучения нарративных текстов задача распознавания зависимых и независимых текстов (например, хроник) звучит как задача поиска текстов, восходящих, например, к одному общему первоисточнику, оригиналу (такие тексты естественно назвать зависимыми), или, напротив, восходящих к существенно разным первоисточникам (такие тексты естественно назвать независимыми). Ясно, что задачи этого типа чрезвычайно сложны и поэтому следует приветствовать появление новых эмпирико-статистических методов распознавания, которые, в совокупности с классическими подходами могут быть полезны в конкретных исследованиях (например, источниковедческих).

Настоящая книга профессора чистой математики А.Т. Фоменко ориентирована, в основном, на разработку таких новых методов применительно к проблеме распознавания зависимых и независимых нарративных текстов и для их датировки (по отношению к текстам с заранее известной достоверной датировкой).

Автор книги предлагает новый подход к задаче распознавания зависимых и независимых нарративных (исторических) текстов на основе нескольких новых эмпирико-статистических моделей (закономерностей), обнаруженных им в результате обширных статистических экспериментов с различными количественными характеристиками конкретных текстов, хроник, первоисточников и т. п. Проверка этих моделей (статистических гипотез) на конкретном материале хроник подтвердила эффективность моделей и позволила предложить новые методы датировки текстов (а точнее, описываемых в этих текстах событий).

Предлагаемый А.Т. Фоменко подход нестандартен и требует от читателя известного внимания и трудолюбия, чтобы освоиться с новыми и возможно непривычными логическими построениями. В то же время основные идеи автора воспринимаются вполне естественно с точки зрения современной математической статистики и легко вписываются в систему мышления специалистов по прикладной статистике.

Полученные автором научные результаты интересны и, возможно, сегодня уже следует говорить о возникновении нового (и довольно неожиданного) научного направления в прикладной статистике, развитие которого представляет несомненный интерес. Все эти результаты опираются на огромный объем работы, выполненный автором совместно с коллективом его коллег-ученых, являющихся, в основном, специалистами-профессионалами в области математической статистики и приложений.

Так как книга посвящена проблемам, находящимся на стыке нескольких научных дисциплин, то неизбежно возникают проблемы установления контакта между специалистами разных специальностей. Многие понятия и термины, привычные в одном кругу ученых, нуждаются в специальном переводе на язык ученых другой специальности и ориентации. Об этом следует помнить читателям настоящей книги, как представителям естественно-научных специальностей, так и представителям гуманитарных наук. Впрочем, такие «трудности общения» типичны и успешно преодолеваются внутри любого смешанного коллектива ученых, работающего над решением прикладной научной проблемы. Можно надеяться, что многие будущие читатели книги как раз и составят такой коллектив, который успешно продолжит исследования, начатые в книге, написанной широко известным профессионалом-математиком.