В принципе, весь инструментарий ИАР может быть по ряду признаков отнесен именно к этому классу, однако лучше всего в этот класс вписываются средства статистической, корреляционной и спектральной обработки результатов наблюдений. Наибольшее распространение получили здесь программные комплексы статистической обработки данных.
Для пользователей, имеющих дело со сверхбольшими объемами данных, характеризующихся высоким уровнем формализации представления, серьезной альтернативы использованию этого класса программного обеспечения пока нет. Сегодня на этом рынке лидируют профессиональные западные пакеты статистической обработки и среды математического моделирования. В большинстве из них реализованы специальные высокоуровневые языки программирования для реализации собственных алгоритмов обработки данных. Их разработка осуществляется путем комбинирования готовых подпрограмм, поставляемых с данным программным продуктом в специализированных библиотеках. При этом задача пользователя состоит, главным образом, в исследовании информативности и выделении наиболее информативных признаков функционирования объекта изучения, установлении взаимосвязи между их изменениями и состоянием объекта. Кроме того, пользователям предоставляется возможность разработки собственных процедур с применением встроенных средств разработки или внешних сред программирования.
Существует условное деление инструментальных средств этого класса на профессиональные (специализированные) и универсальные, не имеющие привязки к отрасли исследований программные продукты. Безусловно, специализированные программные продукты за счет адаптации к классу решаемых задач обладают большей эффективностью при решении прикладных задач в заданной области исследований, но при проведении междисциплинарных исследований универсальным средам альтернативы нет. Поэтому на рынке представлены как специализированные системы обработки данных (например, предназначенные для экономических или социологических исследований), так и универсальные системы.
Универсальные пакеты обладают несколько меньшими возможностями. Но, с другой стороны, их стоимость значительно ниже, чем стоимость профессиональных. Универсальные пакеты во многом схожи по составу методов обработки, реализованы по модульному принципу и за счет обращения к процедурам и функциям операционной системы упрощают работу с графикой и интерфейсными элементами. Однако, при приобретении таких систем следует убедиться, что они действительно реализуют требуемые методы и алгоритмы обработки данных.
Существует около тысячи распространяемых на мировом рынке пакетов, решающих в том или ином виде задачи статистического анализа данных, и реализованные для различных операционных систем.
Среди западных универсальных пакетов наиболее известны и выделяются высоким качеством системы SAS (SAS Institute), SYSTAT, SPSS[69] (SSPS Inc.), Minitab (MiniTab Inc.), Statgraphics (Manugistics, Inc.), Statistica (StatSoft, Inc.). Все эти продукты реализованы на высоко профессиональном уровне, а их производители активно осваивают все новые и новые «ниши» аналитики, обращаясь к технологиям анализа текстов, интеллектуального анализа данных, операционному анализу и иным отраслям, связанным с анализом данных. Заметим, что в последние годы усиливается тенденция к специализации по отраслям — на базе основной версии выпускаются программные продукты, адаптированные к решению задач в медицине, экономике и т. д.
Особый класс программного обеспечения, представленного на рынке, — это специализированные библиотеки подпрограмм обработки данных, предназначенные для встраивания в прикладные программные продукты, разрабатываемые силами собственных отделов автоматизации организаций, нуждающихся в проведении тех или иных исследований. В этом классе несомненными лидерами являются библиотека численных и статистических методов IMSL (Visual Numerics) и библиотека S-Plus (AT&T Bell Labs), сочетающая в себе как библиотеку подпрограмм, разработанных на объектном языке программирования S, так и интерактивную среду-интерпретатор, которая обеспечивает возможность полноценного графического анализа данных. Кроме того, существует масса других библиотек, в том числе, и бесплатно распространяемых через ГСТК Интернет.
Следует заметить, что в СНГ также интенсивно развивается направление, связанное с разработкой программного обеспечения для статистической обработки данных. К классу полу-универсальных могут быть отнесены российские пакеты STADIA[70] (НПО «Информатика и компьютеры»), ОЛИМП (ЗАО «CPS») и белорусский пакет РОСТАН (Белорусский Государственный Университет). Имеются примеры создания специализированных систем для решения задач классификации и снижения размерности, например: КЛАСС-МАСТЕР (Научное изд-во «ТВП»), КВАЗАР (ИММ УрО РАН), PALMODA (ВЦ РАН), Stat-Media (ЗАО «Полихимэкс») и иные. Кроме того, на рынке представлены и статистические экспертные системы, например, СТАТЭКС (РМ и ПК, Казахстан).