Генетический алгоритм. Частный случай эволюционного алгоритма. В общем случае при использовании генетических алгоритмов решения рассматриваемой задачи представляются в виде последовательности битов. Последовательности (гены), описывающие лучшие решения (особи), скрещиваются между собой и мутируют, максимально точно имитируя процесс биологической эволюции. Генетические алгоритмы вошли в число первых эволюционных алгоритмов, которые способствовали росту популярности искусственного интеллекта.
Дерево принятия решений. Понятие, используемое в информатике для классификации статистических выборок. В основе классификации лежит анализ наиболее важных, или дискриминантных компонент, позволяющих однозначно отнести выборку к тому или иному классу. Деревья принятия решений очень просты и вместе с тем крайне эффективны для распознавания образов.
Интеллектуальный анализ данных. Раздел анализа данных, описывающий извлечение новых знаний и вывод неочевидных правил по итогам изучения больших объемов данных. При интеллектуальном анализе данных возможно установление отношений между данными, объем которых слишком велик, чтобы человек мог обработать их и сформулировать какую-либо гипотезу.
Кластеризация. Разбиение статистических выборок на группы согласно различным критериям. Цель методов кластеризации — интеллектуальное определение критериев разбиения выборки на подгруппы. Кластеризация используется множеством способов во всех научных дисциплинах.
Клеточный автомат. Частный случай программируемого автомата и простейший пример искусственной жизни. Клеточный автомат получает входные сигналы из смежных областей и в зависимости от окружающей среды действует тем или иным образом.
Латентная переменная. Статистическая переменная, описывающая несколько условий в выборке одновременно. Некоторые примеры часто применяемых латентных переменных — «богатство» общества или благосостояние населения. Эти переменные повышают плотность информации, так как сводят несколько простых переменных воедино. Существуют автоматические методы создания латентных переменных, в частности метод главных компонент, который позволяет не только создавать подобные переменные, но и выбирать те, для которых вариация данных будет наибольшей.
Машина Тьюринга. Частный случай программируемого автомата, который принимает входные значения, записанные на бесконечной ленте, и содержит устройство чтения-записи, способное перемещаться вдоль этой ленты. Предполагается, что машина Тьюринга — универсальная вычислительная машина, хотя это до сих пор не доказано математически. Машина Тьюринга — математическая абстракция, которая широко используется в теории коммуникаций: если в данном языке программирования возможна реализация машины Тьюринга, то с его помощью можно реализовать любой алгоритм.
Метод главных компонент. Этот метод, также обозначаемый англоязычной аббревиатурой РСА, — популярный метод статистики, используемый для определения компонент, или переменных, при которых вариация изучаемых данных является наибольшей.
Метод опорных векторов. Мощный и популярный математический метод, разработанный ученым Владимиром Вапником в начале XXI века. Метод опорных векторов позволяет классифицировать статистические выборки путем ввода новых «искусственных» измерений на множестве данных рассматриваемой задачи. Название метода связано с тем, что для классификации статистических данных определяются векторы — опоры гиперплоскости, которые лучше всего разделяют между собой выборки разных классов.
Нейронная сеть. Математическая модель, представляющая собой сеть искусственных нейронов, которые можно обучить для решения задач классификации. Нейронные сети имитируют поведение нервной системы живых существ, также состоящей из обученных нейронов.
Переобучение. Переобучение наблюдается в случае, когда алгоритм классификации в результате обучения оказывается не способным обобщать и может лишь запоминать. При переобучении алгоритм способен корректно классифицировать только выборки, запомненные во время обучения. Переобучение обычно происходит в случае, когда процесс обучения алгоритма оказывается слишком длительным. При агрегировании десятков или сотен подобных алгоритмов общий интеллект нелинейно возрастает и в итоге становится весьма высоким.