3.1 Методика кластерного анализа
Кластерный анализ – это совокупность методов многомерной классификации, целью которой является образование групп (кластеров) схожих между собой объектов.
В отличие от традиционных группировок, рассматриваемых в общей теории статистики, кластерный анализ приводит к разбиению на группы с учетом всех группировочных признаков одновременно.
Например, если наблюдаемый объект характеризуется двумя признаками

Методы кластерного анализа позволяют решать следующие задачи:
- проведение классификации объектов с учетом признаков, отражающих сущность, саму природу объектов;
- проверка выдвигаемых предположений о наличии некоторой структуры в изучаемой совокупности объектов;
- построение новых классификаций для слабо изученных явлений, когда необходимо установить наличие связей внутри совокупности и попытаться привнести в нее структуру.
Для записи формализованных алгоритмов кластерного анализа используются следующие условные обозначения:
- – совокупность объектов наблюдения;
- – i-е наблюдение в m-мерном пространстве признаков (
);
- – расстояние между
-м и
-м объектами;
- – нормированные значения исходных переменных;
- – матрица расстояний между объектами.
Для реализации любого метода кластерного анализа необходимо ввести понятие «сходство объектов». Причем в процессе классификации в каждый кластер должны попадать объекты, имеющие наибольшее сходство друг с другом с точки зрения наблюдаемых переменных.
В кластерном анализе для количественной оценки сходства вводится понятие метрики. Каждый объект описывается -признаками и представлен как точка в
-мерном пространстве. Сходство или различие между классифицируемыми объектами устанавливается в зависимости от метрического расстояния между ними.
В кластерном анализе используются различные меры расстояния между объектами:
- евклидово расстояние ;
- взвешенное евклидово расстояние ;
- расстояние city-block ;
- расстояние Минковского ;
- расстояние Махаланобиса ,
где – расстояние между
-ым и
-ым объектами;
,
– значения
-переменной и соответственно у
-го и
-го объектов;
,
– векторы значений переменных у
-го и
-го объектов;
– общая ковариационная матрица;
– вес, приписываемый
-й переменной.
Если алгоритм кластеризации основан на измерении сходства между переменными, то в качестве мер сходства могут быть использованы:
- линейные коэффициенты корреляции;
- коэффициенты ранговой корреляции;
- коэффициенты контингенции и т.д.
В зависимости от типов исходных переменных выбирается один из видов показателей, характеризующих близость между объектами.
Все методы кластерного анализа можно разделить на две группы: иерархические методы (агломеративные и дивизимные) и итеративные (метод -cpeдних, метод поиска сгущений и т.д.).
Еще по теме 3.1 Методика кластерного анализа:
- 1.1.1. Предмет и классификация методов финансового анализа
- Исследования саморегуляции.
- Вопрос № 40 Методы исследования в педагогической психологии
- 19. Концепции трудовой мотивации и их использование в практике работы с персоналом. Диагностика мотивационных образований субъекта труда.
- 6.Методы исследования психологии труда
- 5. новые подходы к исследованию социальной сферы в РФ
- Методологические вопросы использования методов математической статистики в педагогике.
- ПРИОРИТЕТНЫЕ НАПРАВЛЕНИЯ ФУНДАМЕТАЛЬНЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ В ОБЛАСТИ УПРАВЛЕНИЯ ОБРАЗОВАНИЕМ
- 1. Методы рейтинговой оценки эффективности деятельности предприятий.
- 3.1 Методика кластерного анализа
- 5. Система маркетинговой информации