<<
>>

3.1 Методика кластерного анализа

Кластерный анализ – это совокупность методов многомерной классификации, целью которой является образование групп (кластеров) схожих между собой объектов.

В отличие от традиционных группировок, рассматриваемых в общей теории статистики, кластерный анализ приводит к разбиению на группы с учетом всех группировочных признаков одновременно.

Например, если наблюдаемый объект характеризуется двумя признаками и , то при использовании методов кластерного анализа оба эти признака учитываются одновременно при отнесении наблюдения в ту или иную группу.

Методы кластерного анализа позволяют решать следующие задачи:

- проведение классификации объектов с учетом признаков, отражающих сущность, саму природу объектов;

- проверка выдвигаемых предположений о наличии некоторой структуры в изучаемой совокупности объектов;

- построение новых классификаций для слабо изученных явлений, когда необходимо установить наличие связей внутри совокупности и попытаться привнести в нее структуру.

Для записи формализованных алгоритмов кластерного анализа используются следующие условные обозначения:

- – совокупность объектов наблюдения;

- – i-е наблюдение в m-мерном пространстве признаков ();

- – расстояние между -м и -м объектами;

- – нормированные значения исходных переменных;

- – матрица расстояний между объектами.

Для реализации любого метода кластерного анализа необходимо ввести понятие «сходство объектов». Причем в процессе классификации в каждый кластер должны попадать объекты, имеющие наибольшее сходство друг с другом с точки зрения наблюдаемых переменных.

В кластерном анализе для количественной оценки сходства вводится понятие метрики. Каждый объект описывается -признаками и представлен как точка в -мерном пространстве. Сходство или различие между классифицируемыми объектами устанавливается в зависимости от метрического расстояния между ними.

В кластерном анализе используются различные меры расстояния между объектами:

- евклидово расстояние ;

- взвешенное евклидово расстояние ;

- расстояние city-block ;

- расстояние Минковского ;

- расстояние Махаланобиса ,

где – расстояние между -ым и -ым объектами; , – значения -переменной и соответственно у -го и -го объектов; , – векторы значений переменных у -го и -го объектов; – общая ковариационная матрица; – вес, приписываемый -й переменной.

Если алгоритм кластеризации основан на измерении сходства между переменными, то в качестве мер сходства могут быть использованы:

- линейные коэффициенты корреляции;

- коэффициенты ранговой корреляции;

- коэффициенты контингенции и т.д.

В зависимости от типов исходных переменных выбирается один из видов показателей, характеризующих близость между объектами.

Все методы кластерного анализа можно разделить на две группы: иерархические методы (агломеративные и дивизимные) и итеративные (метод -cpeдних, метод поиска сгущений и т.д.).

<< | >>
Источник: Математическая статистика. Лекции. 2017

Еще по теме 3.1 Методика кластерного анализа:

  1. 1.1.1. Предмет и классификация методов финансового анализа
  2. Исследования саморегуляции.
  3. Вопрос № 40 Методы исследования в педагогической психологии
  4. 19. Концепции трудовой мотивации и их использование в практике работы с персоналом. Диагностика мотивационных образований субъекта труда.
  5. 6.Методы исследования психологии труда
  6. 5. новые подходы к исследованию социальной сферы в РФ
  7. Методо­логические вопросы использования методов математической статистики в педагогике.
  8. ПРИОРИТЕТНЫЕ НАПРАВЛЕНИЯ ФУНДАМЕТАЛЬНЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ В ОБЛАСТИ УПРАВЛЕНИЯ ОБРАЗОВАНИЕМ
  9. 1. Методы рейтинговой оценки эффективности деятельности предприятий.
  10. 3.1 Методика кластерного анализа
  11. 5. Система маркетинговой информации
- Аналитическая геометрия - Высшая математика - Вычислительная математика - Вычислительные методы линейной алгебры - Дискретная математика - Дифференциальное и интегральное исчисление - Дифференциальные уравнения - Исследование операций - История математики - Комбинаторика - Комплексное исчисление - Линейная алгебра - Линейная алгебра и аналитическая геометрия - Линейное программирование - Математическая логика - Математическая статистика - Математическая физика - Математический анализ - Метод конечных элементов - Методы оптимизации - Обработка результатов измерений - Общая алгебра - Операционное исчисление - Основы математики - Планирование эксперимента - Пределы - Ряды - Теория вероятностей - Теория графов - Теория игр - Теория конечных автоматов - Теория массового обслуживания - Теория принятия решений - Теория случайных процессов - Теория чисел - Философия математики - Функциональный анализ - Элементарная математика -