Page 1 of 1

Иерархический кластерный анализ

Posted: Sun Dec 15, 2024 6:58 am
by surovy40
Первая классификация анализов делит их на иерархические и неиерархические. Кластеры, образующие иерархию, являются вложенными, то есть каждый кластер, в свою очередь, является частью более крупного кластера, подобно русской матрешке, таким образом, что последний кластер охватывает их все.

Одно из больших отличий от методов переназначения заключается именно в том, что результаты не могут быть изменены по ходу анализа , поэтому, как только два человека группируются в кластер, они остаются сгруппированными до конца всего анализа.

В этом типе анализа используется матрица близости, то есть в качестве основы номера ватсап для группировки используются расстояние и сходство. С помощью этого типа анализа мы получим несколько уровней кластеров, они используются для определения распределения.

Анализ методом K-средних
Этот метод используется для решения конкретных вопросов, например: какой тип клиентов у меня есть? Какой тип клиентов потребляет меньше всего или какие магазины продают больше всего?

В отличие от того, что происходит в иерархических методах, здесь перед анализом необходимо указать группы или кластеры, которые вы хотите сформировать, а кроме того, анализ проводится с использованием исходных данных, а не расстояния между данными, чтобы провести группировки. Эта характеристика позволяет этому типу анализа быть наиболее подходящим для работы с большим объемом данных , поскольку он не требует такого большого объема памяти.

Image

Другое большое отличие иерархического анализа состоит в том, что он основан на переназначении, то есть человек может находиться в одном кластере, а на следующем этапе оказаться в другом, пока конечные кластеры не станут максимально однородными.

Шаги перед кластерным анализом
Прежде чем приступить к выполнению анализа, необходимо принять во внимание несколько предыдущих шагов, чтобы кластерный анализ прошел успешно и вы могли получить удовлетворительные результаты:

Необходимо хорошо организовать данные на детальном уровне, то есть разделить их независимо, чтобы иметь возможность использовать переменные. Например, данные каждого продукта, который вы хотите проанализировать, данные о клиентах и ​​каналы, с которыми вы собираетесь работать.
Поместите все данные в хранилище данных, чтобы вы могли с ними работать.
В-третьих, вы должны нормализовать данные так, чтобы все они были в одном числовом масштабе.
Выполните кластерный анализ
Выполнение кластерного анализа – это не просто проведение статистического анализа, мы увидим основные шаги, которые необходимо выполнить:

Стандартизировать данные
Выявите корреляцию между основными характеристиками. Очень интересно знать, какие переменные наиболее связаны друг с другом, чтобы знать, какие из них могут доминировать в результатах.
Вычислить оптимальное количество кластеров можно с помощью метода k-средних.
Выполните несколько кластерных анализов, используя разные методы, посмотрите на полученные рисунки или диаграммы и сравните, какие результаты имеют наиболее реальный смысл.
Наконец, сравните результаты окончательных кластеров и найдите существенные различия между группами для интерпретации результатов.