|

Обзор возможностей кластерного анализа данных в программном пакете STATISTICA ADVANCED

Авторы: Тихонов И.А.
Опубликовано в выпуске: #1(18)/2018
DOI: 10.18698/2541-8009-2018-1-230


Раздел: Информатика, вычислительная техника и управление | Рубрика: Системный анализ, управление и обработка информации, статистика

Ключевые слова: анализ данных, кластерный анализ, кластеризация, классификация без учителя, STATISTICA, евклидово пространство, иерархические и неиерархические методы кластеризации, joining/tree clustering, k-mean clustering, two-way joining

Опубликовано: 20.12.2017

Работа посвящена обзору возможностей кластеризации данных в программном пакете STATISTICA. Представлено описание методов кластеризации и особенностей работы с ними в данном продукте с практической точки зрения. Рассмотрено такое свойство, как мера расстояния между элементами исходного множества и некоторые методы разбиения исходного множества наблюдений на кластеры, а также результаты кластерного анализа после применения алгоритмов пакета STATISTICA Advanced. Практическая значимость и актуальность применения кластерного анализа к данным не вызывает сомнения, поскольку в современном информационном обществе данные и результаты их анализа играют все большую роль, а кластеризация позволяет лучше понять эти данные.


Литература

[1] Hartigan J.A. Clustering algorithms. John Wiley & Sons, Inc., 1975. 369 p.

[2] Дюран Б., Оделл П. Кластерный анализ. М.: Статистика, 1977. 128 c.

[3] Анализ данных и процессов / А.А. Барсегян, М.С. Куприянов, И.И. Холод, М.Д. Тесс, С.И. Елизаров. СПб.: БХВ-Петербург, 2009. 512 с.

[4] Калинина В.Н., Соловьев В.И. Введение в многомерный статистический анализ. М.: ГУУ, 2003. 66 с.

[5] Прикладная статистика: Классификации и снижение размерности / А.А. Айвазян, В.М. Бухштабер, И.С. Енюков, Л.Д Мешалкин. М.: Финансы и статистика, 1989. 607 с.

[6] Методы кластерного анализа. Иерархические методы. URL: http://www.intuit.ru/studies/courses/6/6/lecture/182?page=2 (дата обращения 10.10.2017).

[7] Обзор STATISTICA. URL: http://statsoft.ru/products/overview/#advantages (дата обращения 25.09.2017).

[8] Data clustering: A Review A.K. Jain Michigan State University M.N. Murty // Indian Institute of Science AND P.J. FLYNN The Ohio State University. ACM Computing Surveys. Vol. 31. No. 3. September 1999. URL: http://users.eecs.northwestern.edu/~yingliu/datamining_papers/survey.pdf (дата обращения 26.09.2017).

[9] Smola Alex, Vishwanathan S.V.N. Introduction to machine learning. Cambridge University Press, 2008. 234 p.

[10] Буреева Н.Н. Многомерный статистический анализ с использованием ППП “STATISTICA”. Учебно-методический материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики». Нижний Новгород, 2007. 112 с.