SlideShare a Scribd company logo
1 of 20
Цель работы:
Анализ поиска закономерностей в
базе данных на примере
экономической предметной области.
Кластерный анализ
 (кластеризация, таксономия,
самообучение, обучение без учителя)
предназначен для разбиения множества
объектов на заданное или неизвестное
число классов на основании некоторого
математического критерия качества
классификации (cluster — гроздь, пучок,
скопление, группа элементов,
характеризуемых каким-либо общин
свойством).
Критерий качества отражают:
внутри групп объекты должны быть
тесно связаны между собой;
объекты разных групп должны быть
далеки друг от друга;
при прочих равных условиях
распределения объектов по группам
должны быть равномерными.
алгоритм "К-внутригрупповых
средних"
минимизирует показатель качества,
определяемый как сумма квадратов
расстояний всех точек, входящих в
кластерную область, до центра
кластера. Качество работы этого
алгоритма зависит от числа
выбираемых центров кластеров и от
выбора исходных центров кластеров;
модифицируемый алгоритм
"ISODATA"
В принципе аналогичен предыдущему
алгоритму, однако обладает
дополнительными эвристическими
процедурами, позволяющими получать
лучшую оценку качества кластеризации.
В этом алгоритме центрами кластеров
служат выборочные средние,
определяемые итеративно;
"агломеративная иерархическая
процедура"
принцип работы которой
состоит в последовательном
объединении объектов, а затем и
целых групп сначала самых
близких, а потом все более и
более отдаленных друг от друга;
алгоритм типа "FOREL"
позволяющий методом
последовательных приближений
находить минимальный радиус
гиперсферы, дающий разбиение
совокупности объектов на заданное
число классов.
 Выбрать таблицу экономических данных из базы
данных, созданной в Access, по дисциплине "База
данных конечных пользователей".
 Выполнить экспорт таблицы в MS Excel и
сохранить ее в виде файла.
 Загрузить систему "КАРКАС" и перейти на вкладку
"Кластеризация" и выбрать пункт меню "К-
внутригрупповых средних/ISODATA"
Кластеризация
Загрузить файл с расширением
*.xls
 Далее, нажимаем на кнопку "К-
внутригрупповых средних" и в
диалоговом окне указываем число
признаков, по которым производится
кластеризация.
Количество центров кластеров
Количество объектов для
аномальных кластеров
Выбор расстояния между
признаками
 Далее, нажимаем на кнопку "Выполнить
расчет KGS" и наблюдаем за
сообщениями на экране.
 После стабилизации работы алгоритма
"К-внутригрупповых средних" можно
просмотреть результаты кластеризации.
Просмотр результатов
кластеризации
Выводы:
 Представлены результаты кластеризации 7 объектов по
2 признакам. Из самого расположения объектов в
признаковом пространстве следует, что при
вычислительном эксперименте следовало бы выбрать
число кластеров не 1 , а 2.
 Поскольку на рисунке четко выражены 2 кластера:
первый кластер содержит объекты (1 – 4 и 6-7), а
второй кластер содержит один объект 5.
 Но если эксперт считает, что число объектов в
кластерах должно быть больше 1, то результат
кластеризации в этом случае подсказывает, что
имеется 1 кластер форма, которого имеет вид
вытянутого облака.

More Related Content

Similar to Karkas интеллектуальный анализ

Введение в машинное обучение. Кластеризация (Bitworks Software, Кирилл Жданов)
Введение в машинное обучение. Кластеризация (Bitworks Software, Кирилл Жданов)Введение в машинное обучение. Кластеризация (Bitworks Software, Кирилл Жданов)
Введение в машинное обучение. Кластеризация (Bitworks Software, Кирилл Жданов)Bitworks Software
 
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"Yandex
 
лекция 8
лекция 8лекция 8
лекция 8cezium
 
L7:Задача кластеризации. Метрики качества
L7:Задача кластеризации. Метрики качестваL7:Задача кластеризации. Метрики качества
L7:Задача кластеризации. Метрики качестваTechnosphere1
 
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...ITMO University
 
Введение в машинное обучение
Введение в машинное обучениеВведение в машинное обучение
Введение в машинное обучениеGrigory Sapunov
 
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...it-people
 
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google AnalitycsСтроим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google AnalitycsMaxim Uvarov
 

Similar to Karkas интеллектуальный анализ (12)

Введение в машинное обучение. Кластеризация (Bitworks Software, Кирилл Жданов)
Введение в машинное обучение. Кластеризация (Bitworks Software, Кирилл Жданов)Введение в машинное обучение. Кластеризация (Bitworks Software, Кирилл Жданов)
Введение в машинное обучение. Кластеризация (Bitworks Software, Кирилл Жданов)
 
Stat 3 alpha
Stat 3 alphaStat 3 alpha
Stat 3 alpha
 
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
Марина Степанова "Кластеризатор в JS API Яндекс.Карт"
 
лекция 8
лекция 8лекция 8
лекция 8
 
Razinkov
RazinkovRazinkov
Razinkov
 
Razinkov
RazinkovRazinkov
Razinkov
 
Geo sib 2012
Geo sib 2012Geo sib 2012
Geo sib 2012
 
L7:Задача кластеризации. Метрики качества
L7:Задача кластеризации. Метрики качестваL7:Задача кластеризации. Метрики качества
L7:Задача кластеризации. Метрики качества
 
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
 
Введение в машинное обучение
Введение в машинное обучениеВведение в машинное обучение
Введение в машинное обучение
 
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
 
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google AnalitycsСтроим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
Строим собственную BI в MS Excel на данных из Яндекс.Метрики и Google Analitycs
 

More from Vladimir Burdaev

Modul 1 Systems Business Intelligence
Modul 1 Systems Business IntelligenceModul 1 Systems Business Intelligence
Modul 1 Systems Business IntelligenceVladimir Burdaev
 
презентация управления знаниями_каркас
презентация управления знаниями_каркаспрезентация управления знаниями_каркас
презентация управления знаниями_каркасVladimir Burdaev
 
управление знаний3 (2)
управление знаний3 (2)управление знаний3 (2)
управление знаний3 (2)Vladimir Burdaev
 
каркас новая версия
каркас новая версиякаркас новая версия
каркас новая версияVladimir Burdaev
 
каркас интеллектуальный анализ вар 2
каркас интеллектуальный анализ вар 2каркас интеллектуальный анализ вар 2
каркас интеллектуальный анализ вар 2Vladimir Burdaev
 
продвижение нового товара
продвижение нового товарапродвижение нового товара
продвижение нового товараVladimir Burdaev
 
оценка инновационных рисков предприятия
оценка инновационных рисков предприятияоценка инновационных рисков предприятия
оценка инновационных рисков предприятияVladimir Burdaev
 
источник финансирования
источник финансированияисточник финансирования
источник финансированияVladimir Burdaev
 
каркас 2011 prezent_servis
каркас 2011 prezent_servisкаркас 2011 prezent_servis
каркас 2011 prezent_servisVladimir Burdaev
 
каркас тестирование
каркас тестированиекаркас тестирование
каркас тестированиеVladimir Burdaev
 
Построение базы знаний для агентов
Построение базы знаний для агентовПостроение базы знаний для агентов
Построение базы знаний для агентовVladimir Burdaev
 
бурдаев Ontology 2010
бурдаев Ontology 2010бурдаев Ontology 2010
бурдаев Ontology 2010Vladimir Burdaev
 
модель базы знаний салон красоты
модель базы знаний салон красотымодель базы знаний салон красоты
модель базы знаний салон красотыVladimir Burdaev
 

More from Vladimir Burdaev (20)

Modul 1 Systems Business Intelligence
Modul 1 Systems Business IntelligenceModul 1 Systems Business Intelligence
Modul 1 Systems Business Intelligence
 
презентация управления знаниями_каркас
презентация управления знаниями_каркаспрезентация управления знаниями_каркас
презентация управления знаниями_каркас
 
2015 04 14_info_b_2
2015 04 14_info_b_22015 04 14_info_b_2
2015 04 14_info_b_2
 
E makros bur_2
E makros bur_2E makros bur_2
E makros bur_2
 
Burdtech
BurdtechBurdtech
Burdtech
 
управление знаний3 (2)
управление знаний3 (2)управление знаний3 (2)
управление знаний3 (2)
 
Paradigma km 0
Paradigma km 0Paradigma km 0
Paradigma km 0
 
парадигма ии
парадигма иипарадигма ии
парадигма ии
 
каркас новая версия
каркас новая версиякаркас новая версия
каркас новая версия
 
каркас интеллектуальный анализ вар 2
каркас интеллектуальный анализ вар 2каркас интеллектуальный анализ вар 2
каркас интеллектуальный анализ вар 2
 
продвижение нового товара
продвижение нового товарапродвижение нового товара
продвижение нового товара
 
оценка инновационных рисков предприятия
оценка инновационных рисков предприятияоценка инновационных рисков предприятия
оценка инновационных рисков предприятия
 
источник финансирования
источник финансированияисточник финансирования
источник финансирования
 
каркас рибс1
каркас рибс1каркас рибс1
каркас рибс1
 
каркас 2011 prezent_servis
каркас 2011 prezent_servisкаркас 2011 prezent_servis
каркас 2011 prezent_servis
 
каркас тестирование
каркас тестированиекаркас тестирование
каркас тестирование
 
Построение базы знаний для агентов
Построение базы знаний для агентовПостроение базы знаний для агентов
Построение базы знаний для агентов
 
бурдаев Mac1
бурдаев Mac1бурдаев Mac1
бурдаев Mac1
 
бурдаев Ontology 2010
бурдаев Ontology 2010бурдаев Ontology 2010
бурдаев Ontology 2010
 
модель базы знаний салон красоты
модель базы знаний салон красотымодель базы знаний салон красоты
модель базы знаний салон красоты
 

Karkas интеллектуальный анализ

  • 1.
  • 2. Цель работы: Анализ поиска закономерностей в базе данных на примере экономической предметной области.
  • 3. Кластерный анализ  (кластеризация, таксономия, самообучение, обучение без учителя) предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации (cluster — гроздь, пучок, скопление, группа элементов, характеризуемых каким-либо общин свойством).
  • 4. Критерий качества отражают: внутри групп объекты должны быть тесно связаны между собой; объекты разных групп должны быть далеки друг от друга; при прочих равных условиях распределения объектов по группам должны быть равномерными.
  • 5.
  • 6. алгоритм "К-внутригрупповых средних" минимизирует показатель качества, определяемый как сумма квадратов расстояний всех точек, входящих в кластерную область, до центра кластера. Качество работы этого алгоритма зависит от числа выбираемых центров кластеров и от выбора исходных центров кластеров;
  • 7. модифицируемый алгоритм "ISODATA" В принципе аналогичен предыдущему алгоритму, однако обладает дополнительными эвристическими процедурами, позволяющими получать лучшую оценку качества кластеризации. В этом алгоритме центрами кластеров служат выборочные средние, определяемые итеративно;
  • 8. "агломеративная иерархическая процедура" принцип работы которой состоит в последовательном объединении объектов, а затем и целых групп сначала самых близких, а потом все более и более отдаленных друг от друга;
  • 9. алгоритм типа "FOREL" позволяющий методом последовательных приближений находить минимальный радиус гиперсферы, дающий разбиение совокупности объектов на заданное число классов.
  • 10.
  • 11.  Выбрать таблицу экономических данных из базы данных, созданной в Access, по дисциплине "База данных конечных пользователей".  Выполнить экспорт таблицы в MS Excel и сохранить ее в виде файла.  Загрузить систему "КАРКАС" и перейти на вкладку "Кластеризация" и выбрать пункт меню "К- внутригрупповых средних/ISODATA"
  • 13. Загрузить файл с расширением *.xls
  • 14.  Далее, нажимаем на кнопку "К- внутригрупповых средних" и в диалоговом окне указываем число признаков, по которым производится кластеризация.
  • 18.  Далее, нажимаем на кнопку "Выполнить расчет KGS" и наблюдаем за сообщениями на экране.  После стабилизации работы алгоритма "К-внутригрупповых средних" можно просмотреть результаты кластеризации.
  • 20. Выводы:  Представлены результаты кластеризации 7 объектов по 2 признакам. Из самого расположения объектов в признаковом пространстве следует, что при вычислительном эксперименте следовало бы выбрать число кластеров не 1 , а 2.  Поскольку на рисунке четко выражены 2 кластера: первый кластер содержит объекты (1 – 4 и 6-7), а второй кластер содержит один объект 5.  Но если эксперт считает, что число объектов в кластерах должно быть больше 1, то результат кластеризации в этом случае подсказывает, что имеется 1 кластер форма, которого имеет вид вытянутого облака.