SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Microsoft Azure
Machine
Learning
Вадим Челышков, Azure TSP
Машинное обучение — процесс, в результате которого
машина (компьютер) способна показывать поведение,
которое в нее не было явно заложено (запрограммировано)
(Arthur Samuel, 1959)
Говорят, что компьютерная программа обучается на основе
опыта E по отношению к некоторому классу задач T и меры
качества P, если качество решения задач из T, измеренное на
основе P, улучшается с приобретением опыта E.
(Tom Mitchel, 1998)
Что такое Машинное Обучение?
Это компьютерные системы, которые становятся умнее с полученным опытом.
Виды машинного обучения
Машинное
обучение
Машинное
обучение
Машинное
обучение
Индуктивное
обучение
Обучение с
учителем
Обучение без
учителя
Обучение с
подкреплением
Дедуктивное
обучение
Обучение с учителем
Такое обучение можно рассматривать как игру
двух лиц: ученика, который должен
восстановить зависимость, и учителя, который для
объектов из обучающей выборки
указывает ученику соответствующий им выход.
Обучение без учителя.
В этом случае нет учителя и «обучающая
выборка» состоит только из объектов.
Ученик, имея только список объектов
должен определить, как
объекты связаны друг с другом.
Виды индуктивного машинного обучения
Процесс машинного обучения
Определение
задачи
Сбор и
подготовка
данных
Обучение
модели
Проверка
результата
Работа
Обучающая выборка (training
sample) — выборка, по которой
производится настройка
(оптимизация
параметров) модели
зависимости.
Тестовая (или контрольная)
выборка (test sample) — выборка,
по которой оценивается качество
построенной модели.
Чем машинное обучение может вам помочь?
Социальные
медиа
Предсказание
погоды
Медицинская
диагностика
Диагностическое
обслуживание
Таргетированная
реклама
Разведка
природных
ресурсов
Детектирование
спама
Анализ данных
телеметрии
Программы
лояльности
Анализ оттока
клиентов
Научные
исследования
Оптимизация
веб-приложений
Обнаружение
сетевых атак
Умные системы
мониторинга
Azure Machine Learning – облачный сервис
для выполнения задач прогнозной
аналитики (predictive analytics).
Сервис представлен двумя компонентами:
Azure ML Studio – средой разработки,
доступной через web-интерфейс, и web-
сервисами Azure ML.
Определение Azure ML
Внешние и
внутренние
источники
Контрольные
панелиОтчеты Вопросы
Мобильные
устройства
Управление
информациейПодготовка данных ETL Предсказания
Реляционные
СУБД NoSQL OLAP
Приложения
Потоки данных

Data
Azure ML
Решение любых аналитических задач
Результаты вычислений всегда будут доступны для пользователей, везде.
Сбор и подготовка данных
Импорт данных:
• Импорт данных из SQL, Azure HD,
Azure Blob & Tables
Преобразования данных:
• Добавления недостающих значений,
очистка, нормализация, группировка
Определение контекста:
• Отношения, связи, корреляции,
особенности, построение
дескриптивной статистики
Задача
Сбор и
подготовка
данных
Обучение
модели
Проверка
результата
Работа
Работа с обучающей выборкой
Разделение данных:
• Частичные срезы, деление пополам,
выборка образцов
Обучение:
• Регрессия
Байесовская линейная, Линейная R,Порядковая
регрессия,ANN….
• Классификация
«Усиленные деревья принятия решений», «Лес
решений», «Джунгли решений», «Логистическая
регрессия»,SVM,ANN…
• Кластеризация
K-means («метод k-средних»)
• Поиск аномалий
PCA (Principal Component Analysis)
Задача
Сбор и
подготовка
данных
Обучение
модели
Проверка
результата
Работа
Оценка модели
плохие примеры (True Negative, TN)
Задача
Сбор и
подготовка
данных
Обучение
модели
Проверка
результата
Работа
(True Positive, TP) - хорошие примеры
(True Negative, TN) - плохие примеры
Где:
Что дальше?
• Опубликуйте ML-модель как веб-
сервис
• Настройте работу с API
• Опубликуйте результат в Azure
Marketplace
Задача
Сбор и
подготовка
данных
Обучение
модели
Проверка
результата
Работа
Примеры
Microsoft Azure Machine Learning в действии:
Cortana
Данные интегрируются из ERP системы
Dynamics AX, на их основании
прогнозируется потребительский
спрос на товары.
В качестве обучающей выборки
используются данные о продажах за
последние три года.
Цель внедрения технологий машинного
обучения состоит в создании
мониторинговой системы с
возможностью прогнозирования
отказов оборудования. Данные
(включая коды ошибок и
диагностическую информацию)
собираются с датчиков и отправляются
на концентраторы событий в Azure.
2 интересных кейса из мировой практики
spellabs.R-pricer
Предпосылки
Оптимизация цены поэтапно увеличивает продажи и прибыль. Исследование Yankee
Group показывает, что возврат инвестиций от подобных систем приближается к 20%.
Принцип работы
1. Спрос на каждый товар зависит (уменьшается) от цены на него в данном магазине.
2. Спрос на товар зависит (увеличивается) в зависимости от цены на товар-заменитель.
Вывод: для прогнозирования спроса на данный товар надо учитывать цены на группу
товаров.
Принцип работы
1. Регрессия. Для каждого товара находим зависимость спроса на него в
зависимости от магазина и цен на группу товаров.
Спрос на товар 1 = f1(Магазин, Цена1, …, Цена5, Другие факторы)
….
Спрос на товар 5 = f5(Магазин, Цена1, …, Цена5, Другие факторы)
2. Оптимизация. Находим максимум суммарного ожидаемого оборота (по
всем товарам по всем магазинам) как функцию от вектора цен на товары.
Целевая функция:
Ожидаемый оборот по всем товарам по всем магазинам = Сумма по магазинам(Ц1 * f1(Мi, Ц1,…,Ц5) + … + Ц5 * f5(Мi,
Ц1,…,Ц5))
Ограничения: диапазоны цен
Задача оптимизации: найти цены, при которых ожидаемый оборот максимален.
Алгоритм работы системы оптимизации цен
Microsoft Azure Machine Learning
21
Моделирование
спроса
Рекомендуемые
цены
Проверка на соответствие
ценовым и маркетинговым
стратегиям, действующему
законодательству РФ
Чеки
Цены конкурентов
(опционально)
Оптимизация вектора
цен на группу
товаров
Вывод цены на ценник
Выявление кластеров
и групп товаров
Модель R-Pricer v.0.1 в Azure ML
R код расчёта оптимальных цен
Анализ и оценка построенной модели по
каждой товарной группе
Первый график – сведение фактических данных и полученных из
построенной модели спроса.
Коэффициент корреляции corr= 0,984
Идеальная линия – 45 градусов
Второй график – распределение ошибок
Идеальный график – нормальное распределение
Обратите внимание на приложения
в магазине:
datamarket.azure.com
Попробуйте Azure
ML бесплатно на
сайте:
azure.com/ml
Спасибо!
4 azure 24 04

Weitere ähnliche Inhalte

Was ist angesagt?

Data Mining - lecture 5 - 2014
Data Mining - lecture 5 - 2014Data Mining - lecture 5 - 2014
Data Mining - lecture 5 - 2014Andrii Gakhov
 
Data Mining - lecture 8 - 2014
Data Mining - lecture 8 - 2014Data Mining - lecture 8 - 2014
Data Mining - lecture 8 - 2014Andrii Gakhov
 
Supervised ML in Practice: Tips & Tricks
Supervised ML in Practice:  Tips & TricksSupervised ML in Practice:  Tips & Tricks
Supervised ML in Practice: Tips & TricksDzianis Pirshtuk
 
BigData и Data Science: методы и инструменты
BigData и Data Science: методы и инструменты BigData и Data Science: методы и инструменты
BigData и Data Science: методы и инструменты Dima Karamshuk
 
Data Mining - lecture 6 - 2014
Data Mining - lecture 6 - 2014Data Mining - lecture 6 - 2014
Data Mining - lecture 6 - 2014Andrii Gakhov
 
Основы алгоритмического и объектно ориентированного программирования.
Основы алгоритмического и объектно ориентированного программирования.Основы алгоритмического и объектно ориентированного программирования.
Основы алгоритмического и объектно ориентированного программирования.Елена Никонова
 
Data Mining - lecture 3 - 2014
Data Mining - lecture 3 - 2014Data Mining - lecture 3 - 2014
Data Mining - lecture 3 - 2014Andrii Gakhov
 
обработка информации и алгоритмы
обработка информации  и алгоритмыобработка информации  и алгоритмы
обработка информации и алгоритмыЕлена Ключева
 
Моделирование ТПиПП
Моделирование ТПиППМоделирование ТПиПП
Моделирование ТПиППAndrey Urusov
 

Was ist angesagt? (12)

Data Mining - lecture 5 - 2014
Data Mining - lecture 5 - 2014Data Mining - lecture 5 - 2014
Data Mining - lecture 5 - 2014
 
Data Mining - lecture 8 - 2014
Data Mining - lecture 8 - 2014Data Mining - lecture 8 - 2014
Data Mining - lecture 8 - 2014
 
Supervised ML in Practice: Tips & Tricks
Supervised ML in Practice:  Tips & TricksSupervised ML in Practice:  Tips & Tricks
Supervised ML in Practice: Tips & Tricks
 
BigData и Data Science: методы и инструменты
BigData и Data Science: методы и инструменты BigData и Data Science: методы и инструменты
BigData и Data Science: методы и инструменты
 
Введение в алгоритмы и структуры данных
Введение в алгоритмы и структуры данныхВведение в алгоритмы и структуры данных
Введение в алгоритмы и структуры данных
 
Data Mining - lecture 6 - 2014
Data Mining - lecture 6 - 2014Data Mining - lecture 6 - 2014
Data Mining - lecture 6 - 2014
 
Data mining
Data mining Data mining
Data mining
 
лекция 8
лекция 8лекция 8
лекция 8
 
Основы алгоритмического и объектно ориентированного программирования.
Основы алгоритмического и объектно ориентированного программирования.Основы алгоритмического и объектно ориентированного программирования.
Основы алгоритмического и объектно ориентированного программирования.
 
Data Mining - lecture 3 - 2014
Data Mining - lecture 3 - 2014Data Mining - lecture 3 - 2014
Data Mining - lecture 3 - 2014
 
обработка информации и алгоритмы
обработка информации  и алгоритмыобработка информации  и алгоритмы
обработка информации и алгоритмы
 
Моделирование ТПиПП
Моделирование ТПиППМоделирование ТПиПП
Моделирование ТПиПП
 

Andere mochten auch

3 джозеп курто превращаем вашу организацию в big data компанию
3 джозеп курто превращаем вашу организацию в big data компанию3 джозеп курто превращаем вашу организацию в big data компанию
3 джозеп курто превращаем вашу организацию в big data компаниюantishmanti
 
2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнес2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнесantishmanti
 
1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой брат1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой братantishmanti
 
1 20150424 ydf_mlevin_мифы и легенды о больших данных
1 20150424 ydf_mlevin_мифы и легенды о больших данных1 20150424 ydf_mlevin_мифы и легенды о больших данных
1 20150424 ydf_mlevin_мифы и легенды о больших данныхantishmanti
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi octantishmanti
 
Data-driven маркетинг: programmatic и data mining
Data-driven маркетинг: programmatic и data miningData-driven маркетинг: programmatic и data mining
Data-driven маркетинг: programmatic и data miningTsvetelina Miteva
 
Machine Learning and Azure Machine Learning
Machine Learning and Azure Machine LearningMachine Learning and Azure Machine Learning
Machine Learning and Azure Machine LearningAlexander Konduforov
 
FOSS Sea 2014_Виктор Цикунов (Microsoft Ukraine)_Инструменты машинного знания...
FOSS Sea 2014_Виктор Цикунов (Microsoft Ukraine)_Инструменты машинного знания...FOSS Sea 2014_Виктор Цикунов (Microsoft Ukraine)_Инструменты машинного знания...
FOSS Sea 2014_Виктор Цикунов (Microsoft Ukraine)_Инструменты машинного знания...GeeksLab Odessa
 
5. Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
5.	Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning5.	Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
5. Готовые инструменты Azure: бизнес-прогнозирования в Machine LearningTechExpert
 
Mail.ru on Big Data Russia
Mail.ru on Big Data RussiaMail.ru on Big Data Russia
Mail.ru on Big Data Russiarusbase.vc
 
3 krot riw_2015_3
3 krot riw_2015_33 krot riw_2015_3
3 krot riw_2015_3antishmanti
 
Кластеризация на примере соцсети "Одноклассники"
Кластеризация на примере соцсети "Одноклассники"Кластеризация на примере соцсети "Одноклассники"
Кластеризация на примере соцсети "Одноклассники"Tsvetelina Miteva
 
NumBuster on Big Data Russia
NumBuster on Big Data RussiaNumBuster on Big Data Russia
NumBuster on Big Data Russiarusbase.vc
 
4 sas and big data short
4 sas and big data short4 sas and big data short
4 sas and big data shortantishmanti
 
Scorista on Big Data Russia
Scorista on Big Data RussiaScorista on Big Data Russia
Scorista on Big Data Russiarusbase.vc
 
Google на конференции Big Data Russia
Google на конференции Big Data RussiaGoogle на конференции Big Data Russia
Google на конференции Big Data Russiarusbase.vc
 
SAP on Big Data Russia
SAP on Big Data RussiaSAP on Big Data Russia
SAP on Big Data Russiarusbase.vc
 
Microsoft azure machine learning hakaton 2015, team 1'st place
Microsoft azure machine learning hakaton 2015, team 1'st placeMicrosoft azure machine learning hakaton 2015, team 1'st place
Microsoft azure machine learning hakaton 2015, team 1'st placeEugene Necheporenko
 

Andere mochten auch (20)

3 джозеп курто превращаем вашу организацию в big data компанию
3 джозеп курто превращаем вашу организацию в big data компанию3 джозеп курто превращаем вашу организацию в big data компанию
3 джозеп курто превращаем вашу организацию в big data компанию
 
2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнес2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнес
 
2 bdw.key
2 bdw.key2 bdw.key
2 bdw.key
 
1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой брат1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой брат
 
1 20150424 ydf_mlevin_мифы и легенды о больших данных
1 20150424 ydf_mlevin_мифы и легенды о больших данных1 20150424 ydf_mlevin_мифы и легенды о больших данных
1 20150424 ydf_mlevin_мифы и легенды о больших данных
 
3 ibm bdw2015
3 ibm bdw20153 ibm bdw2015
3 ibm bdw2015
 
1 big data oracle digi oct
1 big data oracle digi oct1 big data oracle digi oct
1 big data oracle digi oct
 
Data-driven маркетинг: programmatic и data mining
Data-driven маркетинг: programmatic и data miningData-driven маркетинг: programmatic и data mining
Data-driven маркетинг: programmatic и data mining
 
Machine Learning and Azure Machine Learning
Machine Learning and Azure Machine LearningMachine Learning and Azure Machine Learning
Machine Learning and Azure Machine Learning
 
FOSS Sea 2014_Виктор Цикунов (Microsoft Ukraine)_Инструменты машинного знания...
FOSS Sea 2014_Виктор Цикунов (Microsoft Ukraine)_Инструменты машинного знания...FOSS Sea 2014_Виктор Цикунов (Microsoft Ukraine)_Инструменты машинного знания...
FOSS Sea 2014_Виктор Цикунов (Microsoft Ukraine)_Инструменты машинного знания...
 
5. Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
5.	Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning5.	Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
5. Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
 
Mail.ru on Big Data Russia
Mail.ru on Big Data RussiaMail.ru on Big Data Russia
Mail.ru on Big Data Russia
 
3 krot riw_2015_3
3 krot riw_2015_33 krot riw_2015_3
3 krot riw_2015_3
 
Кластеризация на примере соцсети "Одноклассники"
Кластеризация на примере соцсети "Одноклассники"Кластеризация на примере соцсети "Одноклассники"
Кластеризация на примере соцсети "Одноклассники"
 
NumBuster on Big Data Russia
NumBuster on Big Data RussiaNumBuster on Big Data Russia
NumBuster on Big Data Russia
 
4 sas and big data short
4 sas and big data short4 sas and big data short
4 sas and big data short
 
Scorista on Big Data Russia
Scorista on Big Data RussiaScorista on Big Data Russia
Scorista on Big Data Russia
 
Google на конференции Big Data Russia
Google на конференции Big Data RussiaGoogle на конференции Big Data Russia
Google на конференции Big Data Russia
 
SAP on Big Data Russia
SAP on Big Data RussiaSAP on Big Data Russia
SAP on Big Data Russia
 
Microsoft azure machine learning hakaton 2015, team 1'st place
Microsoft azure machine learning hakaton 2015, team 1'st placeMicrosoft azure machine learning hakaton 2015, team 1'st place
Microsoft azure machine learning hakaton 2015, team 1'st place
 

Ähnlich wie 4 azure 24 04

Алгоритмы и структуры данных весна 2014 лекция 1
Алгоритмы и структуры данных весна 2014 лекция 1Алгоритмы и структуры данных весна 2014 лекция 1
Алгоритмы и структуры данных весна 2014 лекция 1Technopark
 
Практический курс «Основы Data Mining»
Практический курс «Основы Data Mining»Практический курс «Основы Data Mining»
Практический курс «Основы Data Mining»ScienceHunter1
 
Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.Lidia Pivovarova
 
Введение в машинное обучение
Введение в машинное обучениеВведение в машинное обучение
Введение в машинное обучениеGrigory Sapunov
 
AzovDevMeetup 2016 | Машинное обучение, параллельные и распределённые вычисле...
AzovDevMeetup 2016 | Машинное обучение, параллельные и распределённые вычисле...AzovDevMeetup 2016 | Машинное обучение, параллельные и распределённые вычисле...
AzovDevMeetup 2016 | Машинное обучение, параллельные и распределённые вычисле...JSC “Arcadia Inc”
 
Настрой контент под пользователя!
Настрой контент под пользователя!Настрой контент под пользователя!
Настрой контент под пользователя!PyNSK
 
Практика машинного обучения: вопросы и проблемы при работе над ML-проектом
Практика машинного обучения: вопросы и проблемы при работе над ML-проектомПрактика машинного обучения: вопросы и проблемы при работе над ML-проектом
Практика машинного обучения: вопросы и проблемы при работе над ML-проектомDenisenko Sergei
 
практика 5
практика 5практика 5
практика 5student_kai
 
Формирование технологической и информационной компетентности школьников при и...
Формирование технологической и информационной компетентности школьников при и...Формирование технологической и информационной компетентности школьников при и...
Формирование технологической и информационной компетентности школьников при и...balin777
 
!Predictive analytics part_2
!Predictive analytics part_2!Predictive analytics part_2
!Predictive analytics part_2Vladimir Krylov
 
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучениеHub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучениеHub-IT-School
 
20120415 videorecognition konushin_lecture06
20120415 videorecognition konushin_lecture0620120415 videorecognition konushin_lecture06
20120415 videorecognition konushin_lecture06Computer Science Club
 
обработка информации и алгоритмы
обработка информации  и алгоритмыобработка информации  и алгоритмы
обработка информации и алгоритмыЕлена Ключева
 
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...ITMO University
 

Ähnlich wie 4 azure 24 04 (20)

Алгоритмы и структуры данных весна 2014 лекция 1
Алгоритмы и структуры данных весна 2014 лекция 1Алгоритмы и структуры данных весна 2014 лекция 1
Алгоритмы и структуры данных весна 2014 лекция 1
 
Практический курс «Основы Data Mining»
Практический курс «Основы Data Mining»Практический курс «Основы Data Mining»
Практический курс «Основы Data Mining»
 
л 2 11
л 2 11л 2 11
л 2 11
 
Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.
 
Введение в машинное обучение
Введение в машинное обучениеВведение в машинное обучение
Введение в машинное обучение
 
AzovDevMeetup 2016 | Машинное обучение, параллельные и распределённые вычисле...
AzovDevMeetup 2016 | Машинное обучение, параллельные и распределённые вычисле...AzovDevMeetup 2016 | Машинное обучение, параллельные и распределённые вычисле...
AzovDevMeetup 2016 | Машинное обучение, параллельные и распределённые вычисле...
 
Настрой контент под пользователя!
Настрой контент под пользователя!Настрой контент под пользователя!
Настрой контент под пользователя!
 
Практика машинного обучения: вопросы и проблемы при работе над ML-проектом
Практика машинного обучения: вопросы и проблемы при работе над ML-проектомПрактика машинного обучения: вопросы и проблемы при работе над ML-проектом
Практика машинного обучения: вопросы и проблемы при работе над ML-проектом
 
практика 5
практика 5практика 5
практика 5
 
Формирование технологической и информационной компетентности школьников при и...
Формирование технологической и информационной компетентности школьников при и...Формирование технологической и информационной компетентности школьников при и...
Формирование технологической и информационной компетентности школьников при и...
 
л 2 7
л 2 7л 2 7
л 2 7
 
!Predictive analytics part_2
!Predictive analytics part_2!Predictive analytics part_2
!Predictive analytics part_2
 
Машинное обучение
Машинное обучениеМашинное обучение
Машинное обучение
 
Machine
MachineMachine
Machine
 
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучениеHub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучение
 
Моделирование поведения сложных динамических систем
Моделирование поведения сложных динамических системМоделирование поведения сложных динамических систем
Моделирование поведения сложных динамических систем
 
20120415 videorecognition konushin_lecture06
20120415 videorecognition konushin_lecture0620120415 videorecognition konushin_lecture06
20120415 videorecognition konushin_lecture06
 
обработка информации и алгоритмы
обработка информации  и алгоритмыобработка информации  и алгоритмы
обработка информации и алгоритмы
 
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ ОБУЧЕНИЯ МЕТОДАМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ГЕНЕРА...
 
Stat 3 alpha
Stat 3 alphaStat 3 alpha
Stat 3 alpha
 

4 azure 24 04

  • 2. Машинное обучение — процесс, в результате которого машина (компьютер) способна показывать поведение, которое в нее не было явно заложено (запрограммировано) (Arthur Samuel, 1959) Говорят, что компьютерная программа обучается на основе опыта E по отношению к некоторому классу задач T и меры качества P, если качество решения задач из T, измеренное на основе P, улучшается с приобретением опыта E. (Tom Mitchel, 1998) Что такое Машинное Обучение? Это компьютерные системы, которые становятся умнее с полученным опытом.
  • 3. Виды машинного обучения Машинное обучение Машинное обучение Машинное обучение Индуктивное обучение Обучение с учителем Обучение без учителя Обучение с подкреплением Дедуктивное обучение
  • 4. Обучение с учителем Такое обучение можно рассматривать как игру двух лиц: ученика, который должен восстановить зависимость, и учителя, который для объектов из обучающей выборки указывает ученику соответствующий им выход. Обучение без учителя. В этом случае нет учителя и «обучающая выборка» состоит только из объектов. Ученик, имея только список объектов должен определить, как объекты связаны друг с другом. Виды индуктивного машинного обучения
  • 5. Процесс машинного обучения Определение задачи Сбор и подготовка данных Обучение модели Проверка результата Работа Обучающая выборка (training sample) — выборка, по которой производится настройка (оптимизация параметров) модели зависимости. Тестовая (или контрольная) выборка (test sample) — выборка, по которой оценивается качество построенной модели.
  • 6. Чем машинное обучение может вам помочь? Социальные медиа Предсказание погоды Медицинская диагностика Диагностическое обслуживание Таргетированная реклама Разведка природных ресурсов Детектирование спама Анализ данных телеметрии Программы лояльности Анализ оттока клиентов Научные исследования Оптимизация веб-приложений Обнаружение сетевых атак Умные системы мониторинга
  • 7. Azure Machine Learning – облачный сервис для выполнения задач прогнозной аналитики (predictive analytics). Сервис представлен двумя компонентами: Azure ML Studio – средой разработки, доступной через web-интерфейс, и web- сервисами Azure ML. Определение Azure ML
  • 8. Внешние и внутренние источники Контрольные панелиОтчеты Вопросы Мобильные устройства Управление информациейПодготовка данных ETL Предсказания Реляционные СУБД NoSQL OLAP Приложения Потоки данных  Data Azure ML
  • 9. Решение любых аналитических задач Результаты вычислений всегда будут доступны для пользователей, везде.
  • 10. Сбор и подготовка данных Импорт данных: • Импорт данных из SQL, Azure HD, Azure Blob & Tables Преобразования данных: • Добавления недостающих значений, очистка, нормализация, группировка Определение контекста: • Отношения, связи, корреляции, особенности, построение дескриптивной статистики Задача Сбор и подготовка данных Обучение модели Проверка результата Работа
  • 11. Работа с обучающей выборкой Разделение данных: • Частичные срезы, деление пополам, выборка образцов Обучение: • Регрессия Байесовская линейная, Линейная R,Порядковая регрессия,ANN…. • Классификация «Усиленные деревья принятия решений», «Лес решений», «Джунгли решений», «Логистическая регрессия»,SVM,ANN… • Кластеризация K-means («метод k-средних») • Поиск аномалий PCA (Principal Component Analysis) Задача Сбор и подготовка данных Обучение модели Проверка результата Работа
  • 12. Оценка модели плохие примеры (True Negative, TN) Задача Сбор и подготовка данных Обучение модели Проверка результата Работа (True Positive, TP) - хорошие примеры (True Negative, TN) - плохие примеры Где:
  • 13. Что дальше? • Опубликуйте ML-модель как веб- сервис • Настройте работу с API • Опубликуйте результат в Azure Marketplace Задача Сбор и подготовка данных Обучение модели Проверка результата Работа
  • 14. Примеры Microsoft Azure Machine Learning в действии:
  • 16. Данные интегрируются из ERP системы Dynamics AX, на их основании прогнозируется потребительский спрос на товары. В качестве обучающей выборки используются данные о продажах за последние три года. Цель внедрения технологий машинного обучения состоит в создании мониторинговой системы с возможностью прогнозирования отказов оборудования. Данные (включая коды ошибок и диагностическую информацию) собираются с датчиков и отправляются на концентраторы событий в Azure. 2 интересных кейса из мировой практики
  • 18. Предпосылки Оптимизация цены поэтапно увеличивает продажи и прибыль. Исследование Yankee Group показывает, что возврат инвестиций от подобных систем приближается к 20%.
  • 19. Принцип работы 1. Спрос на каждый товар зависит (уменьшается) от цены на него в данном магазине. 2. Спрос на товар зависит (увеличивается) в зависимости от цены на товар-заменитель. Вывод: для прогнозирования спроса на данный товар надо учитывать цены на группу товаров.
  • 20. Принцип работы 1. Регрессия. Для каждого товара находим зависимость спроса на него в зависимости от магазина и цен на группу товаров. Спрос на товар 1 = f1(Магазин, Цена1, …, Цена5, Другие факторы) …. Спрос на товар 5 = f5(Магазин, Цена1, …, Цена5, Другие факторы) 2. Оптимизация. Находим максимум суммарного ожидаемого оборота (по всем товарам по всем магазинам) как функцию от вектора цен на товары. Целевая функция: Ожидаемый оборот по всем товарам по всем магазинам = Сумма по магазинам(Ц1 * f1(Мi, Ц1,…,Ц5) + … + Ц5 * f5(Мi, Ц1,…,Ц5)) Ограничения: диапазоны цен Задача оптимизации: найти цены, при которых ожидаемый оборот максимален.
  • 21. Алгоритм работы системы оптимизации цен Microsoft Azure Machine Learning 21 Моделирование спроса Рекомендуемые цены Проверка на соответствие ценовым и маркетинговым стратегиям, действующему законодательству РФ Чеки Цены конкурентов (опционально) Оптимизация вектора цен на группу товаров Вывод цены на ценник Выявление кластеров и групп товаров
  • 23. R код расчёта оптимальных цен
  • 24. Анализ и оценка построенной модели по каждой товарной группе Первый график – сведение фактических данных и полученных из построенной модели спроса. Коэффициент корреляции corr= 0,984 Идеальная линия – 45 градусов Второй график – распределение ошибок Идеальный график – нормальное распределение
  • 25. Обратите внимание на приложения в магазине: datamarket.azure.com Попробуйте Azure ML бесплатно на сайте: azure.com/ml

Hinweis der Redaktion

  1. Дедуктивное и индуктивное обучения У людей обучение происходит в результате ознакомления с правилами, теориями, инструкциями и т. п. и/или на основе опыта (собственного или чужого). По аналогичному принципу можно выделить различные способы обучения и в искусственных системах: • Дедуктивное, или аналитическое, обучение (экспертные системы). Имеются знания, сформулированные экспертом и как-то формализованные . Программа выводит из этих правил конкретные факты и новые правила. • Индуктивное обучение ( ≈ статистическое обучение). На основе эмпирических данных программа строит общее правило. Э мпирические данные могут быть получены самой программой в предыдущие сеансы ее работы или просто предъявлены ей. (Определение Митчелла относится только к такому обучению)
  2. Классификация задач индуктивного обучения: • Обучение с учителем, или обучение по прецедентам (supervised learning). • Обучение без учителя (unsupervised learning). • Активное обучение (active learning). … Обучение по прецедентам — это обучение с учителем Такое обучение можно рассматривать как игру двух лиц: ученика, который должен восстановить зависимость, и учителя, который для объектов из обучающей выборки указывает ученику соответствующий им выход. Иногда можно считать, что объекты из обучающей выборки предъявляются средой, а иногда — их выбирает сам учитель, в некоторых случаях их выбирает ученик (активное обучение). Рассматривается также обучение без учителя. В этом случае нет учителя и «обучающая выборка» состоит только из объектов. Ученик, имея только список объектов x(1), x(2), . . . , x (N), должен определить, как объекты связаны друг с другом. Например, разбить объекты на группы (кластеры), так, чтобы в одном кластере оказались близкие друг к другу объекты, а в разных кластерах объекты были существенно различные
  3. Обучающая выборка (training sample) — выборка, по которой производится настройка (оптимизация параметров) модели зависимости. Если модель зависимости построена по обучающей выборке , то оценка качества этой модели, сделанная по той же выборке  оказывается, как правило, оптимистически смещённой. Это нежелательное явление называют переобучением. На практике оно встречается очень часто. Хорошую эмпирическую оценку качества построенной модели даёт её проверка на независимых данных, которые не использовались для обучения. Тестовая (или контрольная) выборка (test sample) — выборка, по которой оценивается качество построенной модели. Если обучающая и тестовая выборки независимы, то оценка, сделанная по тестовой выборке, является несмещённой. Оценку качества, сделанную по тестовой выборке, можно применить для выбора наилучшей модели. Однако тогда она снова окажется оптимистически смещённой. Для получения немсещённой оценки выбранной модели приходится выделять третью выборку. http://static.codeinstinct.pro/images/machine_learning_flow_(v2).png
  4. . Сферы приложения: • Компьютерное зрение (computer vision) • Распознавание речи (speech recognition • Компьютерная лингвистика и обработка естественных языков (natural language processing) • Медицинская диагностика • Биоинформатика • Техническая диагностика • Финансовые приложения • Рубрикация, аннотирование и упрощение текстов • Информационный поиск • Интеллектуальные игры
  5.   Below are just a few highlights.   Azure-allows for ML to be available on the cloud. Developers can build learning capabilities of their own. http://azure.microsoft.com/en-us/ Bing-ML is used to make search results relevant to the user. But ML in Bing offers so much more—read here: http://www.bloomberg.com/bw/articles/2013-03-13/why-bing-is-critical-to-microsofts-it-empire Ads-ML is used to ensure advertisements are relevant to the user Bing Distill- http://www.infoworld.com/article/2898354/machine-learning/how-bing-distill-could-feed-microsoft-machine-learning.html and http://www.bing.com/distill Skype Translator-Skype Translator is built on a robust ML platform. ML protocols train and optimize speech recognition and automatic machine translation. ML does so much more here but those are a couple of things you can highlight. Office Online/Insights for Office- it brings together Bing, machine learning and Office to create a new way to find locate valuable content. At its heart, this is a new search feature for Office Online but it works by bringing contextual content to the forefront of your searches. Office 365-ML is used to decluter mailboxes (spam filter-like). For more info: http://blogs.office.com/2014/11/11/de-clutter-inbox-office-365/ Office 365-Delve. Previously known as Oslo, Delve brings a concierge, Instagram-like pulse to business environments, as curated by Office Graph, sophisticated machine-learning technology that maps relationships between people, content, and activity across Office 365 accounts. Delve pulls content from within your organization's OneDrive, SharePoint, and Yammer accounts, serving it up to users in a card-based interface reminiscent of Pinterest. Source for more info: http://www.infoworld.com/article/2608911/cloud-computing/cloud-computing-microsoft-s-delve-the-office-365-spy-you-just-might-love.html Cortana-ML (speech recognition and NLP is used as well) is used so Cortana can continually learn about its user and become more and more personalized. Cortana has access to phone data and ML is then used to improve knowledge of context and connections. Windows-when launching an app ML is telling the system which apps to preload into memory. Kinect-ML is used for gesture recognition Microsoft Band and Microsoft Health-ML is used to continuously improve your health based on information that is collected on the Band. Source: http://www.microsoft.com/Microsoft-Health/en-us Built in the cloud, Microsoft Health will continually evolve to offer you better experiences and more valuable data over time. The more you share with Microsoft Health, the more accurate and helpful your insights will become. As the fitness community and device and service partnerships grow, Microsoft Health will be able to generate the best wellness insights for you to thrive. HoloLens- source: http://www.microsoft.com/microsoft-hololens/en-us?OCID=WIP_r_Mar_Body_HoloLens for gesture recognition, speech recognition, video processing, image processing     Here is some other info that might be useful to you. In particular, Joseph’s video under the welcome tab and the ML at a glance tab.   Click here to learn more about Machine Learning at Microsoft Microsoft's Bing prediction engine correctly predicts all six top Oscars 2015 winners ML Blog Team 24 Feb 2015 7:30 PM 1 As reported by The Verge, the Microsoft Bing prediction engine – which has had great success in the past at predicting the World Cup, English soccer results and NFL games – successfully predicted the best picture, best director, best actor, best actress, supporting actor and actress out of the top awards for the 2015 Oscars. In fact, Bing successfully predicted 84 percent of the 24 Oscar 2015 results.The prediction model was managed by Microsoft researcher David Rothschild, who, in the past, correctly predicted 21 of 24 Oscar winners in 2014 and 19 of 24 winners in 2013. In comparison, Vegas odds from the Wynn casino weren’t nearly as accurate – the Wynn predicted best picture, best actress, best actor, best supporting actress, best supporting actor, and best director, but only managed to correct 4 of 6 correctly. Microsoft predicted all six accurately.   ML Blog Team  
  6. http://www.techrepublic.com/article/from-connected-cows-to-everlasting-elevators-how-businesses-are-using-machine-learning/
  7. If you haven’t tried ML yet, we encourage you to take it for a spin risk free. Go to azure.com/ml, click on “Get Started” and enter in your Microsoft Account ID and you’re off to the races.