SlideShare ist ein Scribd-Unternehmen logo
1 von 22
Слоны в облаках
работаем с Hadoop в Windows Azure

                                    Владимир Юнев
                                    Microsoft
Big Data и Microsoft
         Как мы поддерживаем Hadoop
Agenda
         Hadoop в Windows Azure
         как сервис по требованию
Насколько
«Big Data»
биг сегодня?
1 PETABYTE
       данных в секунду получает Большой адронный коллайдер
CERN
9000
8000
7000
6000
5000
4000
3000
2000
1000
   0
       2005   2008   2015
Интернет видео – 18 Экзабайт в месяц
                 Мобильный трафик – 2 Экзабайта в месяц
                 В 2011 году Фейсбук перенес 11 Петабайт
                 данных в свой Hadoop кластер
Big «Big Data»   Пользователи Twitter создают более
                 1 терабайта сообщений в день
                 Cisco предполагает что к 2013 интернет
                 трафик достигнет величины 667 экзабайт ( в
                 год ), а к 2015 – превысит 1 Зеттабайт
Big
unstructured
data
* by Gartner
4 триллиона
             объектов в
             Windows Azure
Microsoft
и Big Data
                   Bing скачивает
                   7 петабайт
                   данных в месяц
500 миллионов активных
             аккаунтов Microsoft Account
             460 миллионов уникальных
             пользователей MSN в месяц
             355 миллионов пользователей почты Hotmail
Microsoft
и Big Data   5.5+ миллиардов запросов к Bing в месяц
             40 миллионов активных пользователей Xbox Live
             14 миллиардов показов рекламы
             Microsoft Advertising в месяц
             2-4 миллиарда писем в Office 365 ежедневно
Microsoft
и Apache Hadoop
Microsoft - Platinum Sponsor
Apache Software Foundation     SQL Server Connector for Apache Hadoop
                               www.microsoft.com/download/en/details.aspx?id=27584
                               Open source Hadoop .NET SDK
                               http://hadoopsdk.codeplex.com/
Microsoft
                               Hive Add-in for Excel и Hive ODBC Driver
и Apache
Hadoop                         Microsoft HDInsight –
                               100% Hadoop для Windows Server
                               http://www.microsoft.com/bigdata
                               Windows Azure HDInsight
                               http://HadoopOnAzure.com
HDInsight на сервере и в облаке
            100% opensource-реализация платформы Apache Hadoop
            знакомые инструменты для работы с данными (Excel, BI)
            HDFS, MapReduce, Pig, Hive, Zookeeper, Mahout, …
Microsoft
            интеграция с SQL Server, обмен данными
HDInsight   быстрое развертывание
            инструменты управления Apache Ambari+System Center
            интеграция и безопасность с Active Directory
            доступ к сервису по требованию к облаке Windows Azure
SQL Server 2012 Parallel Data Warehouse
              движок PolyBase для запросов между
              реляционными данными и данными Hadoop
              Connector for Apache Hadoop для перемещения
              данных из SQL Server в HDFS и обратно
Анонс         загрузка данных с SQL Server Integration Services
PASS Summit   аналитика, MOLAP-кубы с SQL Server Analysis Services
              и визуализация с PowerPivot for Excel
              интеграция с MicroStrategy, SAP Business Objects, SAS
              выход в 2013 году
Hadoop
                                cluster
               Hadoop cluster




Могут ли
слоны летать
в облаках?
Windows
Azure
Кластер
                             по запросу




Windows Azure
HDInsight



                 Кластер
                по запросу
Создание
кластера
Работа с Hadoop
Демо   в Windows Azure
Microsoft вкладывает силы
             и средства в Apache Hadoop
             HDInsight – 100% Hadoop от Microsoft
Заключение
             Hadoop как сервис по требованию
             доступен в Windows Azure
             Слоны могут летать в облаках!
Владимир Юнев
                эксперт по стратегическим технологиям, Microsoft
                vyunev@microsoft.com
                Twitter - @XaocCPS
Всем спасибо!   Facebook – facebook.com/Yunev
Ваши вопросы    Blog – blogs.msdn.com/b/vyunev

                http://www.microsoft.com/bigdata
                http://HadoopOnAzure.com




                WindowsAzure.com AzureHub.ru

Weitere ähnliche Inhalte

Was ist angesagt?

Александр Сербул —1С-Битрикс — ICBDA 2015
Александр Сербул —1С-Битрикс — ICBDA 2015Александр Сербул —1С-Битрикс — ICBDA 2015
Александр Сербул —1С-Битрикс — ICBDA 2015rusbase
 
5. Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
5.	Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning5.	Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
5. Готовые инструменты Azure: бизнес-прогнозирования в Machine LearningTechExpert
 
3 krot riw_2015_3
3 krot riw_2015_33 krot riw_2015_3
3 krot riw_2015_3antishmanti
 
«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»Nata_Churda
 
облачные технологии
облачные технологииоблачные технологии
облачные технологииTamYan
 

Was ist angesagt? (6)

Александр Сербул —1С-Битрикс — ICBDA 2015
Александр Сербул —1С-Битрикс — ICBDA 2015Александр Сербул —1С-Битрикс — ICBDA 2015
Александр Сербул —1С-Битрикс — ICBDA 2015
 
5. Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
5.	Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning5.	Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
5. Готовые инструменты Azure: бизнес-прогнозирования в Machine Learning
 
3 krot riw_2015_3
3 krot riw_2015_33 krot riw_2015_3
3 krot riw_2015_3
 
Sky-Dep
Sky-DepSky-Dep
Sky-Dep
 
«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»«Облачная платформа Windows Azure для высоконагруженных проектов»
«Облачная платформа Windows Azure для высоконагруженных проектов»
 
облачные технологии
облачные технологииоблачные технологии
облачные технологии
 

Andere mochten auch

2 я.студент леванов map reduce
2 я.студент леванов map reduce2 я.студент леванов map reduce
2 я.студент леванов map reduceYandex
 
Cостав дистрибутва Hortonworks data platform 2.3
Cостав дистрибутва Hortonworks data platform 2.3Cостав дистрибутва Hortonworks data platform 2.3
Cостав дистрибутва Hortonworks data platform 2.3Евгений Плакса
 
Mapreduce in JavaScript
Mapreduce in JavaScriptMapreduce in JavaScript
Mapreduce in JavaScriptViktor Turskyi
 
О.В.Сухорослов "MapReduce"
О.В.Сухорослов "MapReduce"О.В.Сухорослов "MapReduce"
О.В.Сухорослов "MapReduce"Yandex
 
ADD2010: Обработка большого объема данных на платформеApache Hadoop
ADD2010: Обработка большого объема данных на платформеApache Hadoop ADD2010: Обработка большого объема данных на платформеApache Hadoop
ADD2010: Обработка большого объема данных на платформеApache Hadoop Vladimir Klimontovich
 
Solit 2014, MapReduce и машинное обучение на hadoop и mahout, Слисенко Конста...
Solit 2014, MapReduce и машинное обучение на hadoop и mahout, Слисенко Конста...Solit 2014, MapReduce и машинное обучение на hadoop и mahout, Слисенко Конста...
Solit 2014, MapReduce и машинное обучение на hadoop и mahout, Слисенко Конста...solit
 
Платформа Apache Hadoop
Платформа Apache HadoopПлатформа Apache Hadoop
Платформа Apache HadoopDotNetConf
 
Курс "Хранение и Обработка больших данны". Лекция 5 YARN
Курс "Хранение и Обработка больших данны". Лекция 5 YARNКурс "Хранение и Обработка больших данны". Лекция 5 YARN
Курс "Хранение и Обработка больших данны". Лекция 5 YARNPavel Mezentsev
 
Лекция 6. MapReduce в Hadoop (графы)
Лекция 6. MapReduce в Hadoop (графы)Лекция 6. MapReduce в Hadoop (графы)
Лекция 6. MapReduce в Hadoop (графы)Technopark
 
Лекция 1. Введение в Big Data и MapReduce
Лекция 1. Введение в Big Data и MapReduceЛекция 1. Введение в Big Data и MapReduce
Лекция 1. Введение в Big Data и MapReduceTechnopark
 
Лекция 4. MapReduce в Hadoop (введение)
Лекция 4. MapReduce в Hadoop (введение)Лекция 4. MapReduce в Hadoop (введение)
Лекция 4. MapReduce в Hadoop (введение)Technopark
 

Andere mochten auch (15)

2 я.студент леванов map reduce
2 я.студент леванов map reduce2 я.студент леванов map reduce
2 я.студент леванов map reduce
 
Cостав дистрибутва Hortonworks data platform 2.3
Cостав дистрибутва Hortonworks data platform 2.3Cостав дистрибутва Hortonworks data platform 2.3
Cостав дистрибутва Hortonworks data platform 2.3
 
Mapreduce in JavaScript
Mapreduce in JavaScriptMapreduce in JavaScript
Mapreduce in JavaScript
 
О.В.Сухорослов "MapReduce"
О.В.Сухорослов "MapReduce"О.В.Сухорослов "MapReduce"
О.В.Сухорослов "MapReduce"
 
ADD2010: Обработка большого объема данных на платформеApache Hadoop
ADD2010: Обработка большого объема данных на платформеApache Hadoop ADD2010: Обработка большого объема данных на платформеApache Hadoop
ADD2010: Обработка большого объема данных на платформеApache Hadoop
 
Apache Hadoop
Apache HadoopApache Hadoop
Apache Hadoop
 
Solit 2014, MapReduce и машинное обучение на hadoop и mahout, Слисенко Конста...
Solit 2014, MapReduce и машинное обучение на hadoop и mahout, Слисенко Конста...Solit 2014, MapReduce и машинное обучение на hadoop и mahout, Слисенко Конста...
Solit 2014, MapReduce и машинное обучение на hadoop и mahout, Слисенко Конста...
 
Платформа Apache Hadoop
Платформа Apache HadoopПлатформа Apache Hadoop
Платформа Apache Hadoop
 
Курс "Хранение и Обработка больших данны". Лекция 5 YARN
Курс "Хранение и Обработка больших данны". Лекция 5 YARNКурс "Хранение и Обработка больших данны". Лекция 5 YARN
Курс "Хранение и Обработка больших данны". Лекция 5 YARN
 
Map reduce
Map reduceMap reduce
Map reduce
 
Лекция 6. MapReduce в Hadoop (графы)
Лекция 6. MapReduce в Hadoop (графы)Лекция 6. MapReduce в Hadoop (графы)
Лекция 6. MapReduce в Hadoop (графы)
 
Лекция 1. Введение в Big Data и MapReduce
Лекция 1. Введение в Big Data и MapReduceЛекция 1. Введение в Big Data и MapReduce
Лекция 1. Введение в Big Data и MapReduce
 
Лекция 4. MapReduce в Hadoop (введение)
Лекция 4. MapReduce в Hadoop (введение)Лекция 4. MapReduce в Hadoop (введение)
Лекция 4. MapReduce в Hadoop (введение)
 
Distributed systems
Distributed systemsDistributed systems
Distributed systems
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
 

Ähnlich wie Слоны в облаках

Windows Azure - BigData and Hadoop
Windows Azure - BigData and HadoopWindows Azure - BigData and Hadoop
Windows Azure - BigData and HadoopAlexey Bokov
 
Windows azure
Windows azureWindows azure
Windows azureExpolink
 
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
Informatica for Data Warehouse Optimisation and Data Lake Use-casesInformatica for Data Warehouse Optimisation and Data Lake Use-cases
Informatica for Data Warehouse Optimisation and Data Lake Use-casesIlya Gershanov
 
Виртуализация Данных: Введение
Виртуализация Данных: ВведениеВиртуализация Данных: Введение
Виртуализация Данных: ВведениеDenodo
 
Лекция 2. Основы Hadoop
Лекция 2. Основы HadoopЛекция 2. Основы Hadoop
Лекция 2. Основы HadoopTechnopark
 
Hivext – облачная платформа для быстрой разработки интернет приложений
Hivext – облачная платформа для быстрой разработки  интернет приложений Hivext – облачная платформа для быстрой разработки  интернет приложений
Hivext – облачная платформа для быстрой разработки интернет приложений guest800050
 
Introductory Keynote at Hadoop Workshop by Ospcon (2014)
Introductory Keynote at Hadoop Workshop by Ospcon (2014)Introductory Keynote at Hadoop Workshop by Ospcon (2014)
Introductory Keynote at Hadoop Workshop by Ospcon (2014)Andrei Nikolaenko
 
Решения Oracle для Big Data
Решения Oracle для Big DataРешения Oracle для Big Data
Решения Oracle для Big DataAndrey Akulov
 
Big Data Open Lab
Big Data Open LabBig Data Open Lab
Big Data Open LabDell_Russia
 
Creara technologies
Creara technologiesCreara technologies
Creara technologiesCreara
 
Microsoft reConnect
Microsoft reConnect Microsoft reConnect
Microsoft reConnect Microsoft
 
AZadonsky New Cloud Services
AZadonsky New Cloud ServicesAZadonsky New Cloud Services
AZadonsky New Cloud ServicesVasily Demin
 
Облачные сервисы Майкрософт для мобильных приложений. Application Insights и ...
Облачные сервисы Майкрософт для мобильных приложений. Application Insights и ...Облачные сервисы Майкрософт для мобильных приложений. Application Insights и ...
Облачные сервисы Майкрософт для мобильных приложений. Application Insights и ...Microsoft
 
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft AzureJelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft AzureDmitry Lazarenko
 
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...it-people
 

Ähnlich wie Слоны в облаках (20)

Windows Azure - BigData and Hadoop
Windows Azure - BigData and HadoopWindows Azure - BigData and Hadoop
Windows Azure - BigData and Hadoop
 
Windows azure
Windows azureWindows azure
Windows azure
 
3 ibm bdw2015
3 ibm bdw20153 ibm bdw2015
3 ibm bdw2015
 
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
Informatica for Data Warehouse Optimisation and Data Lake Use-casesInformatica for Data Warehouse Optimisation and Data Lake Use-cases
Informatica for Data Warehouse Optimisation and Data Lake Use-cases
 
Виртуализация Данных: Введение
Виртуализация Данных: ВведениеВиртуализация Данных: Введение
Виртуализация Данных: Введение
 
Лекция 2. Основы Hadoop
Лекция 2. Основы HadoopЛекция 2. Основы Hadoop
Лекция 2. Основы Hadoop
 
Hivext 04.2010
Hivext 04.2010Hivext 04.2010
Hivext 04.2010
 
Hivext – облачная платформа для быстрой разработки интернет приложений
Hivext – облачная платформа для быстрой разработки  интернет приложений Hivext – облачная платформа для быстрой разработки  интернет приложений
Hivext – облачная платформа для быстрой разработки интернет приложений
 
4CIO.ppt
4CIO.ppt4CIO.ppt
4CIO.ppt
 
4CIO.ppt
4CIO.ppt4CIO.ppt
4CIO.ppt
 
Introductory Keynote at Hadoop Workshop by Ospcon (2014)
Introductory Keynote at Hadoop Workshop by Ospcon (2014)Introductory Keynote at Hadoop Workshop by Ospcon (2014)
Introductory Keynote at Hadoop Workshop by Ospcon (2014)
 
Решения Oracle для Big Data
Решения Oracle для Big DataРешения Oracle для Big Data
Решения Oracle для Big Data
 
Big Data Open Lab
Big Data Open LabBig Data Open Lab
Big Data Open Lab
 
Creara technologies
Creara technologiesCreara technologies
Creara technologies
 
Microsoft reConnect
Microsoft reConnect Microsoft reConnect
Microsoft reConnect
 
AZadonsky New Cloud Services
AZadonsky New Cloud ServicesAZadonsky New Cloud Services
AZadonsky New Cloud Services
 
Ms it cup win-team - мевв
Ms it cup   win-team - меввMs it cup   win-team - мевв
Ms it cup win-team - мевв
 
Облачные сервисы Майкрософт для мобильных приложений. Application Insights и ...
Облачные сервисы Майкрософт для мобильных приложений. Application Insights и ...Облачные сервисы Майкрософт для мобильных приложений. Application Insights и ...
Облачные сервисы Майкрософт для мобильных приложений. Application Insights и ...
 
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft AzureJelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
Jelastic PaaS for DevOps: Hybrid Cloud based on Microsoft Azure
 
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
DUMP-2013 Наука и жизнь - Использование Hadoop в машинном обучении - Созыкин ...
 

Слоны в облаках

  • 1. Слоны в облаках работаем с Hadoop в Windows Azure Владимир Юнев Microsoft
  • 2. Big Data и Microsoft Как мы поддерживаем Hadoop Agenda Hadoop в Windows Azure как сервис по требованию
  • 4. 1 PETABYTE данных в секунду получает Большой адронный коллайдер CERN
  • 5.
  • 7.
  • 8. Интернет видео – 18 Экзабайт в месяц Мобильный трафик – 2 Экзабайта в месяц В 2011 году Фейсбук перенес 11 Петабайт данных в свой Hadoop кластер Big «Big Data» Пользователи Twitter создают более 1 терабайта сообщений в день Cisco предполагает что к 2013 интернет трафик достигнет величины 667 экзабайт ( в год ), а к 2015 – превысит 1 Зеттабайт
  • 10. 4 триллиона объектов в Windows Azure Microsoft и Big Data Bing скачивает 7 петабайт данных в месяц
  • 11. 500 миллионов активных аккаунтов Microsoft Account 460 миллионов уникальных пользователей MSN в месяц 355 миллионов пользователей почты Hotmail Microsoft и Big Data 5.5+ миллиардов запросов к Bing в месяц 40 миллионов активных пользователей Xbox Live 14 миллиардов показов рекламы Microsoft Advertising в месяц 2-4 миллиарда писем в Office 365 ежедневно
  • 13. Microsoft - Platinum Sponsor Apache Software Foundation SQL Server Connector for Apache Hadoop www.microsoft.com/download/en/details.aspx?id=27584 Open source Hadoop .NET SDK http://hadoopsdk.codeplex.com/ Microsoft Hive Add-in for Excel и Hive ODBC Driver и Apache Hadoop Microsoft HDInsight – 100% Hadoop для Windows Server http://www.microsoft.com/bigdata Windows Azure HDInsight http://HadoopOnAzure.com
  • 14. HDInsight на сервере и в облаке 100% opensource-реализация платформы Apache Hadoop знакомые инструменты для работы с данными (Excel, BI) HDFS, MapReduce, Pig, Hive, Zookeeper, Mahout, … Microsoft интеграция с SQL Server, обмен данными HDInsight быстрое развертывание инструменты управления Apache Ambari+System Center интеграция и безопасность с Active Directory доступ к сервису по требованию к облаке Windows Azure
  • 15. SQL Server 2012 Parallel Data Warehouse движок PolyBase для запросов между реляционными данными и данными Hadoop Connector for Apache Hadoop для перемещения данных из SQL Server в HDFS и обратно Анонс загрузка данных с SQL Server Integration Services PASS Summit аналитика, MOLAP-кубы с SQL Server Analysis Services и визуализация с PowerPivot for Excel интеграция с MicroStrategy, SAP Business Objects, SAS выход в 2013 году
  • 16. Hadoop cluster Hadoop cluster Могут ли слоны летать в облаках?
  • 18. Кластер по запросу Windows Azure HDInsight Кластер по запросу
  • 21. Microsoft вкладывает силы и средства в Apache Hadoop HDInsight – 100% Hadoop от Microsoft Заключение Hadoop как сервис по требованию доступен в Windows Azure Слоны могут летать в облаках!
  • 22. Владимир Юнев эксперт по стратегическим технологиям, Microsoft vyunev@microsoft.com Twitter - @XaocCPS Всем спасибо! Facebook – facebook.com/Yunev Ваши вопросы Blog – blogs.msdn.com/b/vyunev http://www.microsoft.com/bigdata http://HadoopOnAzure.com WindowsAzure.com AzureHub.ru