SlideShare a Scribd company logo
1 of 22
Использование  данных семантического веба  поисковыми системами Владимир Горовой ВШМ СПбГУ [email_address] http://twitter.com/vgorovoy
Содержание ,[object Object],[object Object],[object Object]
Основной тренд Поисковые системы стимулируют вебмастеров для получения семантических данных
Сниппеты
RDF Тройки ( Triples): “ Cambridge Semantics is headquartered in Massachusetts”: subject object predicate Cambridge Semantics headquartered Massachusetts
Микроформаты и  RDFa Аннотирование  HTML  метаданными Отличие: Жестко заданные виды метаданных в микроформатах ( hCard, hReview …)  и использование словарей ( Dublin Core,  словарь Гугла и т.д.) в  RDFa
RDFa
Микроформаты
Подход  Google (Rich Snippets) ,[object Object],[object Object],[object Object],[object Object],[object Object]
Подход  Yahoo (Search Monkey) ,[object Object],[object Object],[object Object]
Подход Яндекса ,[object Object],[object Object],[object Object]
Адреса организаций hCard,  выгрузка в специальном формате и заполнение в Я.Вебмастере
Рецепты hRecipe  и в виде  XML- фида
Рефераты В виде  XML- фида
Словари Внимание:  microdata (html5)
Словари
Поддержка в  CMS ,[object Object],[object Object],[object Object]
Где  RDFa  и микроформаты уже есть? STW Thesaurus for Economics
FOAF FOAF (Friend of a Friend) –  онтология для описания людей, групп и отношений между ними Yandex FOAF Extension –  расширение  FOAF , определяющее классы для постов, комментариев, читателей и т.п. ( http://api.yandex.ru/blogs/doc/indexation/appendices/yandex-foaf-ext-rdf.xml )
Использование  FOAF   API  поиска по блогам:  http://blogs.yandex.ru/search_profiles_atom.xml?text= лебедев
Использование  Freebase
Спасибо ! ? Владимир Горовой ВШМ СПбГУ [email_address] http://twitter.com/vgorovoy

More Related Content

Similar to Использование данных семантического веба поисковыми системами

Семантический HTML5 - iForum
Семантический HTML5 - iForumСемантический HTML5 - iForum
Семантический HTML5 - iForumakrakovetsky
 
Semantic web и schema.org для интернет магазинов (Cергей Cиница)
Semantic web и schema.org для интернет магазинов (Cергей Cиница)Semantic web и schema.org для интернет магазинов (Cергей Cиница)
Semantic web и schema.org для интернет магазинов (Cергей Cиница)DrupalYug
 
Инфраструктура социального проекта
Инфраструктура социального проектаИнфраструктура социального проекта
Инфраструктура социального проектаMedia Gorod
 
Методы повышения CTR (микроформаты)
Методы повышения CTR (микроформаты)Методы повышения CTR (микроформаты)
Методы повышения CTR (микроформаты)Ashmanov and partners Ukraine
 
Методы повышения Ctr (микроформаты)
Методы повышения Ctr (микроформаты)Методы повышения Ctr (микроформаты)
Методы повышения Ctr (микроформаты)Fedotov Alex
 
2015-12-12 | AzovDevMeetup 2015 | Enterprise приложения на PHP | Павел Крынецкий
2015-12-12 | AzovDevMeetup 2015 | Enterprise приложения на PHP | Павел Крынецкий2015-12-12 | AzovDevMeetup 2015 | Enterprise приложения на PHP | Павел Крынецкий
2015-12-12 | AzovDevMeetup 2015 | Enterprise приложения на PHP | Павел КрынецкийJSC “Arcadia Inc”
 
DUMP-2013 Наука и жизнь - Практические применения семантических вычислений - ...
DUMP-2013 Наука и жизнь - Практические применения семантических вычислений - ...DUMP-2013 Наука и жизнь - Практические применения семантических вычислений - ...
DUMP-2013 Наука и жизнь - Практические применения семантических вычислений - ...it-people
 
Практическое применение семантического анализа для фильтрации трафика (Яков М...
Практическое применение семантического анализа для фильтрации трафика (Яков М...Практическое применение семантического анализа для фильтрации трафика (Яков М...
Практическое применение семантического анализа для фильтрации трафика (Яков М...Ontico
 
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...Vitaly Yushkevich
 
Creara technologies
Creara technologiesCreara technologies
Creara technologiesCreara
 
Мировые информационные ресурсы. Лекция 5
Мировые информационные ресурсы. Лекция 5Мировые информационные ресурсы. Лекция 5
Мировые информационные ресурсы. Лекция 5Dmitriy Krukov
 
C# Web. Занятие 01.
C# Web. Занятие 01.C# Web. Занятие 01.
C# Web. Занятие 01.Igor Shkulipa
 
Презентация «Drupal и SEO» с московской DrupalConf 2011
Презентация «Drupal и SEO» с московской DrupalConf 2011Презентация «Drupal и SEO» с московской DrupalConf 2011
Презентация «Drupal и SEO» с московской DrupalConf 2011Alexey Kostin
 
Мастер-класс "Привет, Drupal"
Мастер-класс "Привет, Drupal"Мастер-класс "Привет, Drupal"
Мастер-класс "Привет, Drupal"zabej
 
!2hl++2008 Restful Architechture
!2hl++2008 Restful Architechture!2hl++2008 Restful Architechture
!2hl++2008 Restful ArchitechtureOntico
 
RESTful Architechture (Highload++ 2008)
RESTful Architechture (Highload++ 2008)RESTful Architechture (Highload++ 2008)
RESTful Architechture (Highload++ 2008)Sergey Skvortsov
 
Web programming modern tendencies
Web programming modern tendenciesWeb programming modern tendencies
Web programming modern tendenciesDarkestMaster
 

Similar to Использование данных семантического веба поисковыми системами (20)

Семантический HTML5 - iForum
Семантический HTML5 - iForumСемантический HTML5 - iForum
Семантический HTML5 - iForum
 
Semantic web и schema.org для интернет магазинов (Cергей Cиница)
Semantic web и schema.org для интернет магазинов (Cергей Cиница)Semantic web и schema.org для интернет магазинов (Cергей Cиница)
Semantic web и schema.org для интернет магазинов (Cергей Cиница)
 
Инфраструктура социального проекта
Инфраструктура социального проектаИнфраструктура социального проекта
Инфраструктура социального проекта
 
Методы повышения CTR (микроформаты)
Методы повышения CTR (микроформаты)Методы повышения CTR (микроформаты)
Методы повышения CTR (микроформаты)
 
Методы повышения Ctr (микроформаты)
Методы повышения Ctr (микроформаты)Методы повышения Ctr (микроформаты)
Методы повышения Ctr (микроформаты)
 
2015-12-12 | AzovDevMeetup 2015 | Enterprise приложения на PHP | Павел Крынецкий
2015-12-12 | AzovDevMeetup 2015 | Enterprise приложения на PHP | Павел Крынецкий2015-12-12 | AzovDevMeetup 2015 | Enterprise приложения на PHP | Павел Крынецкий
2015-12-12 | AzovDevMeetup 2015 | Enterprise приложения на PHP | Павел Крынецкий
 
DUMP-2013 Наука и жизнь - Практические применения семантических вычислений - ...
DUMP-2013 Наука и жизнь - Практические применения семантических вычислений - ...DUMP-2013 Наука и жизнь - Практические применения семантических вычислений - ...
DUMP-2013 Наука и жизнь - Практические применения семантических вычислений - ...
 
Html лаб 2
Html лаб 2Html лаб 2
Html лаб 2
 
Практическое применение семантического анализа для фильтрации трафика (Яков М...
Практическое применение семантического анализа для фильтрации трафика (Яков М...Практическое применение семантического анализа для фильтрации трафика (Яков М...
Практическое применение семантического анализа для фильтрации трафика (Яков М...
 
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
СПИК 2011: Семантический веб: новая эра контекстной рекламы против паранойи с...
 
Creara technologies
Creara technologiesCreara technologies
Creara technologies
 
Мировые информационные ресурсы. Лекция 5
Мировые информационные ресурсы. Лекция 5Мировые информационные ресурсы. Лекция 5
Мировые информационные ресурсы. Лекция 5
 
C# Web. Занятие 01.
C# Web. Занятие 01.C# Web. Занятие 01.
C# Web. Занятие 01.
 
Презентация «Drupal и SEO» с московской DrupalConf 2011
Презентация «Drupal и SEO» с московской DrupalConf 2011Презентация «Drupal и SEO» с московской DrupalConf 2011
Презентация «Drupal и SEO» с московской DrupalConf 2011
 
Ruwikt
RuwiktRuwikt
Ruwikt
 
Мастер-класс "Привет, Drupal"
Мастер-класс "Привет, Drupal"Мастер-класс "Привет, Drupal"
Мастер-класс "Привет, Drupal"
 
!2hl++2008 Restful Architechture
!2hl++2008 Restful Architechture!2hl++2008 Restful Architechture
!2hl++2008 Restful Architechture
 
RESTful Architechture (Highload++ 2008)
RESTful Architechture (Highload++ 2008)RESTful Architechture (Highload++ 2008)
RESTful Architechture (Highload++ 2008)
 
HTML
HTMLHTML
HTML
 
Web programming modern tendencies
Web programming modern tendenciesWeb programming modern tendencies
Web programming modern tendencies
 

More from Irene Pochinok

Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаIrene Pochinok
 
Грамматические правила формализации смысла комических текстов в концепции инв...
Грамматические правила формализации смысла комических текстов в концепции инв...Грамматические правила формализации смысла комических текстов в концепции инв...
Грамматические правила формализации смысла комических текстов в концепции инв...Irene Pochinok
 
Проблемы построения интеллектуальных агентов реального времени
Проблемы построения интеллектуальных агентов реального времениПроблемы построения интеллектуальных агентов реального времени
Проблемы построения интеллектуальных агентов реального времениIrene Pochinok
 
Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...Irene Pochinok
 
О взаимосвязях между онтологиями и логиками
О взаимосвязях между онтологиями и логикамиО взаимосвязях между онтологиями и логиками
О взаимосвязях между онтологиями и логикамиIrene Pochinok
 
Инженерия знаний
Инженерия знанийИнженерия знаний
Инженерия знанийIrene Pochinok
 
FUNCTION OF RIVAL SIMILARITY IN A COGNITIVE DATA ANALYSIS
FUNCTION OF RIVAL SIMILARITY IN A COGNITIVE DATA ANALYSISFUNCTION OF RIVAL SIMILARITY IN A COGNITIVE DATA ANALYSIS
FUNCTION OF RIVAL SIMILARITY IN A COGNITIVE DATA ANALYSISIrene Pochinok
 
Илья Утехин, СПбГУ
Илья Утехин, СПбГУИлья Утехин, СПбГУ
Илья Утехин, СПбГУIrene Pochinok
 

More from Irene Pochinok (8)

Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текста
 
Грамматические правила формализации смысла комических текстов в концепции инв...
Грамматические правила формализации смысла комических текстов в концепции инв...Грамматические правила формализации смысла комических текстов в концепции инв...
Грамматические правила формализации смысла комических текстов в концепции инв...
 
Проблемы построения интеллектуальных агентов реального времени
Проблемы построения интеллектуальных агентов реального времениПроблемы построения интеллектуальных агентов реального времени
Проблемы построения интеллектуальных агентов реального времени
 
Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...Обработка слабоструктурированных веб-документов на основе облачных технологий...
Обработка слабоструктурированных веб-документов на основе облачных технологий...
 
О взаимосвязях между онтологиями и логиками
О взаимосвязях между онтологиями и логикамиО взаимосвязях между онтологиями и логиками
О взаимосвязях между онтологиями и логиками
 
Инженерия знаний
Инженерия знанийИнженерия знаний
Инженерия знаний
 
FUNCTION OF RIVAL SIMILARITY IN A COGNITIVE DATA ANALYSIS
FUNCTION OF RIVAL SIMILARITY IN A COGNITIVE DATA ANALYSISFUNCTION OF RIVAL SIMILARITY IN A COGNITIVE DATA ANALYSIS
FUNCTION OF RIVAL SIMILARITY IN A COGNITIVE DATA ANALYSIS
 
Илья Утехин, СПбГУ
Илья Утехин, СПбГУИлья Утехин, СПбГУ
Илья Утехин, СПбГУ
 

Использование данных семантического веба поисковыми системами

Editor's Notes

  1. RDFa - расширяем
  2. Все эти сниппеты из данных rdfa и микроформатов
  3. W3c recommendation from 2003 The Resource Description Framework (RDF) is a family of World Wide Web Consortium (W3C) specifications originally designed as a metadata data model . It has come to be used as a general method for conceptual description or modeling of information that is implemented in web resources; using a variety of syntax formats.
  4. RDFa - расширяем
  5. RDFa (or Resource Description Framework - in - attributes) is a set of extensions to XHTML which is now a W3C Recommendation. RDFa uses attributes from XHTML's meta and link elements, and generalises them so that they are usable on all elements. This allows annotating XHTML markup with semantics. A simple mapping is defined so that RDF triples may be extracted. Начали в 2004, а потом: In October 2008 RDFa reached Recommendation status. [9] An additional RDFa Primer document was last updated in June 2008. [10] (The first public Working Draft dates back to March 2006.)
  6. Плагин Оператор к Firefox http://www.readwriteweb.com/archives/yahoo_kelkoo_microformats.php Written by Josh Catone / March 28, 2008 10:59 AM / 7 Comments The actual number of hListing's Yahoo! put out there was 26,456,448, as well as an additional 6,500 hCard listings describing merchants. "This bumper injection of structured data into Kelkoo’s pages makes it ripe for re-use, be that browser extensions to draw out product information on our pages, indexing services aggregating product listings together or mashing up the data for reuse in widgets," said developer Ben Ward of Yahoo! Europe.
  7. Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Google сам формирует сниппеты Информация только на основе микроформатов и RDFa Поддержка hReview, hCard, hProduct, hReview_Aggregate ( не утвержден даже на microformats.org ) Свой словарь для RDFa ( http://rdf.data-vocabulary.org/rdf.xml ) Запустили только для проверенных партнеров (Yelp.com, Cnet.com, LinkedIn.com) Не влияет на ранжирование (пока) Подробные инструкции в центре вебмастера ( http://google.com/support/webmasters/bin/answer.py?answer=146645 )
  8. Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  9. Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  10. Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  11. Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  12. Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  13. Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  14. Еще они не обещают, что сниппете используют эту разметку но есть форма обратной связи для заинтересованных Про 15% увеличение ctr сказать ( http://searchengineland.com/yahoo-searchmonkey-becomes-more-mainstream-14498 ) In order to be eligible to default status, applications have to be based on sites that have well-structured data through semantic markup or a data feed, be well-designed and broadly useful, and have positive user metrics. How does Yahoo! measure this? They say they “generally expose a small percentage of our users to a default-on experience and measure if and how it changes their usage.” For this initial set of default applications, they’ve seen a rise in click-through rates of up to 15%. Формирование сниппетов силами пользователей Информация только на основе микроформатов и RDFa Большой словарь для RDFa , использующий существующие словари ( http://developer.yahoo.com/searchmonkey/smguide/profile_vocab.html#owl_defs ) Не влияет на ранжирование (пока) Подробные инструкции в центре разработчика
  15. Максим: Сам по себе микроформатированный контент распространен. Его не видно, но он есть. Его очень активно генерируют блоги, например, WordPress. Микроформат XFN — это взаимоотношения между людьми. Он входит в стандартный набор тех фич, которые, например, WordPress может генерировать при создании страниц. Миллионы фотографий на Flickr помечены тагами. Есть такой микроформат Rel-tag, который указывает, что данная ссылка является тагом. Есть миллионы страниц на Yahoo Tech, в которых внедрен микроформат hReview: на страницах описание товаров, которые предлагаются на сайтах. Сами по себе контенты в сети присутствуют. LinkedIn (hCard) Yelp ( hReview) Cnet (hReview)
  16. http://api.yandex.ru/blogs/doc/search/appendices/format-atom-foaf-sample.xml поиск по ленте друзей . Передача данных в стандарте FOAF (friend of a friend) делает полнее и точнее поиск по блогохостингам и социальным сервисам, в частности ? делает возможным поиск по лентам друзей и по профилям пользователей. Сегодня стандарт Sitemaps поддерживают около 200 тыс. сайтов Рунета. Формат MediaRSS используется рядом мультимедийных хостингов, например ? YouTube. Данные о профилях пользователей в формате FOAF транслируют все крупнейшие блогохостинги русскоязычного интернета, включая Livejournal. com, Liveinternet. ru и Blogs. Mail. ru.
  17. http://api.yandex.ru/blogs/doc/search/appendices/format-atom-foaf-sample.xml поиск по ленте друзей . Передача данных в стандарте FOAF (friend of a friend) делает полнее и точнее поиск по блогохостингам и социальным сервисам, в частности ? делает возможным поиск по лентам друзей и по профилям пользователей. Сегодня стандарт Sitemaps поддерживают около 200 тыс. сайтов Рунета. Формат MediaRSS используется рядом мультимедийных хостингов, например ? YouTube. Данные о профилях пользователей в формате FOAF транслируют все крупнейшие блогохостинги русскоязычного интернета, включая Livejournal. com, Liveinternet. ru и Blogs. Mail. ru.
  18. http://api.yandex.ru/blogs/doc/search/appendices/format-atom-foaf-sample.xml поиск по ленте друзей . Передача данных в стандарте FOAF (friend of a friend) делает полнее и точнее поиск по блогохостингам и социальным сервисам, в частности ? делает возможным поиск по лентам друзей и по профилям пользователей. Сегодня стандарт Sitemaps поддерживают около 200 тыс. сайтов Рунета. Формат MediaRSS используется рядом мультимедийных хостингов, например ? YouTube. Данные о профилях пользователей в формате FOAF транслируют все крупнейшие блогохостинги русскоязычного интернета, включая Livejournal. com, Liveinternet. ru и Blogs. Mail. ru.