SlideShare ist ein Scribd-Unternehmen logo
1 von 15
主题:微格式(Microformat) 分享人:马泽声        时间:2010-12-29       摘要:建立在已有的、被广泛采用的标准基础之上的一组简单的、开放的数       据格式;是兼顾人机可读性设计的数据表达方式,对Web网页进行语义注解的方法…… 涉及知识点:介绍微格式的概念,微格式技术体系的概念和意义,归纳并详细论述     由数据结构化定义和标记的微格式、个人及组织信息标记的微格式等   相关资料:http://zh.wikipedia.org/zh/微格式              http://microformats.org/
微格式的开放性定义(2005.6)
1.微格式的定义     建立在已有的、被广泛采用的标准基础之上的一组简单的、开放的数据格式;是把语义嵌入到HTML以便有助于分离式开发而制定的一些简单约定,是兼顾人机可读性设计的数据表达方式,对Web网页进行语义注解的方法,这种方法依托于标准的Web页面写作技术。 ------microformats.org     是通过语意相关让内容人机可读;从技术上来说,这些数据是一些语义标记,用标准的(X)HTML中的class名称设置;它是开放、可用、自由的,可以被任何人使用。 ------维基百科     一组结构化数据的开放标准;是包含数据的结构化的XHTML代码块的定义格式,由于是XHTML代码块,所以很适合人类阅读,由于是结构化的,又很容易被机器处理,很容易和外部进行数据通信。 ------百度百科
2.微格式体系 所谓微格式技术体系是指由各种微格式组成一系列信息组织和处理技术的总称。 组成部分 建立基础 基本微格式 复合微格式 微格式 XML XHTML
2.微格式体系 2.1 基本微格式 基本微格式是解决单一问题的最小解决方案,采用了XHTML支持的rel、rev、class等属性定义了具有语义的属性集,嵌入到网页文件中直接使用,或者作为复合微格式的基本组成要素。     这类的微格式有XOXO、XMDP、rel-license、 rel-nofollow、rel-tag、XFN等 2.2 复合微格式     复合微格式由基本微格式和标准的XHTML元素组成的,解决描述复合数据类型现存标准方案与XHTML之间准确转换问题。 这类的微格式有hCalendar、hCard、hRewiew等
2.微格式体系 2.3 目前已具备完整规范的微格式还包括: hCard、hCalendar、XOXO、XFN、VoteLinks和 3个“rel-”微格式:rel- license、rel-nofollow、rel-tag 其他微格式还包括hAtom、Geo等。
3.微格式在实际应用中的意义和作用? 微格式按照某种已有的被广泛应用的标准,通过对内容块的语义标记,可以让外部应用程序、聚合程序和搜索引擎能够做以下事情: 在爬取Web内容时,能够更为准确地识别内容块的语义;  对内容进行操作,包括提供访问、校对,还可以将其转化成其他的相关格式,提供给外部程序和Web服务使用。
4.微格式应用 4.1 作为数据结构化标记和定义的微格式( XMDP  、 XOXO )     XMDP(XHTML Meta Data Profiles)用于定义HTML的元数据配置文件;微格式利用XMDP包含的格式定义相关的属性、属性定义、简短描述等信息,以<div class="profile">为格式定义头,对其他微格式的结构进行定义和标记。   XOXO是拓展型开放XHTML规范(eXtensible Open XHTML Outlines)的简称。XOXO定义了一种新的XHTML文档类型,以模块化XHTML的形式定义模块框架和各种模块。采用XHTML结构定义标签元素“body”、“head”、“html”,列表标签“dl”、“dt”、“li”等以及标签元素属性text、description、url等定义了微格式赖以存在的结构,是基本的用于定义其他微格式及正确显示微格式的基础,是实现数据结构化、语义化的基础,其具体的发布则可以采用XHTML,也可以采用纯XML文件。
4.微格式应用 4.2 标记描述个人和组织信息的微格式(hCard、hCalendar、 XFN 、hResume)         微格式hCard是建立vCard标准的基础上,以XHTML具有语意化的标签属性来表征个人和组织机构的联系信息,从而将非结构化的数据转变成了结构化的数据,便于第三方软件的自动抽取。         hCanlendar则是为了将互联网上发布的诸如“会议日程安排”、“课程安排”等与个人日程安排密切相关的非结构化信息转化成结构化信息的微格式。它建立在诸如vCanlendar和iCanlendar这样的国际日历和日程安排标准的基础上,提供对“组织者”、“时间”、“地点”等项目标记和描述,便于将这些信息导出到用户个人日程安排管理软件中。
4.微格式应用 4.2 标记描述个人和组织信息的微格式(hCard、hCalendar、 XFN 、hResume) XFN(XHTML Friends Network),是全球多媒体协议组为了在互联网上显化人类之间的关系,通过赋予超链接语义属性表征人类关系的简单方式。它以枚举的方式定义了“Friendship(朋友)”、“Professional(工作关系)”、“Geographic(地缘关系)”、“Family(家庭关系)”、“Identify(其他所有的关系)”等7种关系及其具体关系值和约束条件。         hResume是一种复合微格式,它使用纯文本的“text”描述一般性的描述,使用hCard描述个人联系信息和相关的机构信息,使用hCalendar描述工作经验和教育背景,使用rel-tag描述个人技能,使用cite tag描述发表的作品等,专门用于发布个人简历和个人履历表信息的微格式,适合于嵌入到(X)HTML、Atom、RSS和专门的XML文件格式中。
4.微格式应用 4.3 超链接标记和描述的微格式         微格式技术体系中的超链接标记和描述微格式就是使用XHTML为这些超链接增加语义化标签,从而实现结构化的目的。 具备完整规范的:rel-nofollow 、rel-license 、rel-tag 其他草案中:rel-directory 、rel-home 、rel-enclosure
4.微格式应用 4.4 评论机制标记和描述的微格式(hReview、VoteLinks) hReview,作为一种分布存在评论的发布标准,通过为评论内容增加语义化标签,使得评论内容数据得以结构化,以便于评论内容的发布、共享、聚合和集成。hReview是一种复合标准,充分利用hCard和HCalendar标准已经定义的元素,这些元素包括:版本、概要、项目类型(产品、商业服务、事件等)、项目信息(利用hCard标识个人和商业联系信息,利用hCalendar标识事件)、评论者、评论时间(dtreviewed)、评分等级(rating)、具体的描述、tags、永久性地址(permalink)和许可证(license)等。         VoteLink是一种基本微格式,其使用的元素比较少,要解决的问题也比较简单;用户只需要表示其最简单的意见,同意、不同意、中立或弃权。
4.微格式应用 4.5 其他应用标记和描述的微格式 用于书签发布hFolk 用于地理位置经度纬度等信息标注的geo 应用于电子商务的rel-payment ……
5.微格式的特点 1.语义化的HTML和CSS类名称来标记共同内容。 2.使机器可以阅读和理解可能只有人类可理解的数据,一系列的标准化方法。 3.微格式允许网站上的内容轻易地与其他应用对接,从而提高信息的使用率。 4.为特殊应用而制定的特殊格式; 5.可以插入到网页或XML元数据中,被收割和索引,数据可被重用,也可自定义,完全取决于应用;
结束语     人们一直在尝试从非结构化的 Web 中提取结构化数据; 微格式是向着导出 Web 上的结构化数据这一方向迈进的

Weitere ähnliche Inhalte

Ähnlich wie Microformat

Sns与系统架构浅谈
Sns与系统架构浅谈Sns与系统架构浅谈
Sns与系统架构浅谈
taobaby365
 
Web信息架构
Web信息架构Web信息架构
Web信息架构
rex song
 
10702何崇先個人主題投影片製作
10702何崇先個人主題投影片製作10702何崇先個人主題投影片製作
10702何崇先個人主題投影片製作
崇先 何
 
基於語意網的搜尋引擎
基於語意網的搜尋引擎基於語意網的搜尋引擎
基於語意網的搜尋引擎
guestbb1b48
 
P6 User 概述与配置
P6 User 概述与配置P6 User 概述与配置
P6 User 概述与配置
epst
 
面向数据流的软件设计方法
面向数据流的软件设计方法面向数据流的软件设计方法
面向数据流的软件设计方法
happyjin2010
 
database
databasedatabase
database
s06283
 

Ähnlich wie Microformat (20)

Kevenjiaoda
KevenjiaodaKevenjiaoda
Kevenjiaoda
 
资源整合与Web2.0
资源整合与Web2.0资源整合与Web2.0
资源整合与Web2.0
 
Sns与系统架构浅谈
Sns与系统架构浅谈Sns与系统架构浅谈
Sns与系统架构浅谈
 
Dmresearch
DmresearchDmresearch
Dmresearch
 
Cloud client : 达尔文信息云浏览器
Cloud client : 达尔文信息云浏览器Cloud client : 达尔文信息云浏览器
Cloud client : 达尔文信息云浏览器
 
A Research on Knowledge Base and Knowledge Management
A Research on Knowledge Base and Knowledge ManagementA Research on Knowledge Base and Knowledge Management
A Research on Knowledge Base and Knowledge Management
 
Web信息架构
Web信息架构Web信息架构
Web信息架构
 
10702何崇先個人主題投影片製作
10702何崇先個人主題投影片製作10702何崇先個人主題投影片製作
10702何崇先個人主題投影片製作
 
基於語意網的搜尋引擎
基於語意網的搜尋引擎基於語意網的搜尋引擎
基於語意網的搜尋引擎
 
P6 User 概述与配置
P6 User 概述与配置P6 User 概述与配置
P6 User 概述与配置
 
语义互操作与关联数据
语义互操作与关联数据语义互操作与关联数据
语义互操作与关联数据
 
数据领导者的 数据治理和隐私 保护.pdf
数据领导者的 数据治理和隐私 保护.pdf数据领导者的 数据治理和隐私 保护.pdf
数据领导者的 数据治理和隐私 保护.pdf
 
物聯網應用系統
物聯網應用系統物聯網應用系統
物聯網應用系統
 
數位保存的趨勢與實務
數位保存的趨勢與實務數位保存的趨勢與實務
數位保存的趨勢與實務
 
面向数据流的软件设计方法
面向数据流的软件设计方法面向数据流的软件设计方法
面向数据流的软件设计方法
 
常用Js框架比较
常用Js框架比较常用Js框架比较
常用Js框架比较
 
雲端運算的演進與定義
雲端運算的演進與定義雲端運算的演進與定義
雲端運算的演進與定義
 
database
databasedatabase
database
 
社交网络在知识管理的应用 Share (gss-bj)
社交网络在知识管理的应用 Share (gss-bj)社交网络在知识管理的应用 Share (gss-bj)
社交网络在知识管理的应用 Share (gss-bj)
 
Web 2 0 At Dc 2008
Web 2 0 At Dc 2008Web 2 0 At Dc 2008
Web 2 0 At Dc 2008
 

Mehr von Randy Jin (7)

Seo 那些事
Seo 那些事Seo 那些事
Seo 那些事
 
Mobile web develop
Mobile web developMobile web develop
Mobile web develop
 
HTML5
HTML5HTML5
HTML5
 
Oocss
OocssOocss
Oocss
 
reflow & repaint
reflow & repaintreflow & repaint
reflow & repaint
 
Css float
Css floatCss float
Css float
 
Css3 transition
Css3 transitionCss3 transition
Css3 transition
 

Microformat

  • 1. 主题:微格式(Microformat) 分享人:马泽声 时间:2010-12-29 摘要:建立在已有的、被广泛采用的标准基础之上的一组简单的、开放的数 据格式;是兼顾人机可读性设计的数据表达方式,对Web网页进行语义注解的方法…… 涉及知识点:介绍微格式的概念,微格式技术体系的概念和意义,归纳并详细论述 由数据结构化定义和标记的微格式、个人及组织信息标记的微格式等 相关资料:http://zh.wikipedia.org/zh/微格式 http://microformats.org/
  • 3. 1.微格式的定义 建立在已有的、被广泛采用的标准基础之上的一组简单的、开放的数据格式;是把语义嵌入到HTML以便有助于分离式开发而制定的一些简单约定,是兼顾人机可读性设计的数据表达方式,对Web网页进行语义注解的方法,这种方法依托于标准的Web页面写作技术。 ------microformats.org 是通过语意相关让内容人机可读;从技术上来说,这些数据是一些语义标记,用标准的(X)HTML中的class名称设置;它是开放、可用、自由的,可以被任何人使用。 ------维基百科 一组结构化数据的开放标准;是包含数据的结构化的XHTML代码块的定义格式,由于是XHTML代码块,所以很适合人类阅读,由于是结构化的,又很容易被机器处理,很容易和外部进行数据通信。 ------百度百科
  • 5. 2.微格式体系 2.1 基本微格式 基本微格式是解决单一问题的最小解决方案,采用了XHTML支持的rel、rev、class等属性定义了具有语义的属性集,嵌入到网页文件中直接使用,或者作为复合微格式的基本组成要素。 这类的微格式有XOXO、XMDP、rel-license、 rel-nofollow、rel-tag、XFN等 2.2 复合微格式 复合微格式由基本微格式和标准的XHTML元素组成的,解决描述复合数据类型现存标准方案与XHTML之间准确转换问题。 这类的微格式有hCalendar、hCard、hRewiew等
  • 6. 2.微格式体系 2.3 目前已具备完整规范的微格式还包括: hCard、hCalendar、XOXO、XFN、VoteLinks和 3个“rel-”微格式:rel- license、rel-nofollow、rel-tag 其他微格式还包括hAtom、Geo等。
  • 8. 4.微格式应用 4.1 作为数据结构化标记和定义的微格式( XMDP 、 XOXO ) XMDP(XHTML Meta Data Profiles)用于定义HTML的元数据配置文件;微格式利用XMDP包含的格式定义相关的属性、属性定义、简短描述等信息,以<div class="profile">为格式定义头,对其他微格式的结构进行定义和标记。 XOXO是拓展型开放XHTML规范(eXtensible Open XHTML Outlines)的简称。XOXO定义了一种新的XHTML文档类型,以模块化XHTML的形式定义模块框架和各种模块。采用XHTML结构定义标签元素“body”、“head”、“html”,列表标签“dl”、“dt”、“li”等以及标签元素属性text、description、url等定义了微格式赖以存在的结构,是基本的用于定义其他微格式及正确显示微格式的基础,是实现数据结构化、语义化的基础,其具体的发布则可以采用XHTML,也可以采用纯XML文件。
  • 9. 4.微格式应用 4.2 标记描述个人和组织信息的微格式(hCard、hCalendar、 XFN 、hResume) 微格式hCard是建立vCard标准的基础上,以XHTML具有语意化的标签属性来表征个人和组织机构的联系信息,从而将非结构化的数据转变成了结构化的数据,便于第三方软件的自动抽取。 hCanlendar则是为了将互联网上发布的诸如“会议日程安排”、“课程安排”等与个人日程安排密切相关的非结构化信息转化成结构化信息的微格式。它建立在诸如vCanlendar和iCanlendar这样的国际日历和日程安排标准的基础上,提供对“组织者”、“时间”、“地点”等项目标记和描述,便于将这些信息导出到用户个人日程安排管理软件中。
  • 10. 4.微格式应用 4.2 标记描述个人和组织信息的微格式(hCard、hCalendar、 XFN 、hResume) XFN(XHTML Friends Network),是全球多媒体协议组为了在互联网上显化人类之间的关系,通过赋予超链接语义属性表征人类关系的简单方式。它以枚举的方式定义了“Friendship(朋友)”、“Professional(工作关系)”、“Geographic(地缘关系)”、“Family(家庭关系)”、“Identify(其他所有的关系)”等7种关系及其具体关系值和约束条件。 hResume是一种复合微格式,它使用纯文本的“text”描述一般性的描述,使用hCard描述个人联系信息和相关的机构信息,使用hCalendar描述工作经验和教育背景,使用rel-tag描述个人技能,使用cite tag描述发表的作品等,专门用于发布个人简历和个人履历表信息的微格式,适合于嵌入到(X)HTML、Atom、RSS和专门的XML文件格式中。
  • 11. 4.微格式应用 4.3 超链接标记和描述的微格式 微格式技术体系中的超链接标记和描述微格式就是使用XHTML为这些超链接增加语义化标签,从而实现结构化的目的。 具备完整规范的:rel-nofollow 、rel-license 、rel-tag 其他草案中:rel-directory 、rel-home 、rel-enclosure
  • 12. 4.微格式应用 4.4 评论机制标记和描述的微格式(hReview、VoteLinks) hReview,作为一种分布存在评论的发布标准,通过为评论内容增加语义化标签,使得评论内容数据得以结构化,以便于评论内容的发布、共享、聚合和集成。hReview是一种复合标准,充分利用hCard和HCalendar标准已经定义的元素,这些元素包括:版本、概要、项目类型(产品、商业服务、事件等)、项目信息(利用hCard标识个人和商业联系信息,利用hCalendar标识事件)、评论者、评论时间(dtreviewed)、评分等级(rating)、具体的描述、tags、永久性地址(permalink)和许可证(license)等。 VoteLink是一种基本微格式,其使用的元素比较少,要解决的问题也比较简单;用户只需要表示其最简单的意见,同意、不同意、中立或弃权。
  • 13. 4.微格式应用 4.5 其他应用标记和描述的微格式 用于书签发布hFolk 用于地理位置经度纬度等信息标注的geo 应用于电子商务的rel-payment ……
  • 14. 5.微格式的特点 1.语义化的HTML和CSS类名称来标记共同内容。 2.使机器可以阅读和理解可能只有人类可理解的数据,一系列的标准化方法。 3.微格式允许网站上的内容轻易地与其他应用对接,从而提高信息的使用率。 4.为特殊应用而制定的特殊格式; 5.可以插入到网页或XML元数据中,被收割和索引,数据可被重用,也可自定义,完全取决于应用;
  • 15. 结束语 人们一直在尝试从非结构化的 Web 中提取结构化数据; 微格式是向着导出 Web 上的结构化数据这一方向迈进的