2012年12月4日星期二

笔记:本体学习研究综述


笔记:本体学习研究综述

本体学习研究综述,杜小勇,李曼,王珊
推荐指数:
笔记:
所谓本体,最著名并被广泛引用的定义是由Gruber提出的“本体是概念模型的明确的规范说明”[1].通俗地讲,本体是用来描述某个领域甚至更广范围内的概念以及概念之间的关系,使得这些概念和关系在共享的范围内具有大家共同认可的、明确的、唯一的定义,这样,人机之间以及机器之间就可以进行交流.
在过去的 10 年里,已经出现了许多本体构建工具,从最早的 Ontolingua,OntoSaurus,WebOnto到Protégé-2000,WebODE,OilEd,OntoEdit,以及 KAON等,本体构建工具也日趋成熟.这些工具提供了友好的图形化界面和一致性检查机制.借助这些工具,用户可以把精力集中在本体内容的组织上,而不必了解本体描述语言的细节,而且避免了很多错误的发生,方便了本体的构建.但是,这些工具提供的仅仅是本体编辑功能,支持的仍然是手工构建本体的方式.
现有的大部分系统,例如 Cyc和 Mikrokosmos等,都是靠手工输入大量的知识,然后才能基于这些知识进行推理或获取新的知识.由于手工方法费时、费力,使得本体的构建成为一项艰巨的任务.
1   基于结构化数据的本体学习
结构化数据主要包括关系数据库或面向对象数据库中的数据.
2   基于非结构化数据的本体学习

SKOSsy:利用DBPedia自动生成叙词表?


SKOSsy:利用DBPedia自动生成叙词表?

2011年12月13日 由 catwizard留言 »
奥地利的语义Web公司(Semantic Web Compan)正在开发一个自动生成英语和德语叙词表的工具SKOSsy。SKOSsy可以针对某个领域,从维基百科的关联数据形式DBPedia中抽取数据,生成基于SKOS的叙词表“种子”,随后再使用专门的叙词表编辑工具清理,增加概念、关系及链接等。也就是说不必一切从零开始了。
据该公司博客介绍,利用SKOSsy制作某一领域叙词表雏形,然后使用PoolParty系列工具完成词表,进而自动标引、形成检索系统的过程如下:
1、在维基百科/DBPedia中找到最合适的类别
2、由SKOSsy遍历DBPedia收集所有资源、等级与非等级关系、交替标签、定义及其他属性,并组织成一个有效的SKOS叙词表。整个过程持续几分钟。
3、把初成的叙词表装入PoolParty Thesaurus Manager (PPT),人工完善。
4、使用PoolParty Extractor (PPX)生成定制的文本抽取器。
5、用PPX从文档中自动抽取命名的实体并做索引。
6、数秒钟后语义搜索引擎就可以用了。 PoolParty Semantic Search (PPS)可以提供类别自动完成、分面检索、内容推荐(类似检索)及智能检索提示。
这广告实在很生动。虽然博文中提供了一个自动生成的示例词表的链接,但需要登录才能看,效果不明。想要实际体验的话,可以向他们发送自己感兴趣的领域,他们会向你发送测试邀请,或者为你准备一段演示。
Via mod librarian: Metadata Monday: Automated Controlled Vocabularies?(梯子自备)