Google的强大,相信不用在这里多费唇舌,大家一定也有深刻的切身体会。但是,我们经常说“金钱不是万能的”,事实上Google也一样,很多时候它也会查找到一大堆莫名其妙、毫不相关的垃圾信息。
从Google说开去
举个简单的例子,我们如果想要去买电脑,那么肯定会以“配件报价”为关键字进行搜索,但Google却会给出许多毫不相关的信息。
再举个更通俗易懂的例子,如果你在Google上查“番茄”,那么Google也不会把“西红柿”作为“番茄”的同义词进行查找。说到底,这是由于Google是基于关键字比较进行查找的,它只会考虑基于关键字的匹配,而不是像人一样是在理解内容的基础上再进行筛选。
语义网的诞生
为了解决以上问题,语义网应运而生了,它被称为下一代的网络,是由互联网的创始人Tim Berners-Lee提出的。让我们先来看一下Tim Berners-Lee给出的关于语义网的一个经典例子。
电话铃响时彼得拿起电话,彼得的姐姐露西从办公室打来电话说:“妈妈需要找一位专家看病,你能安排送一下妈妈吗?”在这之前,露西已经上网给她的语义Web代理下了指令,代理找出了在妈妈家方圆20英里范围内并在母亲的保险计划范围之内的所有诊所。然后,代理尝试将可能的预约时间和彼得及露西的繁忙的日程进行匹配,最后提供了一个完美的方案。
彼得和露西能够通过Web执行这些任务,不是靠今天的互联网,而是得益于将来的语义Web。事实上,从互联网建立时就已经有很多计算机工作者致力于语义Web的研究,到目前为止已经形成了比较完整的体系。许多类似于Jena和AQsearch的基于DAML(The DARPA Agent Markup Language)的推理机也相继被开发出来,同时类似于WordNet的工作对语义网的发展也有很大的帮助。
语义Web的根本
任何实际系统的发展都离不开它的基础理论,那么语义Web呢?事实上,当前的语义Web都是基于二元关系的,对于这个概念大家可能有点陌生。在通俗意义上我们称之为三元式,也就是说任何一次的知识表达都是由三部分组成——主语、谓语和宾语。那么大家又要问了,用这样简单的表示方法能否表现出现实世界的复杂性呢?你大可不必为此担心,我们可以通过绑定、组合等一系列方法来表示更为复杂的知识,就像计算机在底层只有0、1两种符号,但却可以进行复杂的数学运算的道理一样。
大家也许会奇怪,语义Web提出以后会不会完全代替现有的Web,如果不会的话,它将以一种怎样的形式与现有的Web相结合?事实上,语义Web是针对机器理解提出的,也就是说用语义Web描述的资源是让机器阅读的,那么传统意义上的Web还是有其必要性的。我们现在所要做的工作就是将这两部分结合在一起,传统Web提供给人们所需要的信息,而语义Web在后台给机器阅读,用于资源的发布、发现与管理。