2012年12月1日星期六

Google变革:向语义搜索迈进

Google变革:向语义搜索迈进

(2012-03-19 09:41:15)


据华尔街日报的报道,Google 正在计划对其核心业务——搜索进行改变。google将利用“语义搜索”算法分析用户键入关键词的深层含义,然后直接想用户提供该问题的直接答案,而不是像现在这样给出一堆的链接。


语义搜索的关键在于理解词汇的真正含义。何玺曾经在《Siri:搜索引擎的终结者?》,《Siri+ Wolfram Alpha……正在改变用户搜索习惯》两篇稿子中介绍过“语义搜索”的相关知识。


语音识别以及语音合成技术


语音识别技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。


语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(text-to-speech, TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。


相比于语音识别,语音合成感觉难度要低,并且基本能够在本地完成(很多OS都有内置的语音合成引擎)。而语音识别,由于涉及到语义理解,难度大大加大,需要大量的知识库,一般需要在云端完成。


知识搜索技术,由平台将从公众的和获得授权的资源中,发掘、建立起一个异常庞大的经过组织的数据库,再利用高级的自然语言算法进行处理,最终构造出一个类似于谷歌搜索的工具。


Wolfram Alpha就使用了知识搜索技术,它不同于Google的数学计算搜索引擎—向用户提供一系列可能含有用户所需答案的相关网页,Wolfram Alpha的特色是可以直接向用户返回答案。在搜索处理机制上,Wolfram Alpha也和Google不同:Wolfram Alpha强大的地方,除了它在信息处理和提取方面的功能,还在于它可以通过推理机制在知识库中寻找满足条件的条目,以及它与众不同的强大计算能力。正因为如此,Wolfram Alpha能够做到直接给你提供计算结果。通过这种新型的计算引擎,人们获得的将不再是网上现成的未经处理的内容,而是经过计算生成的信息。


Google的“语义搜索”计划


知情人士表示,在google实施该计划后,当人们搜索Tahoe湖时,搜索引擎会提供有关湖的各种信息,包括地理位置、海拔、平均温度和盐度等。如果现在去搜索Tahoe湖的话,人们得到的只是一些链接。


在碰到那些谷歌数据库中还没有的问题答案时,谷歌会将语义搜索技术和现有的搜索系统进行结合,以便更好地识别网络上的信息价值并确定将哪些链接放在搜索结果里。


谷歌搜索部高管Amit Singhal表示,谷歌搜索引擎依靠包含数以亿计的“实体”的数据库来进行更好地搜索匹配,这些实体包括人物、地点和事件,这些都是谷歌在过去两年里秘密搜集的数据。语义搜索能够将不同的词关联起来,例如,谷歌公司就可以和创始人Larry Page和Sergey Brin关联起来。


一些语义搜索专家认为,谷歌的这一计划能帮助谷歌赶上Facebook发展速度。Facebook也有一个包含数亿用户、地区和事物的数据库,但还没有进军搜索领域。据悉,由于面临Facebook和Twitter等占有用户众多时间的社交网站的竞争,谷歌想通过语义搜索使用户在谷歌上停留的时间更长。


当然,谷歌不会改变目前的关键字搜索系统,它只是打算利用语义搜索技术来为用户提供更多相关的搜索结果。改善用户体验,提升用户黏度。

没有评论:

发表评论