2013年5月30日星期四

防通讯骚扰的云计算


作者头像
记者,愿意为创新的传播尽绵薄之力,并一直相信理想主义情怀才是原动力。
[核心提示] 传统的骚扰电话解决方案是基于本地的黑名单机制,但是这种方式局限性很大, 骚扰号码没有规律可循,无法类似 E-mail 那种 bayes(贝叶斯)的自我学习功能,扩展性也很差。搜狗号码通在本地基础上加入了云的概念,即通过搜索蜘蛛的抓取分析建立一个“号码云”。
搜狗近日上架一款号码辅助识别软件——号码通,通过抓取互联网中的公开电话信息,建立起海量号码数据库,让诈骗,中介,推销等骚扰号码无处遁形。软件还专门设计“标记”功能,每一个用户都可以对陌生的骚扰号码进行分类标记,同时每个用户对骚扰号码的评价将分享给其他用户,彻底摆脱接到骚扰电话后的自认倒霉的无奈,让层出不穷的骚扰电话彻底歇菜。充分利用智慧众包,让那些漏网的骚扰电话瞬间陷入人民战争的汪洋大海之中。

号码的云计算

传统的骚扰电话解决方案是基于本地的黑名单机制,但是这种方式局限性很大, 骚扰号码没有规律可循,无法类似 E-mail 那种 bayes(贝叶斯)的自我学习功能,扩展性也很差。这个已经是标配技术。搜狗号码通在本地基础上加入了云计算的概念,即通过搜索蜘蛛的抓取分析建立一个“号码云”,这也是搜狗基于搜索引擎做号码通的出发点,相当于防通讯骚扰的云计算。它的好处是让 APP 客户端很轻,直接和“号码云”交换匹配即可。
(部分内容来源于知乎

釜底抽薪之道

骚扰诈骗电话要真正的杜绝,还是要从根源下手,通信运营商从源头来做,根据呼叫记录,自动找出异常呼叫,进行跟踪和查处,从源头打击,不过,遗憾的是,垃圾电话和垃圾短信符合运营商短期利益,要真正的釜底抽薪,还需要一点时间。

题外话——众包

号码通的核心功能在于通过用户的标记来识别骚扰电话,再将用户的标记数据共享到服务器,操作模式和方法类似于搜狗输入法的流行词库一样,都是运用大众的智慧共建数据库,实现分享。无独有偶,Google 旗下的 Google Books 也借用了民众的力量去完成纸质书的数字化。Google Books 扫描了几十万本纸质书,通过 Google 实验室项目reCAPTCHA ,扫描后的图片被裁减成一个个单词片段,用于网站防止机器注册时显示的验证码,人们在输入验证码的同时不知不觉就完成了图书数字化过程。世界各地图书馆有很多受损的古籍,页面泛黄、纸张脆弱,OCR 是无能无力的,它无法识别褪色的和模糊的文本,而人类在这方面有卓越的表现。reCAPTCHA 将我们输入的验证码正确识别后,拼接、排版,在化整为零中就完成了古籍的数字化。
当然,有人可能会提到防骚扰红名单,但是,红名单是你用的吗?
 
除非特别声明,极客观察均为极客公园原创报道,转载请注明作者及原文链接。
原文地址:
http://www.geekpark.net/read/view/157278

没有评论:

发表评论