博主最近又去找了找人立方读心机器人20Q的资料,发现原来20Q的html版的游戏已经暂停服务了,除了网页版还发布了面向Android、iPhone和WindowsPhone等3大手机平台的免费读心机器人App。在iPhone端,它叫“必应问答”。
对读心机器人不了解的可以看这里:读心游戏,有趣智能的读心机器人
小伙伴想了个大脸猫都被猜到了呢哈哈~
说到“读心”两个字,难免给人算命或者魔术的感觉。尽管我们知道它的一些基本原理——通过问问题不断缩小答案的范围,但当被人猜出心中所想还是令人“心有余悸”。以非常不严谨的数学模型进行计算,如果每个问题都可以把答案的范围正好缩小一半,那么20个问题,就意味着可以在100万(2的20次方)个对象中找到答案。
那么微软亚洲研究院开发这个看起来没什么技术含量游戏的用意何在呢?
有一种互联网上常见的图片验证码,它包含两个同样风格的英文单词,但很少有人知道实际上只需要答对其中一个就能通过验证。至于另一个单词,则是用户在贡献自己的脑力,帮助系统识别那些OCR技术无法搞定的扫描文献。它叫reCAPTCHA,是创立百年的纽约时报完成数字化的背后功臣。它的精妙之处在于,用户每填写一次验证码就参与了一次“众包”计算。是不是高大上呢?
微软亚洲研究院之所以要做这个叫做读心机器人的休闲游戏,是因为我们在玩游戏的同时也在帮助微软验证挖掘而来的数据的可靠性,让它们的算法更聪明。读心机器人刚发布的时候完全靠机器计算,只有近30%的准确率,经过3至4个月的时间,算法中加入用户的有效反馈后准确率就提升到了60%左右。
那么以猜人物为例,微软的人立方关系搜索引擎已经从互联网上自动挖掘出大量公众人物(包括虚拟人物)的基本信息,包括性别、生日、出生地点和国籍等。但“人立方”并不是100%确定这些信息是准确的(其中一个原因是重名问题的广泛存在)。假设经过20个问题,读心机器人猜出了人家心中所想的人物,那么当用户点击代表猜对了的按钮之后,就相当于为这20条基本信息投了一次票。如果经过大量用户确认的信息与系统中原有的信息不符,它们就需要对算法进行调节了。在不知不觉中,将机器的自动挖掘算法与人的智慧结合起来,整个计算模型的准确率都得到了提升,这就是读心机器人背后的“阳谋”。
业内人士把这种人人参与的大规模计算过程形象地称为“众包计算”。其实除了前文提到的reCAPTCHA,我们每天都在参与到很多众包计算当中。最简单的例子就是搜索引擎——我们每次点击搜索结果中的链接都会被记录在案,因为这意味着我们对那个网站投了一票。当很多人搜索同一个关键词之后打开的网站不是第一个,甚至不在首页时,搜索引擎就知道它的算法该调整了。
哈哈,这个好不好玩?