社交图谱记录我们在社交媒体上的种种关联。从搜索结果到优惠券,基于社交图谱的服务已经屡见不鲜。在这同时,一个定位更加精准的个人化网络正在慢慢崛起——基于用户个人喜好的兴趣图谱网络服务。现在已经有一些分散的兴趣图谱,比如谷歌的个人化搜索,或者Amazon的推荐引擎。有些公司希望这种服务可以覆盖我们全部的网络生活,而这就意味着,我们的所到之处所见之物,都是我们的心之所向。意味着我们不再需要在新闻网站上搜索喜欢的故事,或在购物网站上查找需要的商品——因为一旦登陆这些网站,网站系统就会自动识别我们是谁,我们喜欢什么,并呈现我们所需的内容信息。
不管这种构想带给你的是惊喜还是恐慌,我们都应该看看这种完全个人化的网络具体是怎样运作的。
发现你喜欢什么
事实上,Twitter和Facebook等社交网站在确定人们的实际兴趣时,或许并没有像在其他网站上的点击或者评论那么有效。很多人在Twitter上分享信息是因为职业需要,用户很多时候在Facebook上分享的信息也仅限于为交际圈服务。不管是在哪种情况下,“很多时候,人们都只是在作秀,以期给人留下好印象。这就导致了用户数据的不完整。”
那兴趣图谱是怎样工作的呢?创业公司Gravity正是基于这一服务的一家公司,其CTO Jim Benedetto向我们介绍了网站的工作原理。Gravity同时为多家网站服务,它会跟踪用户在其所有服务网站的行为,这样用户在登陆任意网站时,都能自动获得特色内容。你可以点击这里看到网站构建一幅图谱的具体流程。
从技术层面来说,Gravity是通过一个基于Freebase 和 DBpedia等多个数据集的大型数据引擎,确定用户在点击某篇文章或发表某个评论时的实际兴趣点。举个例子,一个用户如果发表Vanessa Laine(湖人队NBA球员科比的前妻)的Tweet,那他应该是对篮球更感兴趣,而不是Laine的出生日期或者其他确切但不相关的信息。