迷惑的“默认”结果

很多网站根据“相关度”排列搜索结果,类似的说法还有“按默认排序”,“最为相配”(yesasia网站)等。
这些说法都是一类意思,即网站按照某种“神秘”算法,针对用户输入的“关键词”给出一组结果。
姑且把这组结果称为默认结果。
这种“默认”结果到底怎么默认出来?
在yesasia上用“黄耀明”搜索,第一个结果是“若水”,不是他的最新专辑“明日之歌”。
在卓越上搜索“先锋DVD”,第三个结果是“法证先锋Ⅱ(6DVD)”!
实在不明白是怎么一回事。
算法问题嘛,技术人员会这么认为。
事情远非那么简单。
信息架构一书第八章第七节,详细叙述了“相关性”带来的搜索结果列表问题。
最明显的问题,算法认为的“相关”并不是用户认为的“相关”,比如前面提到的“黄耀明”和“先锋dvd”。
“相关”属于分等级(ranking),并不等同于排序(sorting)。
要搜索的内容种类繁多,可能会风马牛不相及,先锋dvd机和名字叫先锋的电影dvd碟片不是一回事,只是恰好两者都有“先锋”这个词。
在卓越直接用“先锋”搜,第三第四个结果分别是一本书,书名里没有“先锋”,作者也不叫“先锋”,出现这两部本书的可见原因:它们是“先锋小说选”。
太难理解了!
用户往往认为,最佳搜索结果排在最前面(Users will generally assume that the top few results are best),所以即使虽然可以通过选择类别的方式缩小范围,但用户的操作时间和次数无意会增加。
这些用户看不到、也不关心的搜索规则,会严重影响搜索结果和用户期望,甚至会直接影响销售。
可以分析搜索日志,整理出用户常用的搜索词库,同时能发现用户搜索的语境(contextual),从而给出符合用户期望的搜索结果,同时又能满足商业目标。
不能像卓越,无论用“apple”还是“苹果”,前几位都不是苹果的产品!

0 评论

  1. 原则和方法基本相同,数据来源,关键词库、同义词库、元数据库,商业目标,判断用户行文的根据肯定不同。

发表评论

电子邮件地址不会被公开。 必填项已用*标注