对于搜索引擎而言,产品设计方案的关键因素是什么?个人以为,是最快最优地满足用户指定关键词的用户需求。
缘起
以“团购”为例,这样的关键词,内容性较强,用户想搜索的可能是:
1、一个具体团购网站;
2、介绍“团购”这个活动,从最原始的线下团购到如今的线上团购;
3、对“团购”这个现象的评价。
等等。
像这样的关键词还有:
- 近视,近视是什么;怎么预防近视;近视手术的风险;哪些行业不能近视;近视的数据(青少年比例,国家比例)。
- 世界杯,世界杯是什么;往届世界杯结果;未来的世界杯介绍;如果正在进行世界杯活动的话,还包括目前的进度、得分;某一场比赛的评价。
- 苹果,一种水果的营养、食用建议;水果的价格浮动;一个公司的上市指数、文化;一款产品的价格、评价,比如Mac/iPad。
思路
用户
从用户的角度来看,通过向搜索引擎提交关键词,来满足自己的信息需求。但是,用户成千上万,需求大相径庭,即便使用了较为恰当的关键词,也可能因为新闻、新词、转载等因素,造成结果歧义、重复。百度开放平台是解决这个问题的一大创新,但应用的规模有限;于是我琢磨,如何全局应用。
使用维基百科,尤其是在体验Quora后,我发现对索引的内容进行“话题识别”,进行类化和标签化,有助于对全局(而不仅仅是指定)搜索结果的精确定位。
产品
从产品的角度,用户打开百度,输入关键词,得到结果集的整个过程都应该尽可能理想的,而不仅仅针对结果集。用户能感受的“理想”主要来自网站的用户体验。
不要用户“等想烦”,要“快准狠”。
- 快,快速出现结果集,无需等待。
- 准,精准类化、标签化,直击目标,无需用户多想结果集到底是指“四袋苹果”还是“苹果四代”。
- 狠,减少重复冗余网页,将最给力的内容最快推送到用户眼前(比如百度开放平台的应用,以及分类算法)。
方案
类化方向
- 概念,提供网址导航(比如“下载”提供主要下载站的网址)。
- 内容,提供标签化指引的内容(比如:“苹果”分为“一种水果”,“一个公司”等)。
- 评论,针对关键词的评论内容(好差评)。
评价办法
进行A/B测试,用数据分析用户对结果的满意度。A为旧版本,B为新版本,B结果出现后,可参考的数据有:
点击第一个结果的时间,分析类化和标签化后,是否更有助于消除歧义,精确定位;
点击第二、三、四个结果的时间,分析第一个结果的精确度,以待优化排序和分类;
翻页数,分析第一页结果集的精确度;
版本切换量,分析新版本的接受程度;
搜集网友评价;
用户自主反馈;
调查问卷等线上线下调研。
示意图
|