互联网快速发展,对网站内容数量的需求也越来越大,网络内容的生产者们被要求快速发布、快速更新。然而,内容产出质量上的苍白与匮乏,直接导致了各大媒体、社交平台网络文章非法转载、抄袭等现象的大面积爆发。
内容上的无原则无底线“借鉴”,使得越来越多的原创作者、媒体开始重视原创内容的维护,选择通过法律手段保护自身权益。最新发布的《中国法院知识产权司法保护状况(2014)》白皮书显示,2014年,全国地方人民法院仅新收著作权案件就有近6万件,占新收案件数量60%以上。然而,更多的原创作者却陷入“谁抄了我的我都不知道”的维权困境。适逢4月26日世界知识产权日,网络维权再一次被搬到了台面上。
毫无疑问,微信是当下最热的移动互联网社交平台,是中国互联网最重要的信息集散地之一。凭借与腾讯于2013年达成的战略合作,搜狗率先在微信搜索领域取得突破,于去年6月上线搜狗微信公众平台搜索,第一次将海量微信公众号及其文章以外网形式展现给用户,并且面对越来越多作者对保护原创的诉求,搜狗微信搜索建立“相似文章排重机制”,凭借自身对微信数据强大的分析能力,助推“原创保护”。
搜狗微信搜索平台根据现有四类主要用户群体需求(营销从业者、网站编辑、原创作者、对专业类信息搜索结果高要求的人群),在微信搜索中提供查找相似文章进行数据分析、实现更精准排重筛选的功能,为原创作者和原创作品保驾护航。
无论是原创作者,还是对专业类信息搜索有精确需求的普通用户,只需在搜狗微信搜索输入所要查找的标题、一句话、甚至一个特定关键词,搜狗微信搜索特有的“相似文章排重机制”便开始对搜索内容进行识别。
具体而言,搜狗微信搜索通过智能分析技术,针对关键词、文章长度、文章类别、主题分布类别等粗特征提取文章,将相似文章聚类,提升识别效率;另一方面,在对每一个聚类文章进行短语、句子、词组等精细特征进行提取识别并识别成功后,搜狗微信搜索根据文章时间先后排序,由系统判定时间最早的文章是原创文章,并进行优先排序。经过人工测试,该机制识别精度目前已经达90%以上。对于原创作者来说,利用搜狗微信搜索,可以第一时间发现自己的原创作品是否存在非法转载、抄袭现象,进而采取相应的维权手段。
事实上,搜狗微信搜索服务的提供,也是率先在业内实现了对微信公众号内容的抓取。微信平台上的海量优质内容,通过搜狗微信搜索,将微信内容从社交空间“回归”到中文互联网世界,打破社交平台和搜索引擎之间的内容壁垒,实现微信内容价值的提升,构成了搜狗搜索独有的差异化优势,微信搜索的产品想象空间也随之增大。而对于用户来说,在微信内容上的多层次需求也必将通过搜狗微信搜索获得更有效率、更全面的满足。