我们的新闻完全是自动产生的。在类似的话题中,一条新闻被报道的次数越多,排名就靠前。这就是自动聚合功能的服务。从2003年开始,到现在已积累了5年的数据,其实这对于做研究非常管用。比如你要想查某一段时间,比如2003年10月1日到10月30日有哪些活动的报道,到别处去查的话,资料就不是那么齐全,而在百度新闻里就有非常完整的数据,它的作用非常独特。
——2008年5月29日,成思危访探访百度时的对话
2003年、2004年中国电信宽带网扩容后,上网资费大幅下调,老百姓上网开始成为家常便饭,网民数量呈爆炸式增长。面对如此庞大的市场,互联网巨头们各施其谋,抢滩中国。作为第一中文搜索引擎的百度自然也不甘落后,2003年7月,百度连续推出了新闻搜索和图片搜索两个技术化搜索引擎,其中百度图片搜索一经推出就成为互联网上最大的中文图片库。
百度新闻搜索实则是对网页搜索的一种细分,它是一种24小时的自动新闻服务系统,与其他新闻服务不同,百度新闻每天抓取近10万条新闻,其新闻来源于500多个新闻站点,其中包括政府机构、各类媒体网站及专业新闻网站。百度新闻搜索能够在后台自动计算某条新闻被这些新闻站点转载或引用的次数,当一条新闻被转载或引用的次数达到一定数量时,新闻就会自动标记为红色,表示为热点新闻。
在百度新闻频道搜索栏的下边,有“新闻全文检索”、“新闻标题检索”两个功能选项,特殊符号查询、多关键词查询等技术一样可以在新闻搜索中得到实现。此外,百度新闻搜索还采用了一种叫相关度识别的特殊技术,只要两篇新闻中相似的内容达到一定的程度,就会被自动合成为一篇文章,从而节省了网民的浏览时间。而诸如“自动统计”、“相似度识别”等都只是百度新闻最基本的技术保证。作为面向媒体从业人员、公司高管、营销专家、行业分析人员等高端专业用户的服务,百度新闻始终没有停下自我提升的脚步。
给用户所需的,更要给用户意想不到的。