一站式网站建设专家

十五年定制化网站建设经验.我们只做有价值的网站

互联网经验

15+

服务客户

2600+

专业团队

30+

百度指数2014年9月份最新采集方案(快速、准确)

发布时间:2018-03-08 13:34 发布作者:admin 阅读:79
本方案是2014年9月份最新的思绪。在6月份方案根本上做了重大改良,大大进步的收集的效力。
 
综合了下面两种思绪:
1)折线图偏移算法;一次查询可以获得N天的数据(6月份的方案一次查询只能获得一天的数据),削减被封(账户/IP)的几率。
2)Webkit摹拟鼠标移动,OCR切确提取;当偏移算法误差较大时主动进行校订。
在加速速度的同时也包管了切确度。
 
该方案一次查询最多可以收集6个月(N=180天)的数据。
算法1)的切确度跟查询的距离时候(距离时候=终止日期-肇端日期)有关,误差值跟距离天数成正比。
 
具体的有一些数字供参考:
 
* 距离时候1天误差:  0.1%
* 距离时候10天误差: 0.2%  建议采取该距离!
* 距离时候30天误差:1%
 
 

相关资讯