近日,CNNIC发布《第27次中国互联网络发展状况统计报告》。报告中关于全国31个省市网络速度的排名数据引起广大网民和媒体的质疑。尤其以上海市的网络速度排名全国最后一位,这一结果在上海市引起轩然震撼。国际大都市的网络水平居然如此之差 ,难免令人生疑。 恰逢两会筹备期间,当某上海政府官员在接受媒体就两会事宜访问时突然被问及此事,也表示十分的不可思议。这一排名数据在上海网民及各大媒体中间传的沸沸扬扬,人们对于这些数据的来源和评测方法表示极为的好奇。
记者走访了解,该数据是通过第三方监测的方式获取。第三方网站性能监测是国际上测试网站访问性能,提升网络服务质量的一种通用手段。目前全球从事该行业的权威机构屈指可数。而该报告数据提供方北京博睿宏远发展科技有限公司在业内是一家不知名的小公司,提供的监测数据常常由于其监测方式和监测手段的不合理,而遭到行业质疑。 对于报告中发布的各项数据,不论是业内人士或旁观人群都觉得过于失真。
报告中排名首位的河南省网络速度为131.2KB/s. 根据访问网络的常规经验:100Mbps配置的服务器,下载速度通常为2MB/s. 报告数据整整慢了10倍之多,这样的结果令人咋舌。 如果最好的IDC性能仅仅只达到100KB/S左右的话,那么全国的IDC根本无法提供商用。赤裸裸的反常理数据,着实让人费解。那么这一数据究竟是怎样得来?记者通过一番调查发现,无论从监测方法和计算方式上,都存在诸多问题。
(一)监测样本数量过少影响数据失真
第三方监测原理是通过采集大量样本数据进行科学计算,从而测试出网络性能。充足的样本可以避免因个别样本的质量问题,影响整体性能的评测结果。从统计学角度,大样本(样本数量多)的监测方式更加能够说明问题, 监测样本的数量直接影响到最终统计数据的准确性,直接关系到监测服务商提供的数据是否真实可信,这也是第三方监测机构的服务理念和价值所在。
报告在对监测方式的说明中称:“在31个省市均选取出样本点”,却并未说明在每个城市到底选取的样本数量。仅通过单一样本监测,样本数据会受到多种条件制约,样本的自身质量会受到带宽、内存、操作系统、终端设备等诸多因素影响,测试结果将无法代表真实的访问性能。
报告数据与实际访问存在巨大偏差,在样本数量上或存在重大问题。单一样本的监测方式无法代表一个城市的网络性能,评测数据不具有任何的说服性。使用这样的数据对全国各省市的网络速度进行排名是绝对不科学的,也是极为不负责任的表现。
(二)通过测试页面的方式衡量下载速度是不合理的
报告指出:“选取中国前20家主流互联网网站作为目标网站,以对这些网站的测试情况代表中国整体互联网速度情况。” 从监测原理上来看,通过测试页面来衡量下载速度是不合理的。因为页面的下载时间会受多种因素的影响,例如页面在浏览器加载的过程中存在着浏览器并发下载页面元素,同时页面中的脚本又会对页面元素的下载起到阻塞的作用。 因此,通过测试页面的方式实际上是无法准确测量网络速率的。从测试数据看,IDC机房的下载速度比家用ADSL速度还慢,这显然不合乎常理。
(三)仅采用IDC方式测试网络速度是不科学的
报告说明:“仅通过IDC方式测试”,这样的监测方法也是不科学的。网站的访问性能包括IDC之间的线路连通和网民到IDC的访问两个环节。网民的访问情况更加能够代表该地区的网络性能。 忽略这一重要评测环节,只采用单一视角的测试方式,等于网络连接过程只走了一半就取出数据来说明整个网络连接速度,是不具备常识且极为不专业的表现。
(四)数据计算公式和定义存在明显错误
报告中称:“虽然我国有线(固网)用户中宽带普及率已经高达98.3%,但是全国平均互联网平均连接速度仅为100.9 KB/s,远低于全球平均连接速度(230.4KB/s)。”其中提到的固网宽带的速率指的是终端用户到当地接入运营商的网络速率,而测试方法测试的却是各地IDC机房到20个网站的平均下载速度,两者的概念完全不同,根本不具备可比性。
此外,在“关于互联网连接速度测试方法的说明 ” 中提到,报告数据的网络下载速度计算公式:
单个页面加载速度(KB/s)=单个页面加载字节数(KB)/单个页面加载耗时(s)
由于单个页面加载耗时中除了包含客户端的渲染时间之外,实际上还包含页面中脚本的运行时间。这两部分的时间中,大部分情况下是没有发生网络通讯的,并且受各网站页面设计的影响非常大,所以不应该参与网页下载速度的计算。
另外,对地区互联网连接速度平均值的计算没有指明用的是哪一种平均值算法,是算术平均?几何平均还是中位值平均?采用不同的平均值算法,也会对速度的计算产生很大的影响。
针对博睿数据偏差问题,记者从网友反馈和某权威杀毒软件公司病毒库中发现,博睿的监测节点大多使用木马捆绑的方式进行部署。通过百度搜索了解,确有网友反应在杀毒软件中发现的木马病毒标有博睿公司测速软件的说明。我们且不说这样的部署方式是否违法,单从获取数据的角度来看,只要感染博睿的木马病毒就可随意成为其监测点,那么监测点的质量将无法得到保障。博睿在对监测点的情况和质量无法控制的情况下,提供的监测数据显然没有可信依据。由此更加能够证实,CNNIC报告数据的偏差原因,该报告提供的数据不能反映全国网络速度的真实情况。