搜狐服务器效率提升六倍的秘密

江南 发表于:13年07月10日 11:11 [原创] DOIT.com.cn

  • 分享:
[导读]假如你浏览一个网页,30秒钟后网页还没有打开,那你还会在这个网站停留么?相信大部分人会选择离开。对于互联网服务型企业来说,速度就是生命。这个速度既指企业提供新产品新服务的能力,又指服务的响应快慢给用户带来的使用体验。

DOSERV服务器在线 7月10日原创报道:假如你浏览一个网页,30秒钟后网页还没有打开,那你还会在这个网站停留么?相信大部分人会选择离开。对于互联网服务型企业来说,速度就是生命。这个速度既指企业提供新产品新服务的能力,又指服务的响应快慢给用户带来的使用体验。Sohu.com作为一家立足中国的大型 Web 服务提供商,每天有超过1亿的用户使用搜狐公司提供的各种互联网信息产品。因此保障和优化现有产品以及新产品的用户体验成了搜狐公司的重中之重。作为主要负责搜狐公司网络运营、搜狗搜索、邮件和搜狐通行证等业务的搜狐公司技术副总裁周霖,这项任务理所当然地落在了他和他的技术团队身上。

“搜狐发展到今天,已经成为了一个门户矩阵。近年来,随着视频和移动应用的发展,移动用户增长飞速。而公司给我们技术部门的目标是在发展业务的同时尽量减少投入,同时响应速度更快。”周霖表示。为此,搜狐技术部门决定在统一前端平台的基础上,深入挖掘现有硬件和软件、系统的性能,以产生规模效应,并在提升用户服务质量的同时降低运维成本,进一步提升公司的竞争优势。

千兆负载均衡不堪重负

此前,搜狐统一Web或者移动服务的后面是千兆负载均衡系统,这是搜狐多年来快速响应用户访问的核心。然而,随着新业务的不断增加以及对用户数据的深度挖掘需求,千兆负载均衡系统已经日渐捉襟见肘。

比如,原来网络状况下用户的访问日志等总有少量丢失,这样就不能掌握用户的真实访问需求,改善的途径就是将采集点前移到网络边界,也即从访问LOG开始;其次,伴随着用户数量及上网设备的多样性和复杂性的增加,搜狐受到的网络攻击更加频繁,用户的隐私等安全问题愈发显得重要,而分析安全事件等措施的采取也需要从网络边界端就开始加以防御。

“最重要的是此前搜狐服务器单机性能只能达到C300K(30万并发处理和分发的能力每秒接受30万次的并发访问)的能力,资源使用率不高。我们亟需提高服务器使用率,降低服务器的采购,同时相应减少服务器管理方面的开支。”周霖说。为此,搜狐技术部门从2012年6月开始立项,争取用更快的网络替代原有的千兆网络。

英特尔万兆以太网提升效率6倍

在选择英特尔万兆以太网之前,搜狐曾考虑过用其它厂商的专有网络,甚至是更高速的Infiniband网络也测试过,但是考虑到成本问题最终还是放弃了。

“专有网络只能满足部分需求。不能灵活处理突发事件和未来的变化。搜狐选择网络的立足点是性能上的替代,然后是能进行大规模低成本的部署,最后考虑到和服务器架构的统一性等问题,英特尔万兆以太网自然成为了最佳选择。”周霖强调。

为了更好地推进项目的实施,英特尔与搜狐长期保持良好的合作关系,双方有多年的深入合作,对新技术的研究及行业发展趋势有很大的认同。双方本着以技术探索为基础,行业发展趋势为导向,以深入技术合作、挖掘前沿技术、推动关键技术发展、培养专业技术人才、热点难点技术探索及验证为目标。于2011年共同成立的搜狐-英特尔技术创新实验室就是双方紧密合作的例证。针对这个项目,搜狐和英特尔还成立了联合实验室,加上运维人员,共有20多名技术骨干组成了攻关团队。项目组还给自己定了一个更高的目标:一般而言,网络能实现单机每秒钟响应100万(C1000K)次请求已经是一个很高的标准了,项目组却将目标拔高到C2000K。

“业内是以C1000K做为标准。但是我们考虑到翻倍后能节省更多的资源,所以将目标定为C2000K。此外,原来的标准是突出静态页面能力的响应速度,现在还包括静态页面的转发。”周霖说。

为了验证英特尔万兆以太网能否真的解决原先的瓶颈?搜狐技术团队搭建了开源的Tsung压力测试平台,以保证模拟真实线上高强度万兆压力。同时他们还使用Systemtap等工具定位系统及应用瓶颈,定制和优化Linux系统,并深入内核优化,调整NetIO调度策略以及TCP协议相关,优化七层负载均衡软件代码。在英特尔工程师帮助下,在一系列措施下,经过4个月的努力,搜狐公司单台服务器使用率提高了6倍,成功实现了单机万兆七层C2000K的长链接正常线上服务。

“C2000K实现后的效果是明显的。原先遇到的两大问题,像用户的转发需要重新定向;需要根据用户的Cookie调用后台不同的服务,都需要分开执行。现在判断和分发在一台服务器上就能实现了,极大地提高了效率。”周霖介绍说:“此外,英特尔万兆以太网带来了更高的可控性和可用性,用户访问网页的体验也更好。搜狐还可根据访问日志等大数据进行分析,随时调整相关策略。而架构上的简化,减少了服务器的使用量,同时让运维更加简单化。”

尽管性能提升了6倍,但搜狐还只是用现在的1台服务器替代原先5台服务器的工作量。周霖解释说是需要给服务器的工作负载留有一定的富余量。此外,搜狐也并没有采取大规模铺设万兆以太网的方式来全面升级网络,而是逐步升级,平滑过渡,确保服务的稳定性。

“我们会先替换挂在负载均衡后面的应用,现在在进行底层的测试,确保不出问题后就进行替换。”周霖说:“下一步搜狐还会和英特尔在云平台、智能城市、低成本存储等项目上进行合作,力争给用户提供更好的服务。”

[责任编辑:李洪亮]
李洪亮
7月11-12日,IBM 2013技术峰会将在国家会议中心盛大开幕。目前,IBM已经为您倾力邀请到了多位业内重量级名家,他们将基于“大数据、云计算、移动应用”等九大技术领域,以独到观点和切身经验,为您奉上一场场精彩绝伦的技术演讲。
官方微信
weixin
精彩专题更多
存储风云榜”是由DOIT传媒主办的年度大型活动。回顾2014年,存储作为IT系统架构中最基础的元素,已经成为了推动信息产业发展的核心动力,存储产业的发展迈向成熟,数据经济的概念顺势而为的提出。
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
联想携ThinkServer+System+七大行业解决方案惊艳第十六届高交会
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技术有限公司 版权所有.