生活
网游类似魔兽世界的服务器维护都是在干嘛?

  来, 我作为前网易游戏从业人员来说说真正服务器维护时候在做什么.

  服务器维护分成两种, 紧急维护和日常维护.

  紧急维护一般就是硬件故障或者严重Bug. 这个时候是各个团队最紧张的时候. 每个团队都忙个不停.

  运营团队会发布公告, 安慰玩家, 统计损失, 编写故障报告, 评定故障等级等等策划团队可能会考虑Bug的影响程度, 决定要不要回档, 或者赔偿什么, 赔偿会不会影响经济系统等等.程序团队最重要的是缩小Bug的影响, 比如热更新屏蔽玩法, 然后解决Bug. 有时候硬件故障会导致整个服务器某些结点负载不均衡, 或者万一数据库服务器挂了就得赶紧切数据库. (悄悄吐槽一下IBM的硬件.. 真心故障率太高)QC团队会继续测试一下, 包括改好的版本, QC老大一般有一票否决权决定某个版本是不是放SA团队会有人值班紧跟, 如果硬件问题就联系IT去换啊之类的.

  日常维护就流程化多了

  运营团队会提前放出更新内容, 做好新玩法预热策划会最后在内服上跑一跑玩法看看有没有问题, 然后等着正式开服以后去论坛看玩家反应程序一般就是更新代码, 部署到服务器内部测试, 如果架构有改动, 就和SA配合一起跑脚本改架构. 同时, 另一拨人会跑一堆脚本, 包括和计费的对账脚本, 导数据的脚本, 更新各种榜单的脚本, 预热数据库和cache的脚本等等. 每个人也会对自己的模块再测试一遍, 然后会盯着各种警报QC团队也会在服务器上面把本周新玩法和主流程再测试一遍.其他支持团队就是日常配合工作.

  另外看到很多答案都说重启服务器, 其实我想说, 我们真的很少重启服务器的. 每次重启代价都很大. 除非硬件更新或者特殊情况是不会重启服务器的.

  第一次补充

  很多人关心重启的问题, 我详细讲一下

  其实一般意义上讲服务器重启可以理解为两种, 一种是硬件重启, 一种是服务器进程重启. 硬件重启比较少, 服务器进程重启基本上是必须的. 很多人问为什么硬件重启代价很大. 感觉大家的回答. 我直接把评论补充上来. @曦和风

  如果是自动启动的程序的话没有问题,但是服务器很多系统配置和软件设置都要开机后重新折腾,同时,还要和其他的服务器通信,恢复到启动前的状态,或者从其他服务器同步信息,正确处理关机期间的各种操作,事情多,任务重,出错概率大,都不愿意重启吧。

  有人问关于IBM机器的故障问题.. 我只能说也许我们那一批运气不好. 好几台机器的内存坏了. 给我们造成了不小的影响. IBM的口碑很好. 所以才会让我觉得很诧异

  还有人提问为什么维护了这么长时间.. 我想说. 请去客服专区或者论坛发帖, 会有一大波运营人员过来安抚你的.

  还有人抱怨一个礼拜维护两次这种. 我想说EVE这种神作是每天早上维护一次呢. 维护也是为了大家能更好的游戏啊. (吐槽一下谁让EVE用的是Windows服务器呢.)

点击分享到

热门推荐