中国气象报记者 刘钊
8月29日7时,国家气象信息中心运行监控室(以下简称运控室)运行二科科长刘然来到“天镜”厅,开始了他异常忙碌的一天。
他和同事第一件工作,是调试视频会商系统,为30分钟后开始的专题会商做好准备。紧接着专题会商的,是8时的全国天气会商、8时33分与应急管理部的视频连线、10时的气候趋势预测会商和初霜冻预测会商、14时台风“利奇马”预报总结会商、机关学习报告会转播、16时台风“杨柳”专题会商……这一天,他们挑战了会商服务的极限——接连8场会商、视频会议的“连轴”式服务。刚投入运行的第四代电视会商系统,通过传统会商和云会商相结合的模式,使完成如此高强度的服务成为可能。
在汛期,这就是运控室工作人员的初心与使命——维护信息传输通畅无阻、确保业务运行高效稳定。他们在旁人不易察觉之处,为汛期气象服务的开展贡献力量。
1
走进“天镜”厅,坐在运维平台的工位上,朱玲玲一天的值班开始了。
一线值班,24小时不能离人。尤其是在汛期,全国范围内一旦数据传输缺失、业务系统出现故障、网络访问异常,很多人第一反应都是求助于运控室一线值班人员。也正因为如此,他们的工作非常繁忙。
早上8时左右,是各种数据传输的高峰期,当然也是值班人员一天中最忙碌的时段之一。朱玲玲抓紧时间,完成与夜班同事的工作交接、准备白天值班日志、查看业务状态等前置工作后,一个个咨询电话便接踵而至。检查告警、沟通联系、解决故障……这一忙,就是两个多小时。一天下来,值班人员需要完成的检查项目数以百计。
运控室的夜班尤为辛苦。很多夜班值班人员都是业务骨干,虽然值完夜班可以安排倒休,但白天常常仍有事务需要处理,不得不“连轴转”。运控室大部分技术骨干都有着下了夜班上白班的经历。
不过,今年汛期的值班工作,有了不小的变化——“天镜”综合监控系统正式投入运行,使得这份工作变得更清晰、更有条理,在一定程度上把值班人员从繁琐的重复性劳动中解放了出来。
运行一科科长陈文琴是“天镜”系统的主要建设者之一,对于业务监控工作的新变化,她很感慨:“过去业务监控系统是分散的、独立的,一个业务对应一个界面,值班人员要一项一项检查,有时难免有所遗漏。不同监控软件的操作方法还各不相同,需要经常学习和记忆。‘天镜’将原有的复杂监控系统合为一体,不仅有了对于数据全流程较完整的监视,还将不同业务的告警信息集约在统一的集中告警台进行显示和处理,大大提高了一线业务监控的效率。”集约化监控系统为今年的值班工作减负不少,对于“天镜”系统的未来,她也充满了期待。
不仅如此,该系统今年新增的两个“小帮手”,也为值班人员减负不少:“天镜”告警微信通知功能改变了值班时“一步都走不开”的窘境;移动化的运维值班平板电脑不仅可以便捷查看值班表、知识库,拨打和接听电话,还具备任务到点提醒功能。
运控室值班人员在“天镜”厅值守。
2
“你们这个架构,我觉得可以再优化一下,比如……”李楠与业务单位相关负责人聊得热火朝天。他正在试图改善业务应用架构,以便让它占用的资源更少、运行效率更高。
保证通信不中断,数据收得到,机器转得动——长久以来,所谓“运维”,仅局限于这些内容。但今年,李楠觉得,他的工作逐渐变得“高大上”起来。随着基础设施资源池的推广,这份工作逐渐从被动维护转向了主动优化。
“以前我们分配了系统资源就不管了,只有遇到故障时,才会被‘联系’。现在我们努力与业务单位合作,帮他们做到更好。”李楠说,这样的工作状态,以前简直无法想象。
在李楠面前的“天镜”国家级气象信息基础设施云平台监视页面上,显示着1011台虚拟机的运转状况。这些虚拟机中运行着来自12家单位的400多个业务应用。“我们的主要工作之一,就是优化调整这些虚拟机的运行。系统会随时监控虚拟机的运行,如果某个应用占用的资源总是有富余,就回收它占用的资源;某个应用的资源总是不足,就多给它分配一些。”李楠说。
靠着这套动态调整系统,运控室能够使计算资源利用率实现最大化。“天镜”解放出来的劳动力,如今被用在了更具主动性的运维服务上。对此,李楠深感自豪。
李根在气象云机房检查设备运行状况。
3
最近,贺俊彦多了一项烦恼,原本通过证书可方便登录的VPN,现在增加了一道短信验证环节,登录认证流程变复杂了。她找领导倾诉一番,得到的回答让她很受触动。原来,VPN多因素认证是近期开始实行的诸多安全措施之一。
网络安全是今年全国层面的重点工作。站在气象部门网络安全防护的第一线,运控室担负的职责颇重,因此,他们的网络安全培训与实践也比其他部门来得更早一些。
“VPN仅通过证书登录,使用者是方便了,可是攻击者也方便了。”在经过多次培训和实践演练后,贺俊彦认识到了这个道理,开展工作,方便固然好,但安全始终是第一位的。
通过网络安全宣传、运控室支部党课、信息中心党委举办的关于网络安全的党课等全方位学习后,贺俊彦的网络安全防护意识比以往增强了不少。
她说:“以前我认为,业务系统只要是在内网就一定是安全的,设置的密码也简单好记,对于网络攻击、黑客等的了解几乎为零。而现在我意识到了网络安全形势的严峻性,以及网络攻击手段的多样性。尤其是我们做业务运维工作,应该把业务系统的安全放在第一位。”如今,她将负责的业务系统以及个人办公账号密码均设置为符合安全等级要求的强密码,并且按照要求安装了安全防护软件。运控室定期发布的安全事件通报也成了她日常关注的热点之一。
他们并不直面天气预报,却为提供精准及时数据殚精竭虑,为业务系统稳定高效运转付出心血,才能让气象部门这棵大树从根系到枝叶始终“血脉”通畅。在全国汛期气象服务的战场上,运控室是全体气象人的大后方。业务平稳运行时,他们看似悄无声息,其实“负重前行”,他们就是这样践行着自己的初心与使命。
(来源:《中国气象报》2019年9月19日四版 责任编辑:张林)