【TechWeb】“19天备战”、“691亿次互动”,这个虎年春晚,京东交出了一份漂亮的答卷。
过往的618和11.11,京东用技术硬实力完美护航,保障顺畅的用户体验。今年春晚,京东扛住了流量洪峰,登顶“云计算珠峰”。不拼资源拼架构,京东全新的作战理念,也给国内云计算行业提供了一个新范本。
四大难题 京东春晚迎新挑战
每逢春节,除了家人团聚的快乐之外,全家一起看春晚也已经成了习惯。近几年,随着移动互联网的快速发展,以及趣味红包玩法的加入,让春晚再次增添了几分乐趣。值得注意的是,春晚不同于任何一次大促,短时间内聚集的流量是平台从未有过的考验。因此,从近几年春晚的红包合作伙伴可以看出,都是高用户数平台,并且是技术基底稳健,有着雄厚技术实力储备的公司。
“今年春晚红包项目,与以往大不相同,可以用四句话来概括:‘时间急,任务重,难度高,玩得溜’”,日前在京东云“谈云说AI”技术×产业沙龙上,东云数据库负责人刘启荣坦言。
据了解,此次春晚红包项目,京东的筹备时间是史上最短,仅有19天。并且,春晚红包互动是一个世界顶级高并发的场景,而京东云要在基本上不加内部资源的情况下支持项目。不仅如此,作为一家电商平台,除了春晚项目,京东还要支持年货活动,压力倍增。
对比此前的618和双11,京东春晚项目组IDC基础保障负责人马晓越指出,春节红包项目其实跟大促还是有不同的点,首先就是量级不同,毕竟买东西的量级和春晚量级是不一样的。其次就是抢红包模型,拿出手机摇一摇抢红包,跟我们在购物的时候,浏览商品加购物车,还是有一些不一样的,模型不一样就带来技术实现的是不一样的。会不会有突发事件,突发事件怎么做应对,怎么做处置等,都是需要特别深入的思考。
最大规模、最复杂场景、最长周期、最短备战时间,对于任何一家技术公司而言,都是严峻的考验。谈及其中最难的地方,马晓越告诉TechWeb,包括场景、流量等,此前京东在大促等相关场景有过一定的积累,最大的挑战其实还是时间,19天的筹备时间确实让团队经受了不小的压力。
不拼资源拼架构 精细化运营扛住春晚流量洪峰
兵马未动,粮草先行。资源就是粮草,为了应对春晚的流量洪峰,大多数企业的思路就是堆资源。但是,今年春晚京东给出了新思路,低碳精细化运营成为主题,不堆资源拼架构,通过深挖服务器算力潜能,以及对现有资源进行云端的灵活敏捷调度腾挪,扛住春晚流量洪峰。
谈及为何采取这种全新的方式,马晓越表示,之所以不采取传统的堆资源的方式,主要是基于两个方面的考虑。一方面,疫情导致的全球供应链紧张,让堆砌资源的客观路径变得行不通。
另一方面,春晚红包项目并不是618和双11这样的常规节目,并且其流量也要远高于大促活动,因此如果单单为了春晚红包项目就采购大量的资源,投入过大,并且后续也会造成浪费,这点与京东云长期追求的精细化研发资源管理理念相悖。据了解,近几年,京东在公司内部都会有一个业务技术将本的考核,包括CPU等各方面的使用率,都会有一个提升的标准,来降低资源成本。
不过,不堆资源,也并不是代表着以后不花钱采购,马晓越告诉TechWeb,我们不是不买,而是把钱花得更有价值,花在刀刃上,不能浪费,要科学投入。
那么,不堆资源,京东云到底是如何扛住了春晚的流量洪峰?
恐惧源于未知,要战胜恐惧就要把未知变成已知。据马晓越介绍称,京东云的云原生数字底座可以像乐高积木一样快速拆解,完成活动的楼层搭建和场景添加,从而极大提升项目的开发效率,这也是此次京东云能够在短时间内为春晚红包互动活动快速搭建一套超高弹性、高效敏捷的数字底座的核心原因之一。
同时,在沙龙上,京东春晚项目组容器研发负责人赵建星表示,除了云原生的数字化基础试设施,京东云基于超大规模的云原生实践,打造出了业内首个混合多云操作系统京东云云舰,能够实现对超大规模计算资源的弹性调度与管理,让有限的计算资源在不同任务间无缝切换,用到极致。
而为了保障抢红包互动的顺畅运行,在整个春节活动备战期间,也协同零售做了多轮全链路、全场景、高保真压测,压测之前做尽量详细的压测方案的制定,尽量保障在压测实际过程中跟线上流量模型保持一致。京东云还准备了有两万多次核心场景的预案脚本手册,如果真的出现问题,按照脚本进行操作,在这种场景下极大保证突发场景下的成本或者应急止损链路。
根据官方给出的数据显示,此次春晚项目,京东云实现了秒级调度近300万个容器、超1000万核算力资源,在7轮红包互动过程中,在春晚互动模式与“年货春运”模式之间进行了16次无缝切换。
全链路保障 技术背后更有温度
保障春晚当天抢红包网络不崩,只是对京东的最基本考验。和618、双11一样,往往到了这个时候,也是黑产最为活跃的时刻。京东春晚项目组风控安全账号负责人陈玉杰介绍说,安全团队对红包活动做了非常精细化的管控,提供全链路防护能力。
据悉,京东春晚红包项目涉及到的链路很长,从登陆注册、抢红包,摇一摇,抢完红包还要用红包,从网络层、数据层、主机层,包括应用层,各个层面都对京东的安全防护提出了很高的要求。
得益于过往多年在618以及双11活动上的磨练,京东在安全方面已经有了很深厚的积累,也因此可以在非常短的时间内,对红包相关的接口做全面测试和保障。通过建立模型、用户画像的,京东建立了黑产和正常用户之间对抗模型,精准识别正常用户与机器人账户,作出有效的判断和拦截,有效保证正常用户的权益得到最大化保障。
与此同时,为了保障数据安全,京东还从多方面建立了一套数据防护体系。第一是数据的权限,京东对敏感数据的权限做了收敛,需要有数据查看的权限,这是第一个层面,从入口上做了把控。第二,则是从全链路进行加密,对注册、登录,包括账号,敏感信息,敏感信息都实现了全链路加密,保证任何一个流转环节数据都是加密传输,中间不能被随意破解的,提升了黑产的门槛。
谈及是如何做到这么大数据量的加密时,陈玉杰表示,我们有一套密钥管理平台,这个密钥管理平台有很多的策略和很多的方式,对各种数据在不同情况下做不一样的加密,这个加密方式是让坏人琢磨不透的,有时候用A加密,有时候用B加密,加密实时变换。
众所周知,在京东购物,最核心的体验就是商品质量高、服务好。这一次,除了雄厚的技术实力保障了春晚红包项目的顺畅运行外,智能客服的快速响应也让今年春晚更加有温度。换句话说,通过19天的备战,京东提供的是一系列有技术、有温度的数字化解决方案。
可能有人会有疑问,智能客服就是一问一答,有什么需要备战的?对此,京东春晚项目组智能客服部算法负责人陈蒙解释称,要保证在资源受限情况下,保证性能稳定情况下,AI在回答用户咨询问题时候也是不能胡乱回答,能够保持足够智能度,这就需要在资源、性能,以及效果之间,这三者取得一个比较好的平衡。
数据显示,自年货节启动至春晚结束,京东云自主研发的京东智能客服言犀,累计咨询服务量达5.5亿次,为16.5万商家提供超1亿次服务,前沿的AI技术+日常的“加练”让言犀扛住了“春晚”期间智能人机交互的峰值需求。
写在最后:
春晚结束了,京东云在全国人民面前炫技,再次证明了自己,登顶了云计算领域的“珠穆朗玛峰”。除此之外,从整个行业的维度来看,京东云此次也开启了一个新的开端。比如从“拼资源”迭代为“拼架构”的全新理念,智能人机交互解决方案对全行业的赋能,可以提供给政企客户,帮助大家更加高效、低成本享受先进的人工智能服务。
关键词: