考拉海购全面云原生迁移之路

发布时间:2022年06月03日
       今年8月底, 入驻“阿里动物园”一周年的考拉海狗首次宣布战略升级。 在现有跨境业务的基础上, 重点将从“货”转向“人”。 发展会员电子商务。 外界不知道的是, 对于考拉来说, 升级的不仅仅是业务。 考拉海购技术总监谢承超介绍, 考拉已经全面拥抱云原生, 这将大大提高运维效率, 加速业务的迭代升级。 “年初, 我们完成了所有考拉到阿里云的迁移, 但我们觉得这还不够, 给自己定了一个新的KPI, 让所有应用在9月份之前都拥抱云原生。” 迁移与整合, 与时间赛跑20 亿美元收购网易考拉, 既不是阿里巴巴收购历史上最大的, 也不是最艰难的。 然而,

半年就完成了整合, 不到一年就提出了战略升级, 这在阿里历史上是从未有过的。 快速集成升级首先是由技术驱动的。 “一年多来, 我们一直在与时间赛跑。” 谢品超说道。 在迁移过程中, 需要确保业务不受损, 所有在线服务全程可用。
        但现实是原机房距离太远, 导致每次网络传输延迟约50毫秒, 给不停的服务器迁移带来巨大困难。 谢品超提到, 当时他想到了一个更完善的解决方案, 在机房里挖了一根光纤, 为考拉建立了独立的VPC来同步数据。 它不仅可以实现顺畅的网络互通, 还可以保证数据的安全性。 困难又来了。 如果切换慢, 先放1%的流量, 再放5%, 再放10%, 会对用户体验造成很大的伤害。 试想一下, 如果客户下单需要 3 秒, 那么客服电话就会被炸掉。 疫情期间, 考拉海外采购团队紧急进行了内测。 所有链接和所有测试链接都进行批量测试, 以确保整个链接的完整性。 “那天晚上真的很担心。” 谢品超说:“切换前一定要保证没有灰度。” 最终, 考拉海狗完整的完成了迁移, 没有出现性能问题。 “整个迁移过程还是比较稳定流畅的, 到了阿里云, 云网络也放心多了。” 考拉全站100%迁移到阿里云后, 稳定支持今年3.8女神节大促。
        据了解, 这是考拉上云后的第一次大促。
        当天的高峰流量较2019年双12增长72%, 但成本较上一届大幅降低。 考拉海外的业务线也被证明是当天100%开放, 形成了一个闭环。 谢品超认为, 阿里云在整个迁移过程中提供了很大的帮助。 阿里云的EPC安全解决方案和数据迁移解决方案非常成熟。 此外, 阿里云的整体能力支持也非常完善。 迁移数据库和ES的成本很低, 没有不兼容的情况。 “阿里巴巴云提供了一个强大的功能, 称为有状态容器。” 谢品超说, 在之前的迁移中, 容器被迁移了, IP地址丢失了。 使用有状态容器,

可以保持 IP 地址相同。 此外, 阿里云产品为自助操作提供了便捷的界面。 “这些产品优势对于提高效率和节约成本的价值是极其巨大的。” 下一步, 全面拥抱云原生, 完成第一阶段目标, 考拉海购开启了全面的云原生之路。 云原生帮助考拉海购大大提升了运维效率。 云原生产品提供了很多API, 可以根据产品的运维接口组合起来开发一个系统, 整体运维变得非常灵活。 在灵活性方面, 考拉海购主要关注两个方面, 一是大促前后的灵活性, 二是白天高峰期和夜间低峰期的灵活性。 第一点比较常见, 第二点就是借助阿里云的弹性能力, 也可以实现单日弹性收缩, 对节约日常成本非常有效。 在容灾方面, 阿里云原生产品具备天然的多可用区容灾能力, 极大地加速了考拉海购同城能力建设。 多可用区灾难恢复能力。 其次, 基于ARMS和PTS, 无需修改业务即可完成全链路压测能力接入(个别特殊逻辑除外), 增量业务也可以零成本接入全链路压测能力。 它解决了业务监控和故障排除中的许多问题。 “这是阿里云的天然优势, 因为这些云产品这些年在双十一都经过了考验, 他们要面对的问题场景和复杂度也是业内最难的, 只有经得起考验的 这些场景中, 有一部分已经体验了阿里云的产品能力。” 谢品超说道。 历经一年多的重新起步, 考拉网现已走上创新之路, 已成为国内领先的会员电商平台。
        考拉网官方数据显示, 截至2020年6月30日, 考拉网会员数量同比增长23%。 会员突出高客订单、高活跃度、高复购的特点:会员年客单价是非会员的7.3倍, 月活跃度是非会员的2.4倍, 年订单数为 非会员的4倍。