拐点临近 - 美国国防部 Atlassian 应用程序的扩展之路
2019.05.15国防部 Atlassian 用户数,5 年内从 0 增加到 60,000
我们常听人说,使用 Atlassian 是一个循序渐进的过程:开发者首先为我们的某个产品创建了实例,开始和团队一起使用。其他团队听说了这个新工具,也开始尝试,产生了所谓的“基层式”扩张。对于国防部(DoD)来说,也不外乎是这样的过程。
最初,有几个团队使用 Jira 和 Confluence 来记录和规划开发工作,不知不觉就增长到了 6 万人,使用几乎 Atlassian 全系列产品来管理软件开发流程。除了整合实例,增加用户缓存,国防部管理员还需要一种更有效的方式管理大规模应用程序。最近,国防部决定将 Jira Software、Jira Service Management、Bitbucket 和 Confluence 升级到 Data Center,确保能继续提供最高质量的服务和真正的高可用性。
许多客户在使用 Atlassian 产品的过程中,到了某个阶段,对可用性与性能有了更高的要求,仅靠单一服务器或联合环境已经不能满足。
随着应用在整个组织中逐步普及,成为各团队核心任务系统。我们将此称为向双活集群环境迁移的“拐点”,这种环境可以提供高可用性,并支持规模性能。
用户因素
每天有多少用户访问 Atlassian 应用程序。500 个左右吗?我们发现,对于需要更高稳定性的 Jira Software、Confluence 和 Bitbucket 客户来说,迁移的转折点一般出现在用户数量达到 500-1000 名的时候。
性能因素
对于大型实例客户来说,高负载或高峰时段通常会出现性能下降。随着并发使用的增加,响应时间也会增加,导致用户不能有效地完成任务。此时,系统管理员需要寻找解决方案,尽量减少用户及自身的痛苦。很多全球性公司对此深有体会。当公司多个地点的团队同时在线时,会遭遇性能下降。
除并发使用外,其它任务(如 API 调用与查询)也可能影响性能。在现有用户流量之上再作增加只会使问题加剧。
Data Center 使用负载均衡器,可以将某类型流量定向到集群中某些节点。利用这种功能,你可以划分资源,确保所有请求都能维持最佳性能。比如,你可以将所有 API 流量定向到某个或某些节点。这样,正常的用户流量永远不会因为正在进行的 API 任务而变慢。
停机
不管停机是如何造成的,都会造成数百甚至数千名员工无法工作而降低生产力,造成的损失迅速增长。你组织中有多少人依靠 Jira Software、Bitbucket、Confluence 和 Jira Service Management 来完成工作?一小时的停机换算成每小时机会成本损失的话应该是多少呢?
“ 2014 年,我们出现了 55 次停机,2015 年,我们通过扩展将停机数量减少到 7 次。现在有了 Jira Software Data Center,2016 年,虽然使用量一直在增长,但是没有出现一次意外停机。”
MIKE DAMMAN,知识架构师,CERNER