SLO와 SLI는 서비스 수준을 측정하고 관리하는데 중요한 개념입니다. 이들은 종종 서비스 수준 계약(SLA: Service Level Agreement)과 함께 언급되며, 모두 IT 서비스 제공의 품질을 측정하고 통제하는데 사용됩니다.
SLI (Service Level Indicator): 서비스 수준 지표는 서비스의 특정 측면을 측정하는 기준입니다. 이것은 서비스의 성능과 신뢰성을 측정하는 데 사용됩니다. 예를 들어, HTTP 요청에 대한 응답 시간, 서비스의 에러 비율, 서비스 가용성 등이 SLI에 해당할 수 있습니다.
SLO (Service Level Objective): 서비스 수준 목표는 서비스 수준 지표(SLI)에 대한 목표치나 범위입니다. 이것은 기대되는 서비스 수준을 정량적으로 표현하는 것입니다. 예를 들어, "웹 페이지 응답 시간은 99.9%의 경우 1초 이내여야 한다"는 것이 SLO가 될 수 있습니다.
간단히 말해, SLI는 '무엇을 측정할 것인가'를 정의하고, SLO는 '그 측정치가 어느 수준에 도달해야 하는가'를 정의합니다.
- 서비스 수준: 특정 서비스가 사용자의 예상 작업을 얼마나 잘 수행했는지에 대한 척도입니다. 이 척도를 사용자 만족도와 관련하여 설명할 수 있으며, 서비스에서 수행하는 작업과 사용자가 예상하는 서비스의 작업이나 알려진 수행 가능한 작업에 따라 다양한 방법으로 이를 측정할 수 있습니다.
- 예: '사용자는 서비스가 사용 가능하며 속도가 빠를 것으로 예상합니다.'
- 중요한 사용자 여정(CUJ): 단일 목표(예: 단일 클릭 또는 다단계 파이프라인)를 달성하기 위한 사용자와 서비스의 일련의 상호작용입니다.
- 예: '사용자가 결제 버튼을 클릭한 다음 장바구니가 처리되고 영수증이 반환될 때까지 기다립니다.'
- 서비스 수준 지표(SLI): 서비스 수준을 정량적으로 측정할 수 있는 사용자 만족도 기준입니다. 즉, 서비스 수준을 측정하려면 해당 서비스 수준(예: 서비스 가용성)으로 사용자 만족도를 나타내는 표시기를 측정해야 합니다. SLI는 서비스가 개선되거나 저하되는 과정에서 시간이 지남에 따라 변하는 그래프의 선으로 간주할 수 있습니다.
- 예: '최근 10분 동안의 성공한 요청 수를 최근 10분 동안의 모든 유효한 요청 수로 나눈 값을 측정합니다.'
- 서비스 수준 목표 (SLO): 서비스가 측정된 SLI에 비해 대부분의 시간을 달성할 것으로 예상하는 수준입니다.
- 예: '서비스 응답이 14일 동안 측정된 모든 유효한 요청의 95%에 대해 400밀리초(ms)보다 빠릅니다.'
- 서비스수준계약(SLA): SLO를 충족하지 못한 경우 발생하는 상황을 설명합니다. 일반적으로 SLA는 제공업체와 고객 간의 법적 계약이며 보상 조건을 포함할 수도 있습니다. SRE에 대한 기술적 토론에서는 이 조건이 기피되기도 합니다.
- 예: '서비스가 한 달 동안 99.95%의 가용성을 제공하지 않는 경우 서비스 제공업체는 규정이 위반되는 1분마다 고객에게 보상을 제공합니다.'
- 오류 예산: SLO를 위반하기 전에 견딜 수 있는 시간 또는 부정적인 이벤트의 수입니다. 이 측정값은 비즈니스에서 예상하거나 허용할 수 있는 오류의 수를 나타냅니다. 오류 예산은 위험한 결정을 내리는 데 도움이 됩니다.
- 예: 'SLO를 99.9% 사용할 수 있는 경우 요청의 0.1%를 허용하여 이슈, 사고 또는 실험을 통해 오류를 처리합니다.'
'잡다한이야기' 카테고리의 다른 글
MBTI 유명 인사 유형? (0) | 2021.01.14 |
---|