Aurora 특정 노드에서 DB 커넥션이 다수 끊겼는데, 다수의 Replication Lag이 확인이 된 사례가 있었습니다. 1. Replica Lag이란? Replica lag이란? 원본 클러스터의 데이터를 읽기 전용 DB 인스턴스로 복제해 올때의 지연 시간을 의미합니다. ReplicaLag 복제본 지연(밀리초) 원본 DB 인스턴스를 기준으로 읽기 전용 복제본 DB 인스턴스의 지연 시간. MySQL, MariaDB, Oracle, PostgreSQL 및 SQL Server 읽기 전용 복제본에 적용됩니다. 초 2. 문제 시점 당시의 Cloudwatch metric 3. 문제점 분석 DB 커넥션의 Drop은 커넥션 타임아웃에 의한 것일 수 있기 때문에 application/DB-error logs를 확인하..
AWS
잘 돌아가'던' RDS FreeStorageSpace가 낮아졌다고 문의가 올때가 있었습니다.. 대다수 클라우드 고객들의 이슈라고 생각하는데, 그러면 클라우드 사용하는 유저분들은 왜 우리 리소스에 문제가 생겼지? 인프라 문제 아니야? 라고 생각할 지 모릅니다. 하지만, 그럴 경우에는 진단 및 관제 후 해당 내용에 대한 조치가 이루어진 다음에 다시 어떻게 진행되는지 살펴보는 프로세스를 거쳐서 RDS 인스턴스의 메모리가 낮은 이유를 역추적 해야 합니다. 대개는 파라미터 그룹 설정 혹은 DB 최적화 이슈, DB 커넥션 급증이 가장 큰 원인이지 않을까 싶습니다. 무슨 일인지 문제 시점을 보자 그림 1) RDS Instance의 ReadIOPS, WriteIOPS입니다. Spike성 Peak가 한 차례 있었습니다..
마이크로서비스 아키텍처란, 시스템을 여러개의 독립된 서비스로 나눠서 이를 재조합함으로써 기능을 제공하는 디자인패턴을 일컫습니다. 대표적인 예 마이크로서비스 아키텍처의 대표적인 예로는 요즘 정말 핫한 넷플릭스와 아마존을 들 수가 있습니다. 넷플릭스의 데이터센터가 장애가 일어나 2008년 넷플릭스 DVD 판매에 차질을 빚었다고 합니다. 그래서 아마존 웹서비스로 2009년부터 2015년까지 이전한 것이 마이크로서비스 아키텍처의 대표적인 케이스가 됩니다. 마이크로서비스를 구성할때, 3가지 디자인 원칙이 있습니다. 첫째, 단일 책임의 원칙. 서비스는 각각이 하나의 책임만 갖는다는 내용입니다. 둘째, 느슨한 결합. 각기 서비스에 대한 내용을 잘 모른다는 내용으로 한 서비스의 업데이트가 이루어져도 다른 서비스에는 영..