■ Data Science 2

Elastic Search의 이중화 방식(HA)

Primary-Replica 방식 일반적인 Elastic Search 이중화 방식 Primary Shard에 데이터를 저장하고, Replica Shard에는 복제함 Primary Shard의 데이터 변경은 Replica Shard에도 동기적으로 반영됨 주로 읽기 성능과 장애 대비를 위해 사용되며, 복제본이므로 데이터 손실 시에도 복구 가능 Async Replication 방식 Primary shard에 저장된 데이터 변경이 이루어지면, 이를 신속하게 Replica shard에 복제하지 않고 일정 시간 간격으로 비동기적으로 복제 읽기 성능에 영향을 주지 않으며, 복제 지연 시간 동안 데이터 손실 가능성이 존재 Sync Replication 방식 Primary shard에 저장된 데이터 변경이 이루어지면, ..

Elastic Search의 샤딩(Sharding)에 대해

샤딩(Sharding)이란? 샤딩은 대량의 데이터를 더 작은 조각으로 분할하여 여러 개의 서버에 저장하는 개념을 의미함 단일 서버에서 처리하는 어려운 대용량 데이터를 여러 서버에 분산하여 처리하도록 할 수 있게함 샤딩의 필요성 데이터 베이스내 데이터 양이 증가하게 되면서 단일 서버에서 처리하기 어려움, 그렇기에 이를 해결 하기 위해 분산 처리하게 끔하는 개념인 샤딩이 필요함 ElasticSearch에서의 샤딩 Elasticsearch에서 Document의 집한인 Index는 기본적으로 "샤드(Shard)"라는 단위로 분리되고 각 노드에 분산되어 저장됨 Elasticsearch에서의 Shard는 "Primary Shard"와 "Replica Shard"가 있는데, "Replica shard"는 "Prima..