• 분산 시스템 기반의 검색 엔진
  • ex) 실시간 분석 시스템에서 저희가 취급하지 않는 쓰레기 데이터를 사전에 걸러낼 때
  • ex) 로그 데이터를 수집해서 이슈 대응을 효율적으로 하고 싶을 때


  • 사용자가 원하는 정보를 불러오는 작업을 담당
  • DB에 쿼리를 보내서 찾는 것보다 훨씬 효율적


분산 시스템 기반의 검색 엔진

  • 빠른 검색 엔진
    • 원하는 데이터가 있는 노드만 찾으면 되고, 여러 데이터를 병렬적으로 처리가 가능함
  • 확장성
    • 데이터가 늘어나도 새로운 노드를 축하여 클러스터를 확장할 수 있음
  • 부하 분산
    • 여러 노드에서 데이터가 처리되므로 부하가 균등하게 나누어짐


  • 특정 노드가 사망시 남은 노드들에 레플리카 추가 생성


2. 간단 용어

스크린샷 2023-09-22 오후 11 41 21

  • 샤드: 데이터를 나눠 저장하는 엘라스틱서치의 기본 단위
  • 노드: 데이터의 저장과 처리를 담당하는 서버, 컴퓨터 1대라고 생각하면 됨
  • 클러스터: 여러 노드가 모여 동작하는 하나의 엘라스틱서치 시스템


3. ELK 스택

스크린샷 2023-09-22 오후 11 44 22


4. 샤드에 데이터 저장하는 방법

스크린샷 2023-09-23 오전 12 03 49