[pilot] Ch3. 빅데이터 수집 실습
0. 이번 장에서 할 것 빅데이터 아키텍처의 첫 번째 레이어인 수집 영역 구축 스마트카 시뮬레이터로 배치 파일(스마트카 상태 정보)과 실시간 로그(스마트카 운행 정보) 생성 이를 플러모가 카프카로 수집 1. Flume 설치 CM 홈에서 [서비스 추가] - [Flume] 선택 서버 호스트 server02.hadoop.com...
0. 이번 장에서 할 것 빅데이터 아키텍처의 첫 번째 레이어인 수집 영역 구축 스마트카 시뮬레이터로 배치 파일(스마트카 상태 정보)과 실시간 로그(스마트카 운행 정보) 생성 이를 플러모가 카프카로 수집 1. Flume 설치 CM 홈에서 [서비스 추가] - [Flume] 선택 서버 호스트 server02.hadoop.com...
[출처: 실무로 배우는 빅데이터 기술, 김강원 저] 1. 요구사항 파악 1) 차량의 다양한 장치로부터 발생하는 로그 파일을 수집해서 기능별 상태를 점검한다. 2) 운전자의 운행 정보가 담긴 로그를 실시간으로 수집해서 주행 패턴을 분석한다. 2. 데이터셋 살펴보기 1) 스마트카 상태 정보 데이터 스마트카의 각종 센서로부터 발생하는 차...
[출처: 실무로 배우는 빅데이터 기술, 김강원 저] 1. 클라우데라 매니저(CM) 설치 CM : 빅데이터 에코시스템을 쉽게 설치하고 관리해주는 빅데이터 시스템 자동화 도구 빅데이터 소프트웨어에 대한 프로비저닝, 매니지먼트, 모니터링 수행 프로비저닝 : 하둡 에코시스템 편리하게 설치, 삭제, 수정 관리 매니지먼...
[출처: 실무로 배우는 빅데이터 기술, 김강원 저] 1. 설치해야 할 응용프로그램 JAVA (Java SE 8u-) 이클립스 Oracle Virtual Box PuTTY (SSH 접속 프로그램) FileZilla (FTP 접속 프로그램) Chrome 2. 리눅스 가상머신 환경 구성 1) CentOS 설치 2) ...
1. Network Topology 컴퓨터의 네트워크 요소들 (링크, 노드 등)을 물리적으로 연결해 놓은 것, 또는 그 연결 방식 2. Client - Server Client 네트워크의 말단에서 자원 요청 서비스를 활용하는 Server 네트워크의 중앙...
1. Load Balancing 서버들에게 트래픽을 골고루 분배하는 것 목적 트래픽을 여러 서버에 분산 -> 더 많은 리소스를 사용할 수 있도록 각각의 인스턴스에게 트래픽 -> 로드 밸런서만 액세스 포인터를 갖고 있으면 됨 인스턴스에 대한 정기적인 상태 점검 수행...
1. EC2 (Elastic Compute Cloud) 늘어나는 임대 컴퓨터 Instance 가상 컴퓨터 환경 원하는 만큼 구축 가능 Instance Type CPU, 메모리, 스토리지, 네트워킹 용량 등 선택 가능 Key Pair ...
🐽 버블 정렬 알고리즘 인접한 두 원소를 검사하여 정렬 문제: 비내림차순으로 n개의 키 정렬 입력: 양의 정수 n, 키의 배열 S[1..n] 출력: 비내림차순으로 정렬된 키의 배열 S[1..n] 의사코드 void bubbleSort(int n, keytype &S[]) { index i, j; for(i =...
☁️ 분기 한정법 최적화 문제를 해결하기 위해 되추적 기법을 향상시킨 기법 되추적 기버보가 마찬가지로 상태 공간 트리 사용 상태 공간 트리를 순회하는 방법이 제한되어 있지 않음! 되추적 기법은 항상 깊이 우선 탐색 최적화 문제를 해결하기 위해서...
🐤 되추적 기법 어떤 마디의 유망성을 점검한 후, 유망하지 않다고 판정 되면 그 마디의 부모 마디로 돌아가서 다음 후손 마디에 대한 검색을 계속 하는 절차 문제 풀이 과정을 트리로 나타낼 수 있음 유망성 전혀 해답이 나올 가능성이 없음: 유망하지 않다 (non-promising) 해답이 나올 가능성이 있음: ...