순천향대학교 컴퓨터공학과 이상정

[빅 데이터 이해]  


                                                                         과제제출게시판

  • 중간시험 일정 및 강의실
    - 2017 4 20() 3
    - M610
    강의실

  • 강의목표
     빅 데이터 컴퓨팅의 기본 개념 및 원리를 강의한다. 주요 내용으로는 빅 데이터의 기본 개념을 소개하고, ELK (Elasticsearch, Logstash, Kibana) 스택을 사용하여 빅데이터 처리를 위한 분산 시스템 플랫폼과 빅 데이터의 수집, NoSQL 데이터베이스를 적용한 빅 데이터 저장과 처리, 빅 데이터 검색, 차트를 사용한 시각화, 기본적인 분석 등을 강의하고 적용 사례를 살펴 본다.

강의내용

참고 사이트

0. 강의 소개

1. 데이터 소개

MapR Academy, Introduction to Big Data

2. 아파치 하둡 소개

MapR Academy, Introduction to Big Data

3. 엘라스틱서치 소개

   You Know, for Search

4. 엘라스틱서치 설치와 실행

You Know, for Search
VirtualBox-5.1.18
, Extension_Pack
한글 PuTTY
ubuntu 14.04 with Elasticsearch.ova

5. 클러스터 구조

   Life Inside a Cluster
   X-Pack for the Elastic Stack

6. 데이터 처리

   Data In, Data Out
  
Distributed Document Store

프로젝트 계획서 발표

중간시험 문제풀이

7. 검색 기본과 매핑

   Searching – The Basic Tools
Mapping and Analysis
load_test_data.sh

8. 요청 몸체 질의와 정렬

   Full-Body Search
  
Sorting and Relevance

9. 검색 샤드 동작

   Distributed Search Execution
  
Inside a Shard

10. 데이터 수집 - 로그스태시

   Getting Started with Logstash
  
Getting Started with Filebeat

11. 데이터 시각화 - 키바나

   Getting Started with Kibana
     
access.log

12. 데이터의 분석 - 어그리게이션 기초

   Aggregations

13. 데이터 분석 - 어그리게이션 고급

Aggregations