4강. 빅데이터의 수집과 활용 2

학습개요

우리가 접근할 수 있는 외부 데이터로는 검색데이터, 뉴스데이터, 웹데이터, SNS데이터 등이 있다. 이 강에서는 뉴스데이터, 웹데이터, SNS데이터를 수집해서 활용한 사례를 살펴본다. 아울러 공공데이터를 활용하여 서비스를 혁신한 사례를 살펴본다.

학습목표

  1. 뉴스데이터의 수집과 활용에 대해 살펴본다.
  2. 웹 데이터의 수집·활용에 대해 살펴본다.
  3. 소셜데이터와 공공데이터의 수집·활용에 대해 살펴본다.

연습문제

  1. 빅카인즈는  한국언론진흥재단이 언론사들로부터 수집한 뉴스 통합 데이터베이스에 분석 접목하여 개발한 뉴스 분석 서비스이다.
    O
    X
  2. MIT Billion Price 프로젝트는 리고본리와 카벨로(R. Rigobonry and A. Cavallo)가 쇼핑몰 가격을 웹 스크래핑하여 데이터베이스를 만들고 이를 바탕으로 실시간 주가지수를 작성한 프로젝트이다.
    O
    X

    오답입니다.
    정답 : X

    MIT Billion Price 프로젝트는 실시간 물가지수를 작성한 프로젝트이다.

  3. 2020년 코로나 19 감염증이 확산하는 초기에 마스크 판매 관련 앱을 만들어서 문제를 해결할 때 마스크 판매현황 데이터를 수집한 곳은?
    1. 의사협회
    2. 보건소
    3. 건강보험심사평가원
    4. 네이버, 카카오
      정답 : 3

      당시 공적 마스크는 약국을 통해 개인별로 배정했고, 약국을 통해 판매현황 데이터가 입력된 데이터는 건강보험심사평가원에 축적되어 제공되었다.

정리하기

  1. 한국언론진흥재단의 Bigkinds를 통해 우리나라 뉴스 키워드의 흐름을 알 수 있다.
  2. 웹에 있는 다양한 데이터들은 웹 스크래핑 또는 공개 API를 통해 접근할 수 있도록 하였다.
  3. 트위터 등 소셜네트워크 데이터는 API를 인증받은 후 이용할 수 있다.
  4. 공공데이터는 정부와 공공기관이 통계작성, 행정처리 등을 목적으로 수집한 데이터이며 API를 인증받은 후 이용할 수 있다.

Leave a Comment