학습개요
우리가 접근할 수 있는 외부 데이터로는 검색데이터, 뉴스데이터, 웹데이터, SNS데이터 등이 있다. 이 강에서는 뉴스데이터, 웹데이터, SNS데이터를 수집해서 활용한 사례를 살펴본다. 아울러 공공데이터를 활용하여 서비스를 혁신한 사례를 살펴본다.
학습목표
- 뉴스데이터의 수집과 활용에 대해 살펴본다.
- 웹 데이터의 수집·활용에 대해 살펴본다.
- 소셜데이터와 공공데이터의 수집·활용에 대해 살펴본다.
연습문제
- 빅카인즈는 한국언론진흥재단이 언론사들로부터 수집한 뉴스 통합 데이터베이스에 분석 접목하여 개발한 뉴스 분석 서비스이다.
O
X - MIT Billion Price 프로젝트는 리고본리와 카벨로(R. Rigobonry and A. Cavallo)가 쇼핑몰 가격을 웹 스크래핑하여 데이터베이스를 만들고 이를 바탕으로 실시간 주가지수를 작성한 프로젝트이다.
O
X오답입니다.정답 : X - 2020년 코로나 19 감염증이 확산하는 초기에 마스크 판매 관련 앱을 만들어서 문제를 해결할 때 마스크 판매현황 데이터를 수집한 곳은?
- 의사협회
- 보건소
- 건강보험심사평가원
- 네이버, 카카오
정답 : 3
정리하기
- 한국언론진흥재단의 Bigkinds를 통해 우리나라 뉴스 키워드의 흐름을 알 수 있다.
- 웹에 있는 다양한 데이터들은 웹 스크래핑 또는 공개 API를 통해 접근할 수 있도록 하였다.
- 트위터 등 소셜네트워크 데이터는 API를 인증받은 후 이용할 수 있다.
- 공공데이터는 정부와 공공기관이 통계작성, 행정처리 등을 목적으로 수집한 데이터이며 API를 인증받은 후 이용할 수 있다.