데이터사이언스
데이터과학(Data Science)이란, 데이터 마이닝(Data Mining)과 유하하게 정형, 비정형 형태를 포함한 다양한 데이터로 부터 지식과 인사이트를 추출한늑 과학적 방법론, 프로세스, 알고리즘, 시스템을 동원하는 융합분야
데이터 과학은 데이터를 통해 실제 현상을 이해하고 분석하는데 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 개념으로 정의되기도 한다.
데이터의 구체적인 내용이 아닌 서로 다른 성질의 내용이나 형식의 데이터에 공통으로 존재하는 성질, 또는 그것들을 다루기 위한 기술의 개발에 착안점을 둔다는 특징을 가진다. 사용되는 기술은 여러분야에 걸쳐있으며 수학, 통계학, 컴퓨터 과학, 정보공학, 패턴인식, 기계학습, 데이터마이닝, 데이터베이스 등과 관련이 있다. 데이터 과학을 연구하는 사람을 데이터 과학자라고 한다.
https://ko.wikipedia.org/wiki/데이터_분석
데이터사이언스 프로세스
데이터분석(Data Analysis)
데이터 분석(data analysis)은 유용한 정보를 발굴하고 결론적인 내용을 알리며 의사결정을 지원하는 것을 목표로 데이터를 정리, 변환, 모델링하는 과정이다. 데이터 분석은 다방면으로 접근 방식이 있다. 다양한 이름의 다양한 기술을 아우르며, 각기 다른 비즈니스, 과학, 사회과학 분야에 사용된다. 오늘날 비즈니스 부문에서 데이터 분석은 의사 결정을 더 과학적으로 만들어 주고 비즈니스를 더 효율적으로 운영할 수 있도록 도와주는 역할을 한다.
https://ko.wikipedia.org/wiki/데이터_분석
탐색적 데이터분석(EDA)
Exploratory Data Analysis
탐색적 자료 분석(영어: Exploratory data analysis)은 존 튜키라는 미국의 저명한 통계학자가 창안한 자료 분석 방법론이다. 기존의 통계학이 정보의 추출에서 가설 검정 등에 치우쳐 자료가 가지고 있는 본연의 의미를 찾는데 어려움이 있어, 이를 보완하고자 주어진 자료만 가지고도 충분한 정보를 찾을 수 있도록 여러 가지 탐색적 자료 분석 방법을 개발하였다. 대표적인 예로 박스플롯을 들 수 있다. 탐색적 자료 분석을 통하여 자료에 대한 충분한 이해를 한 후에 모형 적합 등의 좀 더 정교한 모형을 개발할 수 있다.
https://ko.wikipedia.org/wiki/탐색적_자료_분석
데이터 시각화
정보디자인은 정보를 구성하여 효율적으로 사용할 수 있게 하는 디자인 기술 및 업무
복잡하거나 구조화되지 않은 데이터를 시각적으로
ex) 존 스노의 콜레라 지도,, 나이팅게일과 로즈다이어그램
인공지능 vs 머신러닝 vs 딥러닝