티스토리 뷰

인공지능

데이터셋을 구하기 좋은 장소

Bennett Kim 2018. 5. 19. 18:51

안녕하세요? 오늘은 머신러닝을 공부하고 연구하는데 있어 중요한 자원인 데이터셋을 구할 수 있는 유용한 사이트 중 몇 가지를 소개하고자 합니다.


1. 캐글(kaggle)

: 너무나 유명하죠. 캐글은 2010년에 설립되었고 예측 모델 및 분석 대회를 위한 플랫폼입니다. 2017년부터 구글의 자회사로 들어갔는데요. 수많은 데이터 과학자나 분석가들이 best한 모델을 생산해내기 위해 경쟁하는 곳입니다. 이곳에서 수많은 유용한 데이터셋을 구할 수 있습니다.

링크: https://www.kaggle.com/


2. 아마존 AWS 데이터셋(Amazon AWS datasets)

: Amazon web service는 클라우드를 전문으로 하는 회사입니다. 현재 클라우드 업계에서는 독보적이며 지속적으로 발전하고 있는 회사입니다. 아마존에서는 GPU Computing을 할 수 있는 클라우드 서비스를 제공함과 동시에 데이터셋도 제공하고 있습니다.

링크: https://registry.opendata.aws/


3. UC 얼바인 머신러닝 저장소(UC irvine machine learning repository)

: University of California, Irvine은 이름 그대로 irvine에 위치한 캘리포니아 대학교로써 이곳에서는 머신러닝을 위한 다양한 데이터셋을 제공합니다.

링크: https://archive.ics.uci.edu/ml/datasets.html


이 밖에도 데이터셋을 구할 수 있는 유용한 사이트들이 있으면 추가적으로 소개하겠습니다. 

감사합니다. 



댓글