안녕하세요? 오늘은 머신러닝에 들어가기 앞서 머신러닝의 큰 그림을 잡는데 사용 될 기본 프로세스에 대해 설명하겠습니다. 머신러닝은 크게 4가지 단계로 프로세스가 구성됩니다. 1. 사용할 데이터를 분석합니다.: 제가 생각하기에 데이터는 머신러닝에 있어서 큰 역할을 차지합니다. 좋은 데이터가 많으면 많을수록 모델의 알고리즘에 문제가 없다면 같은 모델이라도 성능에서 월등히 차이가 나기 때문입니다. 그렇지만 데이터를 모으고 정제하는 작업은 비용과 시간이 많이 드는 작업입니다. (그 이유로 많은 Open source로 공개된 모델을 보시면 거의 대부분 학습에 사용된 데이터는 제공하지 않습니다.) 2. 적합한 모델을 선택합니다.: 적합하다는 것은 인풋과 아웃풋에 따라 결정됩니다. 이런 상황이 주어졌다고 가정합니다...
안녕하세요? 오늘은 머신러닝을 공부하고 연구하는데 있어 중요한 자원인 데이터셋을 구할 수 있는 유용한 사이트 중 몇 가지를 소개하고자 합니다. 1. 캐글(kaggle): 너무나 유명하죠. 캐글은 2010년에 설립되었고 예측 모델 및 분석 대회를 위한 플랫폼입니다. 2017년부터 구글의 자회사로 들어갔는데요. 수많은 데이터 과학자나 분석가들이 best한 모델을 생산해내기 위해 경쟁하는 곳입니다. 이곳에서 수많은 유용한 데이터셋을 구할 수 있습니다.링크: https://www.kaggle.com/ 2. 아마존 AWS 데이터셋(Amazon AWS datasets): Amazon web service는 클라우드를 전문으로 하는 회사입니다. 현재 클라우드 업계에서는 독보적이며 지속적으로 발전하고 있는 회사입니다...
안녕하세요? 오늘은 백준 알고리즘 사이트 문제 중 하나인 10448번 유레카 이론을 풀어보겠습니다. 먼저 문제를 보겠습니다. 삼각수(triangle number)는 문제에서 보여지듯이 입니다. 그리고 가우스는 최대 3개 삼각수의 합으로 모든 자연수를 표현할 수 있다고 증명하였습니다. 그리고 이 이론은 유레카 이론으로 알려져왔다고 합니다. 문제는 어떠한 수가 주어졌을 때, 이 수가 3개의 삼각수로 표현이 가능한지 알아보고 표현이 가능하면 1, 가능하지 않다면 0을 출력하는 것입니다. 제가 접근한 방식은 문제에서 주어지는 입력 K는 3에서 1000사이의 값이기 때문에 1000 이상의 값은 무의미 하다는 것입니다. 즉, 전 1에서부터 1000사이의 삼각수를 구하면 되고 그 수들을 가지고 가능한 케이스를 검사하..
- Total
- Today
- Yesterday