전체 글(472)
-
deepLearning 딥러닝이란??
딥러닝 우리는 가끔 뉴스에서 딥러닝을 통한 바둑기계가 프로기사를 이김이라는 기사라던가 인공지능을 통해서 차량인식 훨씬 쉬워졌다. 또는 인공지능을 통한 이미지 인식이 확실시 되어졌다. 등등의 기사를 볼 수 있다. 여기서 말하는 인공지능, 머신러닝, 딥러닝이 각각이 어떻게 다른지 알고 다음으로 넘어가보자 인공지능 인공지능이란 단순히 말해서 지적인 정보를 처리하는 기계, 또는 그러한 기술입니다. 사실 더 들어 가보면 철학적인 내용과도 관련이있습니다. 구글의 개발자인 카사와 히데오씨는 이미지를 인식하는 기계도 사람과 같은 지적인 정보처리를 하고 있다고 했습니다. 지적으로 보이는 특정한 처리를 하는 기계나 기술을 인공지능이라고 정의할 수 있다고합니다. 머신러닝과 딥러닝 머신러닝과 딥러닝은 인공지능의 기능을 구현하..
2018.04.27 -
데이터 검증하기-cross-validation, grid-search
데이터 검증하기 데이터를 검정하는 것은 입력 모델들이 타당한지 검사하는 것을 의미한다. 그중에서도 cross-validation,grid-search에 대해서 설명해보겠다. cross-validation 이것을 한국어로 교차 검증이라고도 하는데 입력될 데이터를 임의로 몇개 나누어서 몇개는 훈련 데이터 몇개는 테스트 데이터로 이용하는 것을 으미한다. 예를 들어 하나의 데이터를 A,B,C로 나눈다. A와 B를 입력데이터로 쓰고 C를 테스트 데이터로 쓴다. 그리고 B,C를 입력 데이터로 쓰고 A를 테스트 데이터로 쓴다. A,C를 입력 데이터로 쓰고 B를 테스트 데이터로 써서 최종적으로 세개의 결과를 종합하여 높은 정확도를 나타낸다. import pandas as pd from sklearn import met..
2018.04.25 -
randomForest 사용해보기
randomForest 사용하기 randomForest는 레오 브라이만이 제안한 딥러닝 알고리즘입니다. 주로 회귀와 클러스터링, 분류를 구현하는데 유용합니다. 구조는 데이터들이 입력되는데 데이터들을 무작위로 샘플링하여서 여러개의 의사결정 트리들이 만들어집니다. 각 트리마다 답을 산출하는데 산출한 답을 종합하여 결과를 내놓습니다. 여러개의 트리로 답을 산출하니깐 결과의 정확도가 높습니다. randomForest의 구조 버섯 예제1 버섯예제 데이터 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier as forest from sklearn..
2018.04.25 -
machineLearning의 svm이 무엇이고 직접 그래프로 구분짓기
svm 이란?? svm이란 machineLearning의 일종의 방법으로 데이터들이 비슷한 특징들을 나타낼때 그 패턴을 컴퓨터가 쉽게 알게 하기위해 데이터 사이에 선을 긋는 것을 뜻한다. 주로 교사학습과 회귀분석 분류에 많이 쓰인다. 예시 그럼 처음부터 데이터 만드는 것 부터 시작해서 머신러닝 후 그래프 그리는 것 까지 해보겠다. 1. 데이터 얻어오기 import random def getStatus(w,h): bmi = w/(h/100)**2 if bmi legend에 쓰임 ax.scatter(b["weight"],b["height"],c=color,label =lbl) scatter("fat","red") scatter("normal","yellow") scatter("thin","purple") #..
2018.04.22 -
machine Learning을 웹에 적용시키기
machine Learning 한 것을 웹에서 사용하기 from sklearn import svm from sklearn.exeternal import joblib import json with open('파일 결과','r',encoding = 'utf-8') as fp: data = json.load(fp)[0] clf = svm.SVC() clf.fit(data['freqs'],data['labels']) joblib.dump(clf,'./lang/freq.pkl') 웹에서 사용할 파일을 만들어 줬습니다. 웹에서 이용할 코드 from sklearn.externals import joblib import cgi, os.path #위코드로 만든 파일 loc = './cgi-bin/freq.pkl' clf..
2018.04.22 -
machine Learning결과로 그래프 만들기
machine Learning결과로 그래프 만들기 이번엔 앞서 무슨나라언어 인지 판단했던 결과를 통해서 그래프를 그려 보겠습니다. import matplotlib.pyplot as plt import pandas as pd import json #그래프를 만들기 전에 2차원 배열로 만들어주기 with open ('./lang/freq.json','r',encoding = 'utf-8') as fp: freq = json.load(fp) langdic = {} for idx, label in enumerate(freq[0]['labels']): data = freq[0]['freqs'][idx] if not (label in langdic): langdic[label] = data continue for ..
2018.04.22