분류 전체보기 (180) 썸네일형 리스트형 나이브베이즈 ■ 나이브베이즈 분류 1. 확률에 대한 기본적인 이해 2. 나이브 베이즈 알고리즘 3. 나이브 베이즈 실습 -독버섯과 정상버섯의 분류 -영화 장르 선호도 분류 -스팸메일과 햄메일의 분류(책 실습)---> text mining 실습 관측이 특정 범주에 속할 가능성을 평가하는 확률 기반의 분류 방법 나이브베이즈 Naive bayes 예:비가 올 확률 70% 라는 것은 해당 지역의 어딘가에서 비슷한 조건을 갖는 과거 10개 경우 중 7개에서 강수가 발생했다는 것을 의미한다. 장점 단점 간단하고 빠르고 매우 효율적이다 모든 특징이 동등하게 중요하고 독립이라는 가정이 잘못된 경우가 자주 있다. 잡음과 누락 데이터를 잘 처리한다 수치 특징이 많은 데이터셋에는 이상적이지 않다. 훈련에는 상대적으로 적은 예시가 필요하.. knn ■ KNN ■ knn 알고리즘은 무엇인가? 책134p "K nearest neighbor 의 약자로 머신러닝의 지도학습에 분류에 해당하는 알고리즘이다" 새로 들어온 데이터가 기존 데이터의 그룹 중 어느 그룹에 속하는지를 찾을 때 거리가 가까운 데이터의 그룹을 자기 그룹으로 선택하는 아주 간단한 알고리즘이다" k가 1이면 1번째로 가까운 이웃데이터를, K가 3이면 3번째로 가까운 이웃데이터를 선택한다. K의 개수는 의사결정을 해야하기 때문에 항상 홀수를 선택해야 함. 사례 인식 정지 영상 및 동영상에서 광학 글자 인식과 얼굴 인식을 포함하는 컴퓨터 비젼 응용 선호도 영화나 음악 추천에 대한 개인별 선호 예측 패턴 특정 단백질 및 질병 발견에 사용 가능한 유전자 데이터의 패턴 인식 "KNN 은 최근접 인적방.. loop문 ■ R에서의 loop 문 문법예제: for(루프변수 in 리스트) { 반복할 문장 } 예제: aaa aaa(3) [1] 1 [1] 2 [1] 3 문제182. 아래의 파이썬 코드를 R코드로 변환하시오 import csv file = open("d:\\emp2.csv",'r') emp_csv = csv.reader(file) a = [] for emp_list in emp_csv: a.append(emp_list[5]) print(a) [5000, 2850, 2450, 2975, 1250, 1600, 1500, ...] ↓ x if문 ■ R에서의 if문 if 문 예제: if(조건식){ 조건식이 true 일 때 실행되는 식 } else if (조건식){ 조건식이 true 일 때 실행되는 식 } else { 위에 조건들에 만족하짛 않는 경우 실행되는 식 } 문제185. N과 거리가 가까운 과일을 3개를 출력하시오 fruits R을 활용한 머신러닝 이란? ■ R을 활용한 머신러닝 통계학개론----->머신러닝 ■ 머신러닝 책 수업 목차책: R을 활용한 머신러닝 2/e 저자: 브레트 란츠 출판사: 에이콘 1. 머신러닝이 무엇인지?(1장) 2. 머신러닝을 배우기 위해 기본적으로 알아야 하는 내용(2장) 데이터의 종류 데이터 수치 요약 3. 지도학습 분류: knn------------------------산포도 그래프 의사결정트리----------엔트로피 개념 서포트 백터머신----오즈비율->시그모이드 함수->로지스틱회귀 나이브베이즈----------확률(3장. 확률과 변수) 신경망-------------------딥러닝 회귀: 선형회귀---------------상관계수, 결정계수(5장. 통계적 추정) 4. 비지도 학습 : k-means-----산포도 그래프 +.. 샤이니에 데이터 테이블 표시하는 방법 ■ *기본 테이블 형태의 데이터 출력하는 샤이니 기본 코드 install.packages("DT") #한번했으면 주석으로 막기 library(DT) library(shiny) library(ggplot2) #emp 그래프(사분위수, 지도그래프, 워드클라우드) ■ 사분위수 그래프 *사분위수 그래프로 분석해야 하는 데이터 1. 데이터의 퍼짐정도가 매우 큰 경우 2. 이상치 있는 경우 3. 평균 하나로는 통계를 대표할 수 없다. 중앙값, 최빈값, 최대값, 최소값, 평균값 4. 사분위수 그래프를 가로로 눕혀놓고 보면 정규분포 모양을 확인할 수 있다. 예제 install.packages("lattice") library(lattice) > bwplot(emp$sal) > summary(emp$sal) Min. 1st Qu. Median Mean 3rd Qu. Max. 800 1250 1600 2148 2988 5000 ↑ ↑ ↑ ↑ ↑ ↑ 최소값 1번째 중앙값 평균값 3번째 사분위수 사분위수 (Q2) (Q3) 최대값 그림에서 맨왼쪽 점선이 최소값 점은 중앙값 맨 오른.. 그래프(산포도, 구글 그래프) ■ 산포도 그래프와 상관관계 "산포도 그래프를 데이터간의 상관 관계를 나타낼 때 유용하다" 예제: 나이와 소득간의 상관관계가 있는지 데이터를 시각화 하시오 age_income 이전 1 ··· 16 17 18 19 20 21 22 23 다음