본문 바로가기

반응형

분류 전체보기

(180)
R 설치 및 R studio, R shiny 설치 ■R Gui 다운로드 파일- 작업디렉토리 변경 - (emp 담겨있는 폴더를 선택)또는 setwd 명령어 사용 지정 csv를 지정변수명으로 설정하기 > emp pie(emp$sal, col=rainbow(14)) # 그래프 나오는 명령어 새스크립트 열어서 명령어만 쓰면 (실행: 컨트롤 R) 다른 콘솔창에 결과가 나온다 ※ R실행할 때 관리자 권한으로 실행해야 한다. 그래야 패키지 설치할때 에러 안뜬다. ■ Rstudio 실행 ※ 아나콘다 네비게이터를 통해서 설치하면 한글오류가 나타난다. 구글에서 다운로드해서 설치하기를 권장. 컨트롤 1 (새창키기) setwd("d:\\data") # 사용폴더 지정시키기. 실행은 컨트롤 엔터 emp
R을 왜 배워야 하는지? ■ R은 무엇인가? 뉴질랜드의 aukland 대학의 robert gentlman 과 Ross ihaka 가 1955년에 개발한 소프트웨어이고 데이터 분석을 위한 통계 및 그래픽스를 지원하는 무료 소프트웨어이다. ■ R을 왜 사용해야 하는가? 1. R is free 2. data 분석을 위해서 가장 많이 쓰는 통계 플랫폼 3. 복잡한 데이터를 다양한 그래프로 표현할 수 있다. 4. 분석을 위한 데이터를 쉽게 저장하고 조작할 수 있다. 5. 누구든지 유용한 패키지를 생성해서 공유할 수 있고 새로운 기능에 대한 전달이 빠르다. 6. 어떠한 OS 에서도 설치가 가능하다. 심지어 아이폰에서도 설치 가능.
10. 맵리듀스를 java 로 수행하기 ■10. 멥리듀스를 jave 로 수행하기 1. hadoop 홈디렉토리에 자바 실행 파일인 jar 파일의 위치가 어디인지 설정하는 환경설정을 한다. 2. 하둡 홈디렉토리 밑에 labs 라는 디렉토리를 만들고 거기에 SingleFileWriteRead.java 파일을 생성한다. ↓ "텍스트 파일 한개를 하둡 파일 시스템에 올리는 자바 코드" 3. 두 개의 텍스트 파일을 하나로 합쳐서 하둡 파일 시스템에 올리기 위해 PutMerge.java 라는 파일을 생성한다 4. 자바로 WordCount 를 수행한다 ↓ 겨울왕국 대본의 단어와 단어의 갯수를 출력한다 SQL------> regexpress_count 함수로 수행 파이썬-> count, len 리눅스-> wc 하둡---> java 코드로 수행 R-------..
9. sqoop 설치 , sqoop 으로 오라클, hive 연동 ■9. sqoop 으로 오라클과 hive 연동 ■ sqoop 설치 스쿱? "오라클과 hive와의 데이터 연동" 오라클의 emp 테이블을 hive 로 바로 로드 할 수 있다. 오라클 -----------------------------------> hive emp * 스쿱 설치 과정 1. 스쿱설치 파일을 올린다. sqoop-1.4.6.bin__hadoop-1.0.0.tar.gz 2. 스쿱설치 파일의 압축을 푼다. # cd /media/sf_Share # cp sqoop-1.4.6.bin__hadoop-1.0.0.tar.gz /home/oracle/ # chown -R oracle:oinstall sqoop-1.4.6.bin__hadoop-1.0.0.tar.gz # su - oracle $ tar xvzf ..
8. mySQL 설치, 설명 ■8. mySQL -> centos 에서 수행 ip 102 root oracle880401 https://www.digitalocean.com/community/tutorials/how-to-install-mysql-on-centos-7 이거보면서 mySQL 설치 root 계정 접속한 사람은 sudo 빼고 코드 복붙 임시비번 : =E5;VTrYWPh( 새비번: 쓰더 mysql -u root -p (접속하는 거 ! ) 접속 안된 사람, 접속 성공한 사람들도 https://dev.mysql.com/downloads/file/?id=480542 링크 타고 들어가서 Windows (x86, 64 비트), MSI 설치 프로그램 저장해두시오 mysql> status -------------- mysql Ver 14..
7. mongo db 설치, 설명 ■ 7. mongo db ->우분투 os 에서 수행 리눅스설치파일->우분투페도라->ios파일 우분투를 저장소로 지정 ip addr 터미널창 키면 3번째 단락에 아이피주소 뜨는데 기억해둘 것 new terminal sudo apt-get install ssh password: oracle Y ip addr inet 주소 입력 (brd 빼고) putty 키고 위 아이피주소 입력하고 접속 (102 였음) ■ Mongo DB 설치 (우분투 os) 1.설치 참고 블로그 https://www.digitalocean.com/community/tutorials/how-to-install-mongodb-on-ubuntu-16-04 2. 우분투 다운로드 사이트 https://www.mongodb.com/download-c..
6. PIG설치, 설명 ■6. pig 1. 야후에서 만든 Nosql (야후에서는 40% 이상의 JOB을 pig 로 처리한다) 2. "돼지들은 어떠한 것도 잘 먹는다" 라는 슬로건을 갖는다. 어떠한 데이터든 잘 소화할 수 있다. 3. 사용자 정의함수 (오라클의 프로시져와 같은 언어)를 지원한다 (SQL + 프로그래밍 언어) ↓ 엑셀의 매크로와 같은 기능 ■ pig 설치 1. pig 설치 파일을 /home/oracle/ 밑에 올린다. pig-0.12.0.tar.gz 2. pig 설치 파일의 압축을 푼다 $ tar xvf pig-0.12.0.tar.gz 3. pig 환경설정을 한다. $ mv pig-0.12.0 pig #(압축푼거 저장) $cd pig $cd conf $vi pig.properties 아래 두 줄을 맨 하단에 저장 ..
5. TAJO설치, 설명 ■ 5. 타조 ■ Tajo 설치 방법 ■/media/sf_Share 받은파일 저장하고 root 에서 oracle 로 복사시키고 오라클에 들어가서 권한 바꾸고 oracle:oinstall 거기서 압축해제 압축 해제 tar -xvzf tajo-0.11.1.tar.gz ■ tajo 디렉토리가 생겼는지 확인한다. $ ls -ld tajo* tajo 홈디렉토리의 이름을 tajo 로 변경한다. $ mv tajo-0.11.1-desktop-r1 tajo 아래와 같이 따란↓ drwxr-xr-x 10 oracle oinstall 4096 Mar 2 2016 tajo cd tajo ls -l (그럼 tajo 또 있음) cd tajo ls -ld bin (그렇게 bin 있는 걸 확인) [orcl:tajo]$ sh bin/c..

반응형