(환경 세팅) 하둡

vmware 설치

https://www.vmware.com/products/workstation-player.html

에서 무료 버전을 다운로드받아주고 설치합니다.

https://ubuntu.com/download/desktop

에서 ios 를 받아 줍니다.

VMware 처음 시작시 create 를 눌러 iso를 인스톨 해줍니다.

저는 여기서 아래와 같은 에러가 발생하였습니다.

해결 방법은 cmd를 관리자 권한으로 실행시켜준뒤 아래 명령어를 입력하고 재부팅해줍니다.

bcdedit /set hypervisorlaunchtype off

이후 정상적인 ubuntu os가 인스톨 됐습니다.

우분투 운영체제를 시작해보면 업데이트를 하시겠냐고 영어로 물어봅니다.

저는 업데이트를 실행하였습니다.

모든 명령은 hadoop 계정에서 실시합니다.
- 경로 지정을위해서 /home/hadoop 에서 source .bashrc 를 실행
포맷 해버리기
- hadoop namenode -format
Dfs daemon start
- start-dfs.sh
맵 리듀스를 돌릴러면 맵 리듀스를 실행시키는 daemon을 돌려야합니다.( standalone 모드에서는 안해도됨!)
- start-mapred.sh
확인 하는 방법
- 수행중인 java 프로세스 리스트를 확인하다.
- jps
  - 스탠드 얼론모드에서는 상위 3개만 뜹니다. ( 여러대이면 5개 다뜸)
  - SecNameNode
  - ondaryNameNode
  - DateNode
  - TaskTracker ( 여러대 )
  - JobTracker ( 여러대 )

맵리듀스 알고리즘 돌릴려면 이제 User 에디렉토리를 만들어야합니다.
- hdfs dfs -ls/ (목록 확인)
- hdfs dfs -mkdir /user ( user 디렉토리 만들기)
- hdfs dfs -mkdir /user/hadoop (user안에 hadoop 디렉토리 만들기)

우리는 src 안에 Driver.java 와 Wordcount.java 가 있다.

이를 실행하여 편집해보자.

cd /Project/src 로 들어가주자
pgd.addClass("wordcount",Wordcount.class, "A map/reduce program that perform word counting."); 이 명령어를 추가시켜준다
ant 를 실행하기위해서는 Project 로 나가서 ant를 실행해준다.
Driver.java 를 ant 해준다
hadoop jar ssafy.jar wordcount wordcount_test wordcount_test_out

hdfs dfs -ls 하둡 리스트 보기

hdfs dfs -mkdir wordcount_test

hdfs dfs -put data/wordcount-data.txt wordcount_test

cp Wordcount.java Wordcount1char.java 복사하는것

728x90