Tag Archives: 하둡

graceful 한 데이터노드 삭제

  사용하는 데이터 노드를 빼고 다른용도로 사용할 일이 생겼다. 기본적으로 하둡은 장애에 강하기 때문에 그냥 데이터 노드를 죽이고 꺼도 알라서 replication 이 일어나기 때문에 문제가 없다. 하지만 더욱 graceful 하게 처리를 하고 싶다면 아래와 같이 하면된다. 1. datanode 대상 수정 … Continue reading

Posted in Bigdata/Hadoop | Tagged , , , | Leave a comment

웹로그를 이용한 페이지 연관분석

  웹로그를 이용한 페이지 연관분석 0. 개요 웹로그의 referer 정보를 이용하여 페이지간의 연결구조를 파악하면, 레이지 링크를 따라움직이지 않고 직접 URL에 접근 또는 임시 페이지 및 취약한 페이지를 찾을수 있다 는 가설을 세우고 접근 1. 웹로그 대상 referer 가 존재하는 웹로그 … Continue reading

Posted in Bigdata/Hadoop, Javascript/Html, Python/Ruby/Perl | Tagged , , , , , | Leave a comment

BIG DATA 관련 사이트 모음_하둡/연동 Project/Nosql

  아따.. 볼게 너무 많네..ㅠㅠ 시간은 없고.. 1.Apache Hadoop Ecosystem # 저장 * HDFS: Hadoop Distributed Filesystem (http://hadoop.apache.org/hdfs/) * Fuse-DFS: Mountable HDFS (http://wiki.apache.org/hadoop/MountableHDFS/) * HBase: NoSQL (http://hbase.apache.org/) * HCatalog: 테이블 관리 (http://incubator.apache.org/hcatalog/) # 어플리케이션 서버 * Thrift: 데이터 직렬화 (http://thrift.apache.org/) … Continue reading

Posted in Bigdata/Hadoop | Tagged , , , , , , , | 1 Comment

quorum-based Journal Node으로 hadoop namenode HA 구성하기

  Hadoop 의 HA 구성 때문에 Avatar Node 를 검토하던중에, Cloudera 에서 배포된 CDH4.1에 quorum-based journal node에 대해서 알게 되었다. http://touk.pl/blog/en/2012/10/30/hadoop-ha-setup/ https://ccp.cloudera.com/display/CDH4DOC/CDH4+Installation https://ccp.cloudera.com/display/SUPPORT/CDH4+Downloadable+Tarballs https://ccp.cloudera.com/download/attachments/21438336/CDH4_High_Availability_Guide_4.1.pdf?version=3&modificationDate=1349301318000 영문으로 보기가 벅차서 누가 번역하지 않았을까 해서 찾아보니 역시!! http://charsyam.wordpress.com/2012/11/02/%EB%B0%9C-%EB%B2%88%EC%97%AD-quorum-based-journaling-in-cdh4-1/ 그리도 이미 설치해보신 분들도 있다. http://geekdani.wordpress.com/2012/12/22/hadoop-2-0-journal-node-%EC%84%A4%EC%B9%98/ … Continue reading

Posted in Bigdata/Hadoop | Tagged , , , , , | Leave a comment

hadoop-장애(Name node is in safe mode.)

  회사에 정전이 일어났다. hadoop 개발 장비가 모두 꺼졌다.. 재부팅을 하고 hadoop namenode 를 구동하니 아래와 같은 에러 발생…

Hadoop이 정상적인 종료를 하지 않았을 때, 에러가 나는 것으로 보인다. 비정상적인 종료시 hadoop 은 safe 모드로 이동하는데. 종료시 아래와 같은 … Continue reading

Posted in Bigdata/Hadoop | Tagged , , , | Leave a comment

Apache Hadoop Ecosystem 소개

Apache Hadoop Ecosystem은 HDFS를 비롯하여 여러 오픈소스 프로젝트로 구성되어 있다. 대표적인 프로젝트는 다음과 같다. <Big Data Analysis> * HDFS: Hadoop Distributed Filesystem (http://wiki.apache.org/hadoop/HDFS) <- 사용중 * Fuse-DFS: Mountable HDFS (http://wiki.apache.org/hadoop/MountableHDFS/) * HBase: NoSQL (http://hbase.apache.org/) <- 사용중 * HCatalog: 테이블 관리 … Continue reading

Posted in Bigdata/Hadoop | Tagged , , | Leave a comment

주목! 9가지 오픈소스 빅 데이터 기술

  주목! 9가지 오픈소스 빅 데이터 기술 갈수록 많은 기업들이 더 많은 데이터를 축적하며 경쟁력 향상을 꾀하고 있다. 그리고 이와 같은 빅 데이터 열풍의 중심에는 오픈소스 기술이 자리 잡고 있다. 여기 독자 여러분이 주목해야 할 아홉 개의 오픈소스 빅 데이터 … Continue reading

Posted in Bigdata/Hadoop, Scrap | Tagged , , , , , , , , , , | Leave a comment

Hadoop 설치

  1 Hadoop 설치 설치 위치 : /service/workspace (각자 환경에 맞게 구성)

2 Hadoop 설정 2.1 core-site.xml 설정

2.2 hadoop-env.sh에 JAVA_HOME 설정

2.3 hdfs-site.xml 설정

* 참고 : dfs.name.dir와 dfs.data.dir 는 서버를 구동하기 전에 미리 생성해야함(자동으로 … Continue reading

Posted in Bigdata/Hadoop | Tagged , | Leave a comment