Hadoop(HDFS)을 Docker로 구축하고, Python(Flask)을 사용하여 HDFS에 파일을 저장, 조회, 삭제하는 CRUD API를 만드는 과정
1단계: Docker로 Hadoop 설치 (docker-compose) 가장 널리 사용되는 bde2020/hadoop 이미지를 기반으로 Namenode와 Datanode만 실행하는 경량화된 구성을 사용합니다. (MapReduce/YARN은 파일 CRUD에 필수적이지 않으므로 제외했습니다.) 프로젝트 폴더를 만들고 docker-compose.yml 파일을 생성합니다. codeYaml version: “3” services: namenode: image: bde2020/hadoop-namenode:2.0.0-hadoop3.2.1-java8 container_name: namenode restart: always ports: – 9870:9870 # WebHDFS 및 UI 포트 – 9000:9000 # IPC 포트 volumes: – namenode_data:/hadoop/dfs/name environment: – CLUSTER_NAME=test – HDFS_CONF_dfs_permissions_enabled=false … 더 읽기