CDIS
Computer Sciences
Courses
CS544
s25
main

Repository

#Inside the server container
python3 client.py DbToHdfs
python3 client.py BlockLocations -f <file_path>
python3 client.py PartitionByCounty
python3 client.py CalcAvgLoan -c <county_code>
docker build . -f Dockerfile.hdfs -t p4-hdfs
docker build . -f Dockerfile.namenode -t p4-nn
docker build . -f Dockerfile.datanode -t p4-dn
docker build . -f Dockerfile.mysql -t p4-mysql
docker build . -f Dockerfile.server -t p4-server
export PROJECT=p4
mysql> show tables;
+-----------------+
| Tables_in_CS544 |
+-----------------+
| loan_types      |
| loans           |
+-----------------+
mysql> select count(*) from new_table;
+----------+
| count(*) |
+----------+
|   426716 |
+----------+
15.3 M  30.5 M  hdfs://nn:9000/hdma-wi-2021.parquet
{'7eb74ce67e75': 15, 'f7747b42d254': 6, '39750756065d': 11}
  ```
  ├── hdma-wi-2021.parquet
  ├── partitioned/
  │   ├── 55001.parquet
  │   ├── 55003.parquet
  │   └── ...
  ```
docker build . -f Dockerfile.hdfs -t p4-hdfs
docker build . -f Dockerfile.namenode -t p4-nn
docker build . -f Dockerfile.datanode -t p4-dn
docker build . -f Dockerfile.mysql -t p4-mysql
docker build . -f Dockerfile.server -t p4-server
docker compose up -d