Skip to content

最全的大数据大厂面试宝典,大数据面试题,大数据面试,王傲旗的大数据之路,大数据成神之路,Flink/Spark/Hadoop/Hbase/Hive/Impala/Hbase/MapReduce/YARN/HDFS/Kafka/Flume/Linux/Java/Scala...面试题

Notifications You must be signed in to change notification settings

wangAoqi666/bigdata-interview

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

BigData-All-Notes


最全的大数据面试文章指南

从入门到架构!

目录大纲

功能说明 主要组件 了解
数据采集 Flume、Logstash、Canal Maxwell、Databus、NIFI
数据同步 DataX、Sqoop、Kettle FlinkX
数据存储 HDFS、HBase、Kudu、MongoDB、Elasticsearch、MySql TiDB、IotDB、
数据计算 MapReduce、Hive、Spark、 Flink Pig、Storm、Tez
数据中间件 Kafka、RabbitMQ、Redis、Apache RocketMQ Alluxio、ActiveMQ、、Memcached
OLAP ClickHouse、Kylin、Druid、Presto Impala、Hawq、Greenplum、Doris
任务调度 Azkaban、Dolphinscheduler Airflow、Oozie
集群监控 Grafana、Cloudera Manager Zabbix、Ganglia、Ambari
元数据管理 Atlas
权限管理 Ranger、Apache Sentry
数据质量管理 Griffin
集群管理 k8s、docker
数据湖 Hudi、Iceberg
数据可视化、BI Echarts、Tableau、DataV Superset、QuickBI、Kibana、Metabase、Davinci

✒️ 大数据Demo代码大全

  1. JavaHttp爬虫
  2. JavaSE
  3. Hive函数、Spark算子等速查表
  4. HDFS_API
  5. MapReduce_API
  6. Hive常用API
  7. Zookeeper常用API
  8. Hbase常用API
  9. Flume常用API如拦截器
  10. Sqoop常用API
  11. Spark代码Demo
  12. Redis常用API
  13. kafka常用API
  14. 常用shell脚本
  15. Flink代码Demo

一、数据采集

Flume

  1. Flume入门及安装教程
  2. Flume的运行机制与采集系统结构
  3. Flume的多种采集方式
  4. Flume实现两个agent级联采集
  5. Flume配置高可用Flum-NG配置failover
  6. Flume的负载均衡load balancer
  7. Flume面试题

欢迎添加我的微信

image-20211206111758632

About

最全的大数据大厂面试宝典,大数据面试题,大数据面试,王傲旗的大数据之路,大数据成神之路,Flink/Spark/Hadoop/Hbase/Hive/Impala/Hbase/MapReduce/YARN/HDFS/Kafka/Flume/Linux/Java/Scala...面试题

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published