Loading ...
Duyệt
Sr. Data Engineer
About
Photos
Insights
CV
All Categories
Data Engineering
Explore 22 posts about data engineering
22 posts
6 years
2021
Spark on Kubernetes Performance Tuning
Apr 10
2020
Airflow 2.0 - Taskflow API
Featured
Dec 26
Tại sao nên triển khai Apache Spark trên Kubernetes
Oct 24
Scheduling Python script in Airflow
Jun 24
Spark History Server on Kubernetes
Featured
May 29
3 ways to run Spark on Kubernetes
Featured
May 24
Airflow DAG Serialization
May 01
Data Studio: Connecting BigQuery and Google Sheets to help with hefty data analysis
May 01
2019
Đánh giá hệ thống Information Retrieval (tiếp theo)
Oct 09
Sách hay (Engineering)
Sep 17
Đánh giá hệ thống Information Retrieval
Featured
Aug 31
Information Retrieval - Vector Space Model
Featured
Aug 30
Airflow - một số ghi chép
Aug 27
Cài đặt Apache Airflow với Docker Compose
Aug 26
Gửi Slack Alerts trên Airflow
Aug 20
Airflow - "context" dictionary
Aug 09
2018
[Slide] Build simple data pipeline for ETL and data aggregation on AWS
Nov 12
2016
vnTokenizer trên PySpark
Dec 14
R trên Jupyter Notebook (Ubuntu 14.04 / 14.10 / 16.04)
Nov 22
Spark: Convert Text (CSV) to Parquet để tối ưu hóa Spark SQL và HDFS
Sep 21
2015
Bigdata - Map-Reduce và bài toán Word Count
Dec 02
Nodejs - Các kỹ thuật Crawler, rút trích dữ liệu với Nodejs
Aug 08