Giới Thiệu Khóa Học Làm Chủ Pentaho Cho ETL & Data Integration 2023 - PDI 9 [Mã - 7012 A]
Sử dụng Pentaho Data Integration tool cho ETL & Data warehousing. Thực hiện ETL development bằng PDI 9.0 mà không cần nền tảng coding.
Bạn sẽ học được gì?
- ✓ Hiểu biết về toàn bộ quá trình data integration bằng PDI.
- ✓ Trích xuất dữ liệu từ tất cả các nguồn dữ liệu phổ biến bao gồm Excel, JSON, Zipped file, TXT file và thậm chí cả lưu trữ đám mây.
- ✓ Làm sạch dữ liệu bằng Pentaho Data Integration.
- ✓ Áp dụng các quy tắc nghiệp vụ trên dữ liệu trong PDI.
- ✓ Các loại Data transformation khác nhau.
- ✓ Load data sang các định dạng khác nhau.
- ✓ Quản lý SQL database bằng PDI.
- ✓ Metadata Injection - một công cụ mạnh mẽ được cung cấp bởi PDI.
- ✓ Hiểu biết về các khái niệm về data marts và data warehouse.
ETL là gì?
Quy trình ETL (extract, transform, load) là phương pháp phổ biến nhất để thu thập dữ liệu từ nhiều nguồn và tải dữ liệu vào kho dữ liệu (data warehouse) tập trung. ETL là một thành phần thiết yếu của việc lưu trữ và phân tích dữ liệu.
Tại sao là Pentaho for ETL?
Pentaho có khả năng ETL, data analysis, quản lý metadata và báo cáo phi thường. Pentaho nhanh hơn các công cụ ETL khác (bao gồm cả Talend). Pentaho có GUI thân thiện với người dùng, dễ học hơn và tốn ít thời gian hơn. Pentaho là tuyệt vời cho người mới bắt đầu . Ngoài ra, Pentaho Data Integration (PDI) là một kỹ năng quan trọng trong lĩnh vực phân tích dữ liệu.
Pentaho ETL là một trong những kỹ năng được các nhà tuyển dụng săn đón nhiều nhất. Nhu cầu về kỹ thuật Pentaho Data Integration (PDI) ngày càng tăng.
Điều gì khiến chúng tôi đủ điều kiện để dạy bạn?
Khóa học được giảng dạy bởi những người hướng dẫn đã giảng dạy Data Science và Machine Learning trong hơn một thập kỷ. Chúng tôi có kinh nghiệm giảng dạy và triển khai Pentaho ETL, Pentaho Data Integration (PDI) cho mục đích data mining và data analysis.
Tải xuống các tệp Thực hành, làm Bài Quiz và hoàn thành Bài tập:
Mỗi bài giảng đều có bài thực hành đính kèm để các bạn theo dõi. Bạn cũng có thể làm bài quiz để kiểm tra hiểu biết của mình về các khái niệm về Pentaho, ETL, Pentaho Data Integration, Pentaho ETL. Mỗi phần có một bài tập thực hành để bạn thực hiện việc học của mình trên Pentaho, ETL, Pentaho Data Integration, Pentaho ETL một cách thực tế. Giải pháp cho Bài tập cũng được chia sẻ để bạn có thể xem lại hiệu suất của mình.
Đến cuối khóa học này, sự tự tin của bạn khi sử dụng Pentaho ETL và Pentaho Data Integration (PDI) sẽ tăng cao. Bạn sẽ hiểu rõ về cách sử dụng Pentaho cho các kỹ thuật ETL và Pentaho Data Integration (PDI) để học tập hoặc như một cơ hội nghề nghiệp.
Mục lục:
- ✓ 01 Giới thiệu.
- ✓ 02 Cài đặt và thiết lập Pentaho Data Integration (PDI).
- ✓ 03 Một Demo ETL đơn giản.
- ✓ 04 Các khái niệm cơ bản - Lý thuyết về kiến thức nền tảng.
- ✓ 05 ETL process: Phần thực hành bắt đầu từ đây.
- ✓ 06 DATA EXTRACTION: Trích xuất dữ liệu dạng bảng.
- ✓ 07 DATA EXTRACTION: Trích xuất dữ liệu không phải dạng bảng.
- ✓ 08 Trích xuất từ một SQL table.
- ✓ 09 Lưu trữ và truy xuất dữ liệu từ Cloud storage.
- ✓ 10 Merging Data Streams.
- ✓ 11 Data Cleansing.
- ✓ 12 Data Validation.
- ✓ 13 Error Handling.
- ✓ 14 Các bước Transformation và Analytics.
- ✓ 15 PDI SQL Connection.
- ✓ 16 Conceptual understanding for Loading Data.
- ✓ 17 Tải dữ liệu vào một Data Mart.
- ✓ 18 Chạy Java và Javascript.
- ✓ 19 PDI Jobs.
- ✓ 20 Scheduling một job for production environment.
- ✓ 21 Metadata injection.
- ✓ 22 Regex Notation.
- ✓ 23 Xin chúc mừng và về chứng chỉ của bạn.
Khóa học này dành cho ai?
- ✓ Sinh viên muốn theo đuổi sự nghiệp trong lĩnh vực Data warehouse/ETL developer.
- ✓ ETL developer và data process automation developer.
- ✓ Các nhà quản lý doanh nghiệp muốn hiểu toàn bộ quy trình ETL và có khả năng thực hiện nó.