Power BI Cheat Sheet: Hướng Dẫn Hữu Ích Cho Người Mới
Trong Power BI Cheat Sheet này, bạn sẽ được hướng dẫn tạo hình ảnh trực quan đầu tiên của mình thông qua Power BI, làm việc với Power Query, sử dụng DAX và còn nhiều hơn thế nữa.
Tạo hình ảnh trực quan đầu tiên
Tải tập dữ liệu lên Power BI
- Bên dưới tab Home, bạn hãy click vào Get Data.
- Chọn bất kỳ tập dữ liệu và double click.
- Click vào Load nếu dữ liệu trước đó bạn không cần xử lý.
- Nếu bạn cần chuyển đổi dữ liệu, click Transform để khởi chạy Power Query.
- Kiểm tra dữ liệu của bạn bằng cách click vào Data View.
Tạo mối quan hệ với Power BI
- Nếu bạn có các tập dữ liệu khác nhau mà bạn muốn kết nối. Đầu tiên, hãy tải chúng lên Power BI.
- Click vào Model View phía bên trái.
- Kết nối key columns từ các tập dữ liệu khác nhau bằng cách kéo, ví dụ: kéo EmployeeID đến SalespersonID.
Tạo hình ảnh trực quan đầu tiên của bạn
- Click vào Report View và chuyển đến Visualizations pane ở phía bên phải.
- Chọn visualization mà bạn muốn vẽ lên biểu đồ dữ liệu của mình.
- Trong Field pane ở phía bên phải, bạn hãy kéo các biến bạn chọn vào Values hoặc Axis.
Tổng hợp dữ liệu
Power BI tính tổng các fields khi bạn hiển thị chúng trong Values. Tuy nhiên, bạn có thể chọn các tổng hợp khác nhau.
- Chọn hình ảnh trực quan (Visualizations) bạn vừa tạo.
- Chuyển đến hình ảnh trực quan (Visualizations) ở phía bên phải.
- Chuyển đến Values — cột được hiển thị sẽ ở đó.
- Trên cột đã chọn — click vào dropdown arrow và thay đổi tổng hợp (tức là AVERAGE, MAX, COUNT,...).
Data Visualizations trong Power BI
Data Visualization là một trong những kỹ năng về dữ liệu được sử dụng rộng rãi với các Data Visualization Cheat Sheet phổ biến nhất.
Tham khảo các khóa học về Power BI tại đây.
Power Query Editor trong Power BI
Power Query là công cụ chuẩn bị dữ liệu và chuyển đổi dữ liệu của Microsoft. Nó được xem là một phần của Power BI Desktop và cho phép bạn kết nối với một hoặc nhiều nguồn dữ liệu. Bên cạnh đó, bạn có thể định hình và biến đổi dữ liệu để đáp ứng theo nhu cầu mà bạn cần và tải nó vào Power BI.
Mở Power Query Editor
Trong khi tải dữ liệu
- Bên dưới tab Home, click vào Get Data
- Chọn bất kỳ tập dữ liệu nào của bạn và double click
- Click vào Transform Data
Khi dữ liệu đã được tải
- Chuyển đến Data View
- Trong Queries trong tab Home của ribbon, click vào Transform Data drop-down sau đó click vào nút Transform Data.
Sử dụng Power Query Editor
Xóa hàng
- Bạn có thể xóa các hàng tùy thuộc vào vị trí và thuộc tính của chúng.
- Click vào tab Home trong Query ribbon.
- Click vào Remove Rows trong nhóm Reduce Rows.
- Chọn tùy chọn để xóa, cho dù Remove Top Rows, Remove Bottom Rows,...
- Chọn số lượng hàng để xóa.
- Lúc này, bạn có thể xóa nó khỏi Applied Steps list áp dụng ở phía bên phải.
Thêm một cột mới
- Bạn có thể tạo cột mới dựa trên dữ liệu hiện có hoặc dữ liệu mới.
- Click vào tab Add Column trong Query ribbon.
- Click vào Custom Column trong nhóm General.
- Đặt tên cho cột mới của bạn bằng cách sử dụng tùy chọn New Column Name.
- Xác định công thức cột mới trong công thức cột tùy chỉnh bằng cách sử dụng dữ liệu có sẵn.
Thay thế các giá trị
- Bạn có thể thay thế giá trị này bằng một giá trị khác nếu giá trị đó được tìm thấy trong một cột.
- Trong Power Query Editor, hãy chọn ô hoặc cột mà bạn muốn thay thế.
- Click vào cột hoặc value và click vào Replace Values trong tab Home trong nhóm Transform.
- Điền vào Value to Find và Replace With fields để hoàn thành thao tác thay thế giá trị của bạn.
Nối tập dữ liệu
- Bạn có thể nối một tập dữ liệu này vào một tập dữ liệu khác.
- Click vào Append Queries trong tab Home trong nhóm Combine
- Chọn để nối hai, ba bảng hoặc nhiều bảng hơn vào nhau.
- Add tables để nối vào phần được cung cấp trong cùng window
Merge Queries
- Bạn có thể sử dụng hợp nhất các bảng dựa trên một cột có liên quan
- Click vào Merge Queries trong tab Home trong nhóm Combine
- Chọn bảng đầu tiên và bảng thứ hai nếu bạn muốn hợp nhất chúng.
- Chọn các cột mà bạn muốn nối bằng cách nhấp vào cột từ tập dữ liệu đầu tiên và từ tập dữ liệu thứ hai.
- Chọn Join Kind phù hợp với hoạt động của bạn.
Data Profiling
- Data Profiling là một tính năng trong Power Query cung cấp thông tin trực quan cho dữ liệu của bạn.
- Click vào tab View trong Query ribbon.
- Trong tab Data Preview— đánh dấu các tùy chọn mà bạn muốn visualize.
- Tick vào Column Quality để xem lượng dữ liệu bị thiếu.
- Tick vào Column Distribution để xem sự phân phối thống kê dưới các cột.
- Tick vào Column Profile để xem thống kê tóm tắt và thông tin tần suất chi tiết hơn của các cột.
Tham khảo các khóa học về Power BI tại đây.
DAX
DAX trong Power BI (Data Analysis Expressions) cơ bản được hiểu là một tập hợp các hàm, toán tử và hằng số, sử dụng trong công thức hoặc biểu thức tính để giải quyết những bài toán từ cơ bản tới phức tạp, kết quả trả về là một hoặc nhiều giá trị từ dữ liệu có sẵn.
Simple aggregations
- SUM (<column>) thêm tất cả các số vào trong một cột
- AVERAGE (<column>) trả về giá trị trung bình (trung bình cộng) của tất cả các số trong một cột
- MEDIAN (<column>) trả về giá trị trung bình của các số trong một cột
- MIN / MAX (<column>) trả về giá trị nhỏ nhất / lớn nhất trong một cột
- COUNT (<column>) đếm số ô trong cột có chứa số
- DISTINCTCOUNT (<column>) đếm số lượng ô có giá trị trong cột chỉ định, chỉ đếm cột có giá trị khác nhau.
Logical functions
- IF (<logical_test>, <value_if_true>[, <value_if_false>]) dùng để kiểm tra kết quả của một biểu thức và tạo kết quả có điều kiện.
Text functions
- LEFT (<text>, <num_chars>) dùng để trích xuất phần bên trái của một chuỗi một hoặc nhiều ký tự.
- LOWER (<text>) chuyển đổi chữ in hoa thành chữ thường trong văn bản.
- UPPER (<text>) chuyển đổi chữ thường thành chữ in hoa trong văn bản.
- REPLACE (<old_text>, <start_num>, <num_chars>, <new_text>) cho phép thay thế một phần của chuỗi văn bản được chỉ định bằng một chuỗi văn bản khác.
Date and time functions
- CALENDAR(<start date>, <end date>) giúp tạo ra 1 bảng gồm 1 cột chứa các giá trị thời gian liên tục. Các giá trị thời gian này được giới hạn bởi 2 ngày: ngày bắt đầu và ngày kết thúc (xác định khi khai báo hàm).
- DATE(<year>, <month>, <day>) thường dùng để tạo ra các giá trị thời gian cụ thể làm điều kiện tính toán trong các hàm.
- WEEKDAY(<date>, <return_type>) giúp trả về giá trị số đại diện cho thứ trong tuần.
Nếu bạn có định hướng trở thành Data Analyst chuyên nghiệp thì bạn có thể tham khảo bộ khóa học toàn diện chuyên nghiệp tại EduMalls.
Một số bài viết liên quan:
1. Data Analyst Là Gì? Từng Bước Trở Thành Data Analyst Thành Công
2. Data Analyst - Những Kỹ Năng Quan Trọng Cho Người Mới
3. Tăng Cường Quyết Định Thông Qua Quy Trình Data Analysis 5 Bước
4. Data Analyst Interview Preparation: Các Yếu Tố Quan Trọng Cần Chuẩn Bị Trước Khi Phỏng Vấn
5. Khác Biệt Giữa Data Analytics Và Data Analysis: Định Nghĩa, Phạm Vi Và Ứng Dụng
6. Data Engineer: Khám Phá Vai Trò Và Sự Khác Biệt Giữa Data Engineer Và Data Analyst
7. Dữ Liệu Là Gì? Các Loại Dữ Liệu Và Phương Pháp Phân Tích Dữ Liệu