Lộ Trình Nghiên Cứu Khoa Học Dữ Liệu Hoàn Chỉnh
Mọi thứ bạn cần biết để bắt đầu sự nghiệp của mình trong Kỹ thuật dữ liệu.
Lộ trình Nghiên cứu Khoa học dữ liệu hoàn chỉnh dường như rất phổ biến, vì vậy tôi nghĩ sẽ là một ý tưởng hay nếu thực hiện một ấn bản. Trong bài viết này, tôi sẽ đi qua tất cả những gì bạn cần để trở thành một Data Engineer.
1. Xây dựng nền tảng của bạn
Có rất nhiều điều phức tạp khi trở thành Kỹ sư dữ liệu và đôi khi nó có thể trở nên hơi quá sức. Nhưng điều duy nhất giúp bạn bám sát lộ trình là xây dựng một nền tảng vững chắc.
Cơ sở nền tảng của bạn sẽ bao gồm việc trở nên thành thạo một hoặc hai ngôn ngữ lập trình, SQL, v.v. về máy chủ.
Python
Nếu bạn chọn Python làm ngôn ngữ lập trình của mình, đây là một số khóa học được đề xuất:
SQL
- Hoàn thành thông thạo SQL - CodeWithMosh
Các yếu tố cần thiết
2. Toán học và Thống kê
Cũng giống như bất kỳ nghề nghiệp nào khác liên quan đến việc sử dụng phân tích dữ liệu và kỹ thuật của nó - Toán học luôn cần thiết. Nó sẽ cho phép bạn hiểu rõ hơn về công việc hàng ngày của mình cũng như có thể áp dụng các kỹ năng của mình hiệu quả hơn.
Dưới đây là một số tài nguyên khác để giúp bạn:
- Thống kê cơ bản của Josh Starmer - YouTube
3. Hệ quản trị cơ sở dữ liệu
Là một Kỹ sư dữ liệu, bạn sẽ làm việc rất nhiều với hệ thống quản lý cơ sở dữ liệu - vì chúng hỗ trợ xử lý các tập dữ liệu lớn. Có rất nhiều hệ thống quản lý cơ sở dữ liệu ngoài kia, vì vậy đừng cảm thấy áp lực phải biết tất cả chúng. Điều đó phụ thuộc vào công ty bạn làm việc hoặc những gì bạn thích làm việc cùng.
- Nguyên tắc quản lý cơ sở dữ liệu - YouTube
- Giới thiệu DBMS - Bài viết/Tài liệu
Nếu bạn cũng muốn biết thêm về khóa học MIỄN PHÍ về SQL & Cơ sở dữ liệu, hãy đọc phần này: Khóa học cơ sở dữ liệu và SQL miễn phí
4. Kho dữ liệu và đường ống dữ liệu
Lĩnh vực trọng tâm này là điểm khác biệt của Kỹ sư dữ liệu với Nhà khoa học dữ liệu. Cả hai đều học các nguyên tắc cơ bản giống nhau và sử dụng cùng một ngôn ngữ lập trình, SQL, v.v. Nhưng kho dữ liệu và đường dẫn dữ liệu mới là thứ khiến Kỹ sư dữ liệu sang một bên - khiến họ trở thành Kỹ sư dữ liệu giỏi.
Tài nguyên tôi muốn giới thiệu cho Data Warehouse là:
- Bộ Công Cụ Kho Dữ Liệu - Sách PDF. Cuốn sách này được viết bởi một trong những người đã xây dựng một phần nền móng cho kho dữ liệu - Ralph Kimball.
- Hướng dẫn lưu trữ dữ liệu - Bài viết
- Giải thích về đường ống dữ liệu - YouTube
- ETL vs ELT - Bài báo
Dưới đây là một số tài nguyên để tìm hiểu về Đường ống dữ liệu:
5. Điện toán đám mây
Cuối cùng nhưng không kém phần quan trọng - Điện toán đám mây. Bạn không cần phải biết tất cả mọi thứ, nhưng bạn nên hiểu rõ về các nhà cung cấp khác nhau, khả năng, hạn chế của họ,...
Bạn sẽ cần biết kiến thức cơ bản về điện toán đám mây, chẳng hạn như IAAS, PAAS và SAAS cũng như kiến trúc của điện toán đám mây.
Dưới đây là một số tài nguyên về điện toán đám mây:
- Kỹ thuật dữ liệu đám mây - Coursera
- Khóa học về đám mây - cloudacacemy
6. Kỹ thuật phân tích
Kỹ thuật phân tích cũng rất quan trọng để tìm hiểu. Nó bao gồm:
- ETL (Trích xuất chuyển đổi và tải)
- Tạo mô hình dữ liệu (mô hình dbt)
- Thử nghiệm và tài liệu
- Triển khai lên đám mây và cục bộ
- Trực quan hóa dữ liệu bằng ứng dụng phân tích (google data studio và metabase)
- Khóa học miễn phí dbt - dbt
- Bootcamp kỹ thuật phân tích - Udemy
- Học DBT từ đầu - Udemy
Bạn có thể tìm hiểu tất cả các khái niệm này thông qua danh sách phát DataTalksClub trên YouTube.
Dưới đây là một số tài nguyên bổ sung để giúp bạn:
7. Dự án
Có vẻ như đó là rất nhiều học hỏi, đúng vậy. Đó là lý do tại sao bạn bắt buộc phải cảm thấy thành thạo trong từng lĩnh vực đó để trở thành một kỹ sư dữ liệu thành công. Bạn có thể thực hiện giai đoạn này trong quá trình học hoặc sau đó - tùy thuộc vào bạn. Một số người thích áp dụng kiến thức và kỹ năng của họ sau khi học xong, một số thích làm điều đó trong thời gian học để kiểm tra bản thân.
Vì vậy, giai đoạn tiếp theo là áp dụng mã của bạn và kiểm tra các kỹ năng của bạn. Danh sách dự án của bạn nên nhằm đạt được tất cả các lĩnh vực sau:
- Khám phá các loại Định dạng dữ liệu khác nhau
- Kho dữ liệu
- Phân tích dữ liệu
- Nguồn dữ liệu
- Công cụ dữ liệu lớn
Ý tưởng cho các dự án kỹ thuật dữ liệu
Data Engineering Zoomcamp - dự án trong thế giới thực
Cạo dữ liệu Stock và Twitter bằng Python, Kafka và Spark
Kho dữ liệu thời gian thực bông tuyết
Ngoài Kỹ thuật dữ liệu, bạn có thể thực hành kỹ năng mã hóa của mình với các thử thách LeetCode, tuy nhiên, điều này có thể được áp dụng cho phần lớn các nghề nghiệp công nghệ.
8. Chuẩn bị phỏng vấn
Khoảnh khắc mà tất cả các bạn đã chờ đợi nhưng đổ mồ hôi hột - cuộc phỏng vấn. Có rất nhiều nội dung cần ghi nhớ, vì vậy chuẩn bị cho mình là điều tốt nhất bạn có thể làm cho chính mình.
Dưới đây là một số tài nguyên để giúp bạn:
Nếu Python là ngôn ngữ lập trình bạn chọn, sẽ rất tốt nếu bạn tiếp thu Google Python Style Guide
Đừng quên các kỹ năng mềm: 73 câu hỏi để hỏi nhân viên khi phỏng vấn
Đọc thêm
Nếu bạn muốn tiếp tục học (điều mà nhiều người khuyên), đây là danh sách Những cuốn sách cần thiết để bạn trở thành Kỹ sư dữ liệu .
Nếu bạn đang tìm kiếm khóa học cơ bản về Kỹ thuật dữ liệu, tôi khuyên bạn nên tham gia khóa học này: Chuẩn bị cho Chứng chỉ Google Cloud: Chứng chỉ chuyên nghiệp của Kỹ sư dữ liệu đám mây
Hành trình trở thành kỹ sư dữ liệu của bạn sẽ không hề dễ dàng. Bạn sẽ cần phải nỗ lực, nhưng tôi hứa với bạn một khi bạn cố gắng thì sẽ được đền đáp.
Copyright Disclaimer:
This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.
Tuyên bố miễn trừ bản quyền:
Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.
Tham khảo các bài viết cùng chủ đề:
2. Những Cuốn Sách Cần Thiết Để Bạn Trở Thành Một Kỹ Sư Dữ Liệu
3. Cách trở thành nhà khoa học dữ liệu tự do thành công