Nền Tảng Khoa Học Dữ Liệu
Đã hoàn thành
Nội dung đào tạo
Ngày 1: NHẬN THỨC VỀ DỮ LIỆU & DỮ LIỆU SẠCH
Học Phần 1 : Tư duy dữ liệu trong kỷ nguyên số
- Dữ liệu là tài sản quan trọng như thế nào đối với tổ chức & cá nhân
- Tác động của dữ liệu trong vận hành, quyết định, tối ưu hóa.
Học phần 2: Phát triển Tư duy dữ liệu (Data Mindset)
- Khái niệm về tư duy dữ liệu
- Đặt câu hỏi dựa trên dữ liệu (Asking the Right Questions)
- Hiểu ngữ cảnh và nguồn dữ liệu
- Tư duy phản biện với dữ liệu
- Kể chuyện bằng dữ liệu (Data Storytelling).
Học phần 3: Thế nào là dữ liệu sạch và sẵn sàng phân tích
- Định nghĩa “clean data”, “tidy data”, “missing data”, “inconsistent”, “outliner” và “data readiness”
- Nhận diện các vấn đề hiện nay tại Doanh Nghiệp: dữ liệu phân tán, không sạch, thiếu kết nối
- 5 tiêu chí dữ liệu sạch: đúng, đầy đủ, kịp thời, nhất quán, có thể truy xuất.
Học phần 4: Công cụ & phương pháp chuẩn hóa dữ liệu hiện nay
- Excel nâng cao, Microsoft Copilot cho thao tác nhanh với dữ liệu
- Giới thiệu về Python Pandas
- So sánh hiệu quả: thủ công – tự động – dùng AI.
Ngày 2: QUY TRÌNH KHAI THÁC DỮ LIỆU – CRISP-DM
(CROSS-INDUSTRY STANDARD PROCESS FOR DATA MINING)
Học Phần 1: Giới thiệu 6 giai đoạn của CRISP-DM
- Hiểu biết về Doanh nghiệp/Bối cảnh - Business Understanding
- Hiểu về Dữ Liệu - Data Understanding
- Chuẩn Bị Dữ Liệu - Data Preparation
- Mô Hình Dữ Liệu - Data Modeling
- Đánh giá Dự án – Evaluation
- Triển Khai – Deployment
Học phần 2: Các hoạt động và thực hành
- Bài tập thực hành. Đánh giá học phần & Ứng dụng + Sử dụng Microsoft Excel (dành cho các bài tập
thực hành cơ bản) và Công cụ Copilot
- Thảo luận nhóm: phân tích các tình huống thực tế của Doanh Nghiệp.
Học phần 3: Công cụ phân tích và thực hành tổng hợp trên lớp cụ thể bằng casestudy của Doanh Nghiệp
- Sử dụng Excel với Data Analysis Toolpak.
- Thực hành truy xuất và phân tích dữ liệu bằng Copilot.
- Giới thiệu Python và môi trường làm việc (Jupyter Notebook).
- So sánh kết quả phân tích giữa Excel, Copilot và Python.
- Bonus: Viết prompt GenAI để tạo dashboard và báo cáo tự động.