Học máy cho Khoa học Dữ liệu
Học máy cho Khoa học Dữ liệu
Xin chào các bạn!
Môn học thứ 3 của chương trình Data Science đi sâu vào các phần kiến thức cơ bản của học máy và ứng dụng của nó trong các lĩnh vực khác nhau như chăm sóc sức khỏe, ngân hàng, viễn thông, v.v. Thông qua khóa học, bạn sẽ tìm hiểu về các kỹ thuật học máy hiệu quả nhất, cách sử dụng và tinh chỉnh các mô hình học máy cho bài toán cụ thể mà bạn cần giải quyết. Quan trọng hơn, bạn sẽ không chỉ nắm được lý thuyết nền tảng mà còn có cơ hội thực hành các kỹ năng thực tế cần thiết để có thể áp dụng nhanh chóng và hiệu quả các kỹ thuật này vào các vấn đề mới.
Chúc các bạn học tốt!
MỤC TIÊU MÔN HỌC
Sau khi học xong môn này, học viên sẽ đạt được các chuẩn kiến thức, kỹ năng đầu ra như sau:
- Có cái nhìn tổng quan về các định nghĩa và các chủ đề khác nhau trong Machine Learning: học có giám sát, học không giám sát.
- Có cái nhìn tổng quan và kiến thức cơ bản về Hồi quy, Phân loại, Phân cụm và Hệ thống Đề xuất, ARIMA, sau đó áp dụng được các loại thuật toán ở trên vào giải quyết các bài toán thực tế.
- Thao tác thành thạo các thư viện điển hình và cơ bản trong học máy với Python: Numpy, sklearn, pandas, matplotlib.
- Hiểu các phương pháp đánh giá và số liệu trong các vấn đề và bài toán khác nhau của học máy.
- Có thể áp dụng Ensemble Learning (Học máy kết hợp) trong việc tăng độ chính xác của mô hình.
TRẢI NGHIỆM HỌC TẬP
Để bắt đầu, các bạn nên dành một vài phút khám phá môn học và cấu trúc chung. Môn học sẽ có 6 phần với 13 bài học. Xuyên suốt các bài học và cuối mỗi học phần, các bài thực hành Lab và bài tập lớn (Project) sẽ giúp các bạn tăng cường việc ghi nhớ và vận dung lý thuyết đã học vào các bài toán thực tế. Để việc học tập được hiệu quả, hãy luôn trau dồi kiến thức, không ngừng học hỏi, nghiên cứu và lập cho mình một kế hoạch học tập hợp lý để hoàn thành khóa học một cách xuất sắc.
Trong thời gian học (dự kiến là 6 tuần), việc phân bổ tuần học là rất quan trọng. Nếu các bạn có bất cứ câu hỏi nào hãy kết nối với Mentor để được giải đáp.
CẤU TRÚC MÔN HỌC
Phần 1: Học máy là gì?
- Bài 1: Giới thiệu về Machine Learning
Phần 2: Hồi quy
- Bài 2: Hồi quy tuyến tính
- Lab 1: Hồi quy tuyến tính cơ bản
- Bài 3: Hồi quy nâng cao
- Lab 2: Hồi quy nâng cao
Project 1 - Dự đoán số người trúng tuyển American College
Phần 3: Phân loại
- Bài 4: Tổng quan về phân loại
- Lab 3: KNN
- Bài 5: Hồi quy logistic
- Lab 4: Liệu khách hàng có quay lưng với chúng ta?
- Bài 6: Cây quyết định
- Lab 5: Phân loại nấm Bắc Mỹ sử dụng DT
- Bài 7: Support Vector Machine
- Lab 6: Dự đoán bệnh nhân mắc Parkinson với SVM
Project 2 - Dự đoán khả năng mắc bệnh tiểu đường loại 2 tại Arizona
Phần 4: Phân cụm
- Bài 8: Phân cụm k-Means
- Lab 7: Sử dụng k-Means để phân tập khách hàng
- Bài 9: Phân cụm phân cấp
- Lab 8: Agglomerative clustering
- Bài 10: DBSCAN
- Lab 9: Quan sát kết quả phân cụm với DBSCAN
Project 3 - Phân cụm hành vi di chuyển dựa theo dữ liệu điện thoại
Phần 5: Hệ thống Đề xuất
- Bài 11: Hệ thống khuyến nghị dựa trên nội dung
- Lab 10: Xây dựng RS đề xuất các mặt hàng cho người dùng dựa theo nội dung mặt hàng
- Bài 12: Lọc cộng tác
- Lab 11: Xây dựng RS đề xuất các mặt hàng cho người dùng dựa theo lọc cộng tác
Phần 6: Dự báo chuỗi thời gian
- Bài 13: ARIMA
CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN MÔN HỌC
THIẾT KẾ MÔN HỌC: Th.S Nguyễn Hải Nam
- Trình độ chuyên môn: Thạc sĩ Khoa học Máy tính, Đại học Cassino, Ý
- Nghề nghiệp: Chuyên viên tư vấn AI
- Lĩnh vực nghiên cứu: Deep learning, Computer Vision, Handwritting OCR, Abnormal detection
- Online profile: https://www.linkedin.com/in/hai-nam-nguyen-474587119/
THIẾT KẾ MÔN HỌC: Th.S Vũ Thương Huyền
- Trình độ chuyên môn: Thạc sĩ Kỹ thuật phần mềm, Đại học Công nghệ, Đại học Quốc gia Hà Nội
- Nghề nghiệp: Senior Data Scientist
- Nơi công tác: FPT Software - FPT
- Lĩnh vực nghiên cứu: Machine learning, Deep learning, Reinforcement Learning, Natural Language Processing
- Online profile: https://www.linkedin.com/in/thuong-huyen-3969747a/
PHẢN BIỆN MÔN HỌC: T.S Đặng Hoàng Vũ
- Trình độ chuyên môn: Tiến sĩ Toán học, Đại học Cambridge
- Nghề nghiệp: Giám đốc khoa học FPT
- Nơi công tác: FPT Software - FPT
- Công việc hiện tại: Chịu trách nhiệm chính trong lĩnh vực phân tích của Platform quản lý dữ liệu và nghiên cứu khoa học dữ liệu của FPT
CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN KHUNG CHƯƠNG TRÌNH DS
T.S Từ Minh Phương
- Trưởng khoa CNTT, Đại học Bưu chính viễn thông (PTIT)
- Chuyên gia tư vấn công nghệ AI & machine learning
- Trưởng phòng Lab Học máy & Ứng dụng của PTIT
T.S Nguyễn Văn Vinh
- Giảng viên & thành viên cốt lõi của Phòng thí nghiệm AI, Đại học Công nghệ - VNU
- Chuyên gia tư vấn AI cho DPS, Fsoft
- Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
- Cử nhân CNTT, Đại học Công nghệ, VNU
T.S Trần Thế Trung
- Viện trưởng Viện nghiên cứu công nghệ FPT, Đại học FPT
- Thạc sĩ Vật lý thiên văn, Đại học Pierre & Marie Curie
- Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
- Cử nhân Vật lý lý thuyết và Toán học, Đại học Melbourne
NGUỒN HỌC LIỆU
Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.
Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nhiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.
Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: Coursera, tutorialspoint, edX Training, or Udemy.
KÊNH PHẢN HỒI
FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email program@funix.edu.vn