Machine Learning: Regression
Kỹ thuật Hồi quy trong Học máy
Xin chào các bạn!
Hồi quy (regression) là một phần lớn của bài toán Machine Learning liên quan đến việc dự đoán một giá trị số bằng cách sử dụng các biến đã biết mà không cần phải tìm ra mối quan hệ giữa các biến đó.
Môn học thứ hai này của Chương trình Machine Learning nhằm mục đích cung cấp cho người học các chủ đề thú vị về Machine Learning xoay quanh bài toán hồi quy bao gồm các khái niệm, giải pháp của bài toán, lý luận trực quan về các giải pháp đó, cũng như ưu nhược điểm của chúng. Đặc biệt, khóa học này không chỉ cung cấp cho bạn những kỹ thuật để thu được kết quả tốt nhất của một bài toán cụ thể, mà còn đem lại những kiến thức & kỹ thuật hữu ích, phục vụ cho mục đích theo đuổi lĩnh vực Machine Learning của bạn. Bên cạnh kinh nghiệm chuyên sâu về việc xử lý các bài toán Hồi quy, bạn sẽ học cách giữ vững hiệu suất thông qua các chỉ số, sự cân bằng giữa độ lệch và phương sai, cách áp dụng các hình phạt khác nhau để hoàn thành các nhiệm vụ khác nhau, tối ưu hóa mô hình bằng cách sử dụng các giải pháp dạng đóng và suy giảm độ dốc, và cách trình bày kết quả của bạn bằng những hình ảnh mang tính thẩm mỹ.
Chúc các bạn học tốt!
MỤC TIÊU MÔN HỌC
Sau khi học xong môn này, học viên sẽ đạt được các chuẩn kiến thức, kỹ năng đầu ra như sau:
- Hiểu các vấn đề về Hồi quy (tuyến tính và đa biến) trong học máy.
- Hiểu các chỉ số đánh giá mô hình, lý do và cách chúng được sử dụng để đánh giá mô hình.
- Hiểu Overfit là gì, tại sao nó xảy ra và tác động của nó đến chất lượng mô hình.
- Hiểu và thực hành Hồi quy Ridge và hồi quy Lasso để giải quyết Overfit.
- Hiểu và thực hành K-Nearest Neighbor và Hồi quy Kernel.
TRẢI NGHIỆM HỌC TẬP
Để bắt đầu, các bạn nên dành một vài phút khám phá môn học và cấu trúc chung. Môn học sẽ có 4 phần với 15 bài học. Xuyên suốt các bài học và cuối mỗi học phần, các bài thực hành Lab và bài tập lớn (Project) sẽ giúp các bạn tăng cường việc ghi nhớ và vận dung lý thuyết đã học vào các bài toán thực tế. Để việc học tập được hiệu quả, hãy luôn trau dồi kiến thức, không ngừng học hỏi, nghiên cứu và lập cho mình một kế hoạch học tập hợp lý để hoàn thành khóa học một cách xuất sắc.
Trong thời gian học (dự kiến là 6 tuần), việc phân bổ tuần học là rất quan trọng. Nếu các bạn có bất cứ câu hỏi nào hãy kết nối với Mentor để được giải đáp.
CẤU TRÚC MÔN HỌC
Phần 1: Tổng quan về Hồi quy
- Bài 1: Hiểu các bài toán Hồi quy
Phần 2: Thuật toán Hồi quy
- Bài 2: Các nguyên tắc cơ bản về Hồi quy
- Bài 3: Mục tiêu tối ưu hóa
- Bài 4: Kiểm thử Mô hình Hồi quy tuyến tính
- Lab 1: Xây dựng mô hình hồi quy tuyến tính đơn biến
- Bài 5: Thuật toán Hồi quy đa biến
- Bài 6: Triển khai Hồi quy đa biến
- Lab 2: Xây dựng mô hình hồi quy tuyến tính đa biến
- Bài 7: Chỉ số đánh giá hiệu suất
- Bài 8: Lỗi, Độ lệch và Phương sai
- Lab 3: Phân tích sự đánh đổi giữa precision và recall
Project 1 - Xây dựng mô hình hồi quy tuyến tính cho bài toán dự báo thời tiết
Phần 3: Tinh chỉnh Hồi quy
- Bài 9: Bài toán Overfit
- Bài 10: Sử dụng Hồi quy Ridge
- Lab 4: Xây dựng mô hình hồi quy đa thức với L2 pelnaty
- Bài 11: Sử dụng Hồi quy LASSO
- Bài 12: Triển khai LASSO
- Lab 5: Sử dụng Lasso để lựa chọn features
- Bài 13: Nearest Neighbor và Kernel
- Lab 6: Bài toán hồi quy với thuật toán k-nn
- Bài 14: Đánh giá tổng kết
Project 2 - Dự đoán Số lượng Bình luận Facebook
Phần 4: Dự đoán Chuỗi Thời gian
- Bài 15: ARIMA
CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN MÔN HỌC
THIẾT KẾ MÔN HỌC: TS. Nguyễn Văn Vinh
- Giảng viên & thành viên cốt lõi của Phòng thí nghiệm AI, Đại học Công nghệ - VNU
- Chuyên gia tư vấn AI cho DPS & Fsoft
- Tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
PHẢN BIỆN MÔN HỌC: TS. Trần Tuấn Anh
- Giảng viên Đại học Khoa học Tự nhiên - ĐHQG-HCM
- Tiến sĩ Khoa học Máy tính, Đại học Quốc gia Chonnam, Hàn Quốc
- Thạc sĩ Toán học ứng dụng về AI & Machine Learning, Đại học Orleans, Pháp
CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN KHUNG CHƯƠNG TRÌNH
TS. Từ Minh Phương
- Trưởng khoa CNTT, Đại học Bưu chính viễn thông (PTIT)
- Chuyên gia tư vấn công nghệ AI & Machine learning
- Trưởng phòng Lab Học máy & Ứng dụng của PTIT
TS. Hoàng Anh Minh
- Quản lý R&D, Chief Scientist FPT Software, LA Office
TS. Lê Hải Sơn
- Chuyên gia về Machine Learning, FPT Technology Innovation (FTI)
- Tiến sĩ khoa học máy tính, Laboratoire d’Informatique et de Mécanique pour les Sciences de l’Ingénieur (LIMSI), Université Paris-Sud, Orsay, Pháp
- Các lĩnh vực nghiên cứu: Xử lý ngôn ngữ tự nhiên, nhận dạng tiếng nói, xử lý ảnh, học máy, học sâu
NGUỒN HỌC LIỆU
Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.
Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nghiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.
Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: Coursera, tutorialspoint, edX Training, or Udemy.
KÊNH PHẢN HỒI
FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email program@funix.edu.vn