Học máy: Kỹ thuật Hồi quy
Học máy: Kỹ thuật Hồi quy
Xin chào các bạn!
Hồi quy (regression) là một phần lớn của bài toán Machine Learning liên quan đến việc dự đoán một giá trị số bằng cách sử dụng các biến đã biết mà không cần phải tìm ra mối quan hệ giữa các biến đó.
Môn học thứ hai này của Chương trình Machine Learning nhằm mục đích cung cấp cho người học các chủ đề thú vị về Machine Learning xoay quanh bài toán hồi quy bao gồm các khái niệm, giải pháp của bài toán, lý luận trực quan về các giải pháp đó, cũng như ưu nhược điểm của chúng. Đặc biệt, khóa học này không chỉ cung cấp cho bạn những kỹ thuật để thu được kết quả tốt nhất của một bài toán cụ thể, mà còn đem lại những kiến thức & kỹ thuật hữu ích, phục vụ cho mục đích theo đuổi lĩnh vực Machine Learning của bạn. Bên cạnh kinh nghiệm chuyên sâu về việc xử lý các bài toán Hồi quy, bạn sẽ học cách giữ vững hiệu suất thông qua các chỉ số, sự cân bằng giữa độ lệch và phương sai, cách áp dụng các hình phạt khác nhau để hoàn thành các nhiệm vụ khác nhau, tối ưu hóa mô hình bằng cách sử dụng các giải pháp dạng đóng và suy giảm độ dốc, và cách trình bày kết quả của bạn bằng những hình ảnh mang tính thẩm mỹ.
Bên cạnh việc đi sâu vào mô hình hồi quy, chúng ta còn tiếp cận và làm việc với các kỹ thuật trích xuất và lựa chọn đặc trưng cho các bài toán học máy nói chung. Trích xuất đặc trưng là quá trình sử dụng domain knowledge (miền kiến thức) của dữ liệu và các kỹ thuật xử lý để tạo ra các đặc trưng của biến, giúp cho các mô hình học máy có thể đưa ra các dự đoán. Bên cạnh đó, lựa chọn đặc trưng giúp chúng ta lọc và tìm ra các đặc trưng tốt và phù hợp nhất với các mô hình học máy, đặc biệt giúp chúng ta giảm overfitting (quá khớp) và cải thiện một cách rõ rệt chất lượng của các mô hình học máy.
Chúc các bạn học tốt!
MỤC TIÊU MÔN HỌC
Sau khi học xong môn này, học viên sẽ đạt được các chuẩn kiến thức, kỹ năng đầu ra như sau:
- Nắm rõ mục tiêu và các phương pháp tiếp cận giải bài toán hồi quy.
- Triển khai được các thuật toán thông dụng để giải bài toán hồi quy: 1 biến, đa biến, Lasso, Ridge.
- Giải quyết các vấn đề underfit và overfit trong bài toán hồi quy.
- Thành thạo các phương pháp trích xuất và chọn lọc đặc trưng từ dữ liệu.
- Làm quen với các thuật toán hồi quy nâng cao: SVR, Tree, Random Forest.
- Nắm được thuật toán ARIMA trong bài toán dự báo chuỗi thời gian.
- Có thể thực thi được 1 pipeline hoàn chỉnh để giải quyết bài toán hồi quy và tối ưu được với độ chính xác theo model và data.
TRẢI NGHIỆM HỌC TẬP
Để bắt đầu, các bạn nên dành một vài phút khám phá môn học và cấu trúc chung. Môn học sẽ có 5 phần với 15 bài học. Xuyên suốt các bài học và cuối mỗi học phần, các bài thực hành Lab và bài tập lớn (Project) sẽ giúp các bạn tăng cường việc ghi nhớ và vận dung lý thuyết đã học vào các bài toán thực tế. Để việc học tập được hiệu quả, hãy luôn trau dồi kiến thức, không ngừng học hỏi, nghiên cứu và lập cho mình một kế hoạch học tập hợp lý để hoàn thành khóa học một cách xuất sắc.
Trong thời gian học (dự kiến là 6 tuần), việc phân bổ tuần học là rất quan trọng. Nếu các bạn có bất cứ câu hỏi nào hãy kết nối với Mentor để được giải đáp.
CẤU TRÚC MÔN HỌC
Phần 1: Thuật toán hồi quy
- Bài 1: Hồi quy cơ bản
- Bài 2: Hồi quy với một đầu vào
- Bài 3: Hồi quy đa biến
Phần 2: Tinh chỉnh mô hình hồi quy
- Bài 4: Các chỉ số đánh giá chất lượng
- Bài 5: Hồi quy Ridge
- Bài 6: Hồi quy Lasso
- Bài 7: Hồi quy nâng cao
Assingment 1 - Dự đoán số lượt bình luận Facebook
Phần 3: Trích xuất đặc trưng
- Bài 8: Các đặc điểm của biến
- Bài 9: Xử lý dữ liệu bị khuyết (missing data)
- Bài 10: Mã hóa biến hạng mục
- Bài 11: Xử lý ngoại lệ và co giãn đặc trưng
Phần 4: Lựa chọn đặc trưng
- Bài 12: Giới thiệu về lựa chọn đặc trưng
- Bài 13: Phương pháp lọc
- Bài 14: Phương pháp nhúng
Assingment 2 - Dự đoán giá nhà với các kỹ thuật hồi quy nâng cao
Phần 5: Dự báo chuỗi thời gian
- Bài 15: ARIMA
CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN MÔN HỌC
THIẾT KẾ MÔN HỌC: TS. Nguyễn Văn Vinh
- Giảng viên & thành viên cốt lõi của Phòng thí nghiệm AI, Đại học Công nghệ - VNU
- Chuyên gia tư vấn AI cho DPS & Fsoft
- Tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
PHẢN BIỆN MÔN HỌC: TS. Trần Tuấn Anh
- Giảng viên Đại học Khoa học Tự nhiên - ĐHQG-HCM
- Tiến sĩ Khoa học Máy tính, Đại học Quốc gia Chonnam, Hàn Quốc
- Thạc sĩ Toán học ứng dụng về AI & Machine Learning, Đại học Orleans, Pháp
CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN KHUNG CHƯƠNG TRÌNH
TS. Từ Minh Phương
- Trưởng khoa CNTT, Đại học Bưu chính viễn thông (PTIT)
- Chuyên gia tư vấn công nghệ AI & Machine learning
- Trưởng phòng Lab Học máy & Ứng dụng của PTIT
TS. Hoàng Anh Minh
- Quản lý R&D, Chief Scientist FPT Software, LA Office
TS. Lê Hải Sơn
- Chuyên gia về Machine Learning, FPT Technology Innovation (FTI)
- Tiến sĩ khoa học máy tính, Laboratoire d’Informatique et de Mécanique pour les Sciences de l’Ingénieur (LIMSI), Université Paris-Sud, Orsay, Pháp
- Các lĩnh vực nghiên cứu: Xử lý ngôn ngữ tự nhiên, nhận dạng tiếng nói, xử lý ảnh, học máy, học sâu
NGUỒN HỌC LIỆU
Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.
Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nhiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.
Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: Coursera, tutorialspoint, edX Training, or Udemy.
KÊNH PHẢN HỒI
FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email program@funix.edu.vn