Hệ thống Đề xuất
Hệ thống Đề xuất
Xin chào các bạn!
Hệ thống đề xuất (gợi ý) là một mảng của học máy (Machine Learning). Đây là một lĩnh vực dựa trên việc học hỏi và cải thiện bằng các thuật toán máy tính. Có hai thực thể chính trong Hệ gợi ý là users và items. Users là người dùng. Items là sản phẩm, ví dụ như các bộ phim, bài hát, cuốn sách, clip, hoặc cũng có thể là các users khác trong bài toán gợi ý kết bạn. Mục đích chính của các Hệ gợi ý là dự đoán mức độ quan tâm của một user tới một item nào đó, qua đó có chiến lược recommend phù hợp.
Mục tiêu của khóa học này là cung cấp cho người học sự hiểu biết cơ bản về các hệ thống đề xuất hiện đại và các ứng dụng của chúng trong. Sau khi đã tìm hiểu các mô hình tuyến tính, gradient descent và đi sâu hơn vào các phương pháp tối ưu, điển hình cho việc huấn luyện deep neural networks ở môn MLP303x, chúng ta sẽ tiếp tục với các phương pháp phổ biến nhất của hệ gợi ý là Content-based, Neighborhood-Based Collaborative Filtering và Matrix Factorization Collaborative Filtering. Sau đó, bạn sẽ sử dụng các phương pháp này để xây dựng các hệ thống đề xuất đầy đủ sử dụng các framework Surprise và Apache spark. Trong các dự án trong khóa học, bạn sẽ giải quyết vấn đề đề xuất phim bằng cách sử dụng Surprise.
Chúc các bạn học tốt!
MỤC TIÊU MÔN HỌC
Sau khi học xong môn này, học viên sẽ đạt được các chuẩn kiến thức, kỹ năng đầu ra như sau:
- Nắm rõ các định nghĩa, chủ đề, ứng dụng và vai trò của Recommender Systems trong hiện nay.
- Nắm được kiến thức về Non-Personalized Recommender và ứng dụng vào thực tế.
- Nắm được kiến thức về Content-Based Filtering và ứng dụng vào thực tế.
- Nắm được kiến thức về Nearest Neighbor Collaborative Filtering và ứng dụng vào thực tế.
- Nắm được kiến thức về cách đánh giá và metric để đánh giá Recommender Systems trong thực tế.
- Xây dựng engine cơ bản về Recommender Systems, dùng để thử nghiệm và đánh giá các thuật toán về recommnender.
- Nắm được kiến thức về Matrix Factorization và ứng dụng vào thực tế.
- Nắm được kiến thức cơ bản về toàn bộ hệ thống hệ gợi ý, triển khai mô hình gợi ý trên Apache spark và ứng dụng vào thực tế.
TRẢI NGHIỆM HỌC TẬP
Để bắt đầu, các bạn nên dành một vài phút khám phá môn học và cấu trúc chung. Môn học sẽ có 6 phần với 16 bài học. Xuyên suốt các bài học và cuối mỗi học phần, các bài thực hành Lab và bài tập lớn (Project) sẽ giúp các bạn tăng cường việc ghi nhớ và vận dung lý thuyết đã học vào các bài toán thực tế. Để việc học tập được hiệu quả, hãy luôn trau dồi kiến thức, không ngừng học hỏi, nghiên cứu và lập cho mình một kế hoạch học tập hợp lý để hoàn thành khóa học một cách xuất sắc.
Trong thời gian học (dự kiến là 6 tuần), việc phân bổ tuần học là rất quan trọng. Nếu các bạn có bất cứ câu hỏi nào hãy kết nối với Mentor để được giải đáp.
CẤU TRÚC MÔN HỌC
Phần 1: Giới thiệu về Hệ thống Đề xuất
- Bài 1: Tổng quan về Hệ thống Đề xuất
- Bài 2: Tổng quan về các thuật toán gợi ý
Phần 2: Lọc dựa trên nội dung
- Bài 3: Non-Personalized Recommender và Stereotype-Based Recommender
- Bài 4: Content-Based Filtering
Phần 3: Nearest Neighbor CF
- Bài 5: Đề xuất User-User CF
- Bài 6: Đề xuất Item-Item CF
- Bài 7: Các chủ đề CF nâng cao
Phần 4: Các phép đo lường & đánh giá Hệ thống đề xuất
- Bài 8: Các phép đo lường đề xuất và dự đoán cơ bản
- Bài 9: Các phép đo nâng cao và Offline Evaluation
- Bài 10: Online Evaluation
- Bài 11: Thiết kế đánh giá
- Bài 12: Framework cho Recommender engine
Assignment 1 - Xây dựng mô hình gợi ý phim
Phần 5: Hệ thống đề xuất E2E
- Bài 13: Phân rã ma trận
- Bài 14: Hybrid Recommender và Machine Learning
Phần 6: Hệ thống đề xuất
- Bài 15: Triển khai mô hình đề xuất với Apache Spark
- Bài 16: Kiến trúc hệ thống đề xuất
Assignmetn 2 - Xây dựng mô hình gợi ý phim sử dụng mô hình kết hợp
CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN KHUNG CHƯƠNG TRÌNH DS
T.S Nguyễn Văn Vinh
- Giảng viên & thành viên cốt lõi của Phòng thí nghiệm AI, Đại học Công nghệ - VNU
- Chuyên gia tư vấn AI cho DPS, Fsoft
- Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
- Cử nhân CNTT, Đại học Công nghệ, VNU
T.S Trần Thế Trung
- Viện trưởng Viện nghiên cứu công nghệ FPT, Đại học FPT
- Thạc sĩ Vật lý thiên văn, Đại học Pierre & Marie Curie
- Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
- Cử nhân Vật lý lý thuyết và Toán học, Đại học Melbourne
NGUỒN HỌC LIỆU
Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.
Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nhiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.
Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: Coursera, tutorialspoint, edX Training, or Udemy.
KÊNH PHẢN HỒI
FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email program@funix.edu.vn