Skip to main content

Kỹ thuật dữ liệu trên AWS

Enrollment in this course is by invitation only

Kỹ thuật dữ liệu trên AWS

Xin chào các bạn!

Amazon Web Service (AWS) là một trong những nền tảng dịch vụ đám mây an toàn. Khả năng tính toán lẫn lưu trữ dữ liệu được tích hợp trọn vẹn nhằm mục đích giúp doanh nghiệp có thể ngày càng mở rộng và phát triển nhanh chóng. Giải pháp đám mây thường được dùng để xây dựng hầu hết những ứng dụng phức tạp nhưng vẫn mang đến sự linh hoạt và khả năng xử lý tuyệt vời. Đặc biệt là mức độ bảo mật của nền tảng đám mây này được đánh giá gần như tuyệt đối.

Trong môn học này các bạn học viên sẽ được cung cấp các kiến thức ở mức độ cơ bản về dịch vụ đám mây và cách các dịch vụ đó được cung cấp trên Amazon Web Service cũng như các dịch vụ liên quan đến dữ liệu và cơ sở dữ liệu như Amazon RDS, Amazon DynamoDB/DocumentDB. Chúng ta cũng sẽ đi sâu vào các tác vụ về AWS Data Pipeline như AWS Database Migration Service (DMS) - một dịch vụ có chi phí thấp và giúp di chuyển cơ sở dữ liệu sang AWS một cách dễ dàng và bảo mật, AWS Glue – dịch vụ phi máy chủ giúp chúng ta chạy và giám sát một cách trực quan các quy trình ETL chỉ với một vài cú nhấp chuột, và AWS Redshift – có thể truy vấn và kết hợp hàng exabyte dữ liệu có cấu trúc và bán cấu trúc trên data warehouse.

Chúc các bạn học tốt!


MỤC TIÊU MÔN HỌC

Sau khi học xong môn này, học viên sẽ đạt được các chuẩn kiến thức, kỹ năng đầu ra như sau:

  • Làm quen với hệ sinh thái Amazon Web Service, hiểu rõ ưu điểm của tính toán đám đám mây so với sử dụng hệ thống máy chủ truyền thống.
  • Hiểu và sử dụng được các thành phần cơ bản trong AWS như tài nguyên tính toán và lưu trữ, hạ tầng mạng, cơ sở dữ liệu, bảo mật và chi phí.
  • Có thể xác định tùy chọn triển khai AWS Database phù hợp và có thể triển khai nó thành công trên AWS.
  • Vận dụng được AWS Database Migration Service, AWS Glue và AWS Redshift để thực hiện các bước cơ bản trong AWS Data Pipeline.


TRẢI NGHIỆM HỌC TẬP

Để bắt đầu, các bạn nên dành một vài phút khám phá môn học và cấu trúc chung. Môn học sẽ có 3 phần với 20 bài học. Xuyên suốt các bài học và cuối mỗi học phần, các bài thực hành Lab và bài tập lớn (Assignment) sẽ giúp các bạn tăng cường việc ghi nhớ và vận dung lý thuyết đã học vào các bài toán thực tế. Để việc học tập được hiệu quả, hãy luôn trau dồi kiến thức, không ngừng học hỏi, nghiên cứu và lập cho mình một kế hoạch học tập hợp lý để hoàn thành khóa học một cách xuất sắc.

Trong thời gian học (dự kiến là 6 tuần), việc phân bổ tuần học là rất quan trọng. Nếu các bạn có bất cứ câu hỏi nào hãy kết nối với Mentor để được giải đáp.


CẤU TRÚC MÔN HỌC

Phần 1: Làm quen với AWS

  • Bài 1: Tổng quan về Cloud và AWS
  • Bài 2: Hiểu được tính kinh tế của Cloud và cách chi trả
  • Bài 3: AWS Identity and Access Management
  • Bài 4: AWS VPC
  • Bài 5: Content Delivery
  • Bài 6: EC2
  • Bài 7: Serverless
  • Bài 8: EBS và EFS
  • Bài 9: S3 và Glacier
  • Bài 10: Auto Scaling và Monitoring
  • Assingment 1 - Ứng dụng các dịch vụ co dãn tự động trên EC2 cho websever

Phần 2: AWS Database

  • Bài 11: AWS Database
  • Bài 12: RDS
  • Bài 13: RDS Multi-AZ deployments and read replicas
  • Bài 14: Redshift
  • Bài 15: Scaling, Monitoring and Security in Redshift
  • Bài 16: Amazon DocumentDB
  • Assingment 2 - Xây dựng cơ sở dữ liệu cho Google Play Store

Phần 3: AWS Data Pipeline

  • Bài 17: Database Migration
  • Bài 18: Các thao tác Database Migration
  • Bài 19: Amazon Glue
  • Bài 20: Elastic MapReduce (EMR)
  • Assingment 3 - Tích hợp kho dữ liệu phim ảnh lên AWS Redshift


CHUYÊN GIA THIẾT KẾ MÔN HỌC

THIẾT KẾ MÔN HỌC: TS. Đặng Quang Vinh

  • Tiến sĩ Khoa học máy tính Universite de Lorraine, Pháp
  • Head of Data Science in Be Group JSC
  • Giảng viên Đại học Công nghiệp thành phố Hồ Chí Minh

THIẾT KẾ MÔN HỌC: Th.S Nguyễn Hải Nam

PHẢN BIỆN MÔN HỌC: Thạc sĩ Nguyễn Chi Hoàng

  • Master of Science (MS)Field Of StudyData Science, Université Claude Bernard Lyon 1
  • Solution Architect in Artificial Intelligence, FPT Software

PHẢN BIỆN MÔN HỌC: Anh Phan Chương

  • BigData Engineer, Seatle, Washington, US.
  • Phòng nghiên cứu và phát triển chương trình FUNiX

NGUỒN HỌC LIỆU

Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.

Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nhiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.

Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: Coursera, tutorialspoint, edX Training, or Udemy.


KÊNH PHẢN HỒI

FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email program@funix.edu.vn