Skip to main content

Phân tích Dữ liệu với Python

Enrollment in this course is by invitation only

Phân tích Dữ liệu với Python

Xin chào các bạn!

Môn học này giúp học viên nắm rõ các kiến thức về phân tích dữ liệu, vai trò của nhà phân tích dữ liệu và các công cụ được sử dụng để thực hiện các chức năng hàng ngày. Bạn sẽ hiểu được các nguyên tắc cơ bản của phân tích dữ liệu, chẳng hạn như thu thập dữ liệu hoặc khai thác dữ liệu. Sau đó, bạn sẽ học các kỹ năng mềm cần thiết để truyền đạt hiệu quả dữ liệu của bạn cho các bên liên quan và cách thành thạo các kỹ năng này có thể cung cấp cho bạn lựa chọn để trở thành người ra quyết định theo hướng dữ liệu.

Phân tích dữ liệu là một quá trình nhận vào dữ liệu thô và chuyển đổi nó thành thông tin hữu ích cho việc ra quyết định của người dùng. Trên thế giới dữ liệu cần để làm đầu vào cho việc phân tích phần lớn được lưu trong cơ sở dữ liệu. Trích xuất dữ liệu từ cơ sở dữ liệu bằng SQL là một kỹ thuật quan trọng bạn phải học nếu bạn muốn trở thành một nhà khoa học dữ liệu. Sau đó, dữ liệu thu được ban đầu phải được xử lý hoặc tổ chức và làm sạch để phân tích. Khóa học này hứa hẹn sẽ mang đến cho bạn kiến thức về sắp xếp dữ liệu và khám phá dữ liệu bằng cách sử dụng thư viện trong Python, như Numpy, Pandas. Một trong những kỹ năng chính của một nhà khoa học dữ liệu là khả năng kể câu chuyện bằng dữ liệu, trực quan hóa dữ liệu giúp cho người theo hứng thú và dễ tiếp cận.

Ngoài ra, khóa học này sẽ cung cấp cho bạn các kỹ năng cần thiết để tận dụng dữ liệu nhằm tìm ra những hiểu biết có giá trị và thúc đẩy sự nghiệp của bạn.

Chúc các bạn học tốt!


MỤC TIÊU MÔN HỌC

Sau khi học xong môn này, học viên sẽ đạt được các chuẩn kiến thức, kỹ năng đầu ra như sau:

  • Nắm vững về Phân tích dữ liệu và Phân tích dữ liệu trong kinh doanh
  • Nắm vững được cách thức kết nối và giao tiếp với các bên liên quan trong dự án Phân tích dữ liệu
  • Nắm vững về cơ sở dữ liệu
  • Vận dụng được câu lệnh SQL và truy cập vào cơ sở dữ liệu bằng Python
  • Vận dụng được các kĩ năng làm việc với dữ liệu bằng Pandas
  • Nắm vững về trực quan hóa dữ liệu, các loại biểu đồ và vận dụng bằng các thư viện Python


TRẢI NGHIỆM HỌC TẬP

Để bắt đầu, các bạn nên dành một vài phút khám phá môn học và cấu trúc chung. Môn học sẽ có 5 phần với 19 bài học. Xuyên suốt các bài học và cuối mỗi học phần, các bài thực hành Lab và bài tập lớn (Project) sẽ giúp các bạn tăng cường việc ghi nhớ và vận dung lý thuyết đã học vào các bài toán thực tế. Để việc học tập được hiệu quả, hãy luôn trau dồi kiến thức, không ngừng học hỏi, nghiên cứu và lập cho mình một kế hoạch học tập hợp lý để hoàn thành khóa học một cách xuất sắc.

Trong thời gian học (dự kiến là 6 tuần), việc phân bổ tuần học là rất quan trọng. Nếu các bạn có bất cứ câu hỏi nào hãy kết nối với Mentor để được giải đáp.


CẤU TRÚC MÔN HỌC

Phần 1: Tổng quan về phân tích dữ liệu

  • Bài 1: Khái niệm về phân tích dữ liệu
  • Bài 2: Thu thập dữ liệu
  • Bài 3: Sắp xếp dữ liệu
  • Bài 4: Phân tích và khai phá dữ liệu
  • Bài 5: Trình bày kết quả phân tích dữ liệu

Phần 2: Cơ sở dữ liệu và SQL cho Khoa học Dữ liệu

  • Bài 6: Giới thiệu về Cơ sở dữ liệu và SQL cơ bản
  • Bài 7: SQL nâng cao
  • Bài 8: Truy cập cơ sở dữ liệu bằng Python

Assignment 1 - Truy xuất và phân tích dữ liệu bóng đá châu Âu

Phần 3: Làm việc với dự liệu bằng Pandas

  • Bài 9: DataFrame
  • Bài 10: Trích xuất dữ liệu với Pandas
  • Bài 11: Làm việc với dữ liệu trong Pandas
  • Bài 12: Làm việc với dữ liệu chuỗi và thời gian trong Pandas

Progress Test 1

Phần 4: Trực quan hoá dữ liệu với Python

  • Bài 13: Giới thiệu về trực quan hoá dữ liệu
  • Bài 14: Công cụ trực quan hóa cơ bản
  • Bài 15: Công cụ trực quan hóa nâng cao
  • Bài 16: Trực quan hoá tương tác với Plotly

Assignment 2 - Phân tích dữ liệu Covid-19

Phần 5: Kỹ thuật phân tích trong kinh doanh

  • Bài 17: Tầm quan trọng của các quyết định kinh doanh công bằng
  • Bài 18: Đặt câu hỏi hiệu quả và tiết kiệm thời gian với tư duy có cấu trúc
  • Bài 19: Tầm quan trọng của việc giao tiếp với các bên liên quan

CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN MÔN HỌC

THIẾT KẾ MÔN HỌC: Th.S Vũ Thương Huyền

  • Trình độ chuyên môn: Thạc sĩ Kỹ thuật phần mềm, Đại học Công nghệ, Đại học Quốc gia Hà Nội
  • Nghề nghiệp: Senior Data Scientist
  • Nơi công tác: FPT Software - FPT
  • Lĩnh vực nghiên cứu: Machine learning, Deep learning, Reinforcement Learning, Natural Language Processing
  • Online profile: https://www.linkedin.com/in/thuong-huyen-3969747a/

PHẢN BIỆN MÔN HỌC: T.S Đặng Hoàng Vũ

  • Trình độ chuyên môn: Tiến sĩ Toán học, Đại học Cambridge
  • Nghề nghiệp: Giám đốc khoa học FPT
  • Nơi công tác: FPT Software - FPT
  • Công việc hiện tại: Chịu trách nhiệm chính trong lĩnh vực phân tích của Platform quản lý dữ liệu và nghiên cứu khoa học dữ liệu của FPT

CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN KHUNG CHƯƠNG TRÌNH DS

T.S Từ Minh Phương

  • Trưởng khoa CNTT, Đại học Bưu chính viễn thông (PTIT)
  • Chuyên gia tư vấn công nghệ AI & machine learning
  • Trưởng phòng Lab Học máy & Ứng dụng của PTIT

T.S Nguyễn Văn Vinh

  • Giảng viên & thành viên cốt lõi của Phòng thí nghiệm AI, Đại học Công nghệ - VNU
  • Chuyên gia tư vấn AI cho DPS, Fsoft
  • Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
  • Cử nhân CNTT, Đại học Công nghệ, VNU

T.S Trần Thế Trung

  • Viện trưởng Viện nghiên cứu công nghệ FPT, Đại học FPT
  • Thạc sĩ Vật lý thiên văn, Đại học Pierre & Marie Curie
  • Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
  • Cử nhân Vật lý lý thuyết và Toán học, Đại học Melbourne

NGUỒN HỌC LIỆU

Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.

Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nhiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.

Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: Coursera, tutorialspoint, edX Training, or Udemy.


KÊNH PHẢN HỒI

FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email program@funix.edu.vn