DataStation

Build yourself as a well-rounded Data Analyst

4 Loại phân tích dữ liệu mà Data Analyst cần biết

Types of analysis

Chuyện gì đã xảy ra? → Tại sao điều đó xảy ra? → Điều gì có khả năng sẽ xảy ra? → Cần hành động như thế nào trong tương lai?

Cốt lõi của việc phân tích dữ liệu chính là trả lời câu hỏi và đưa ra quyết định. Vì thế, tuỳ thuộc vào loại câu hỏi đáp ứng được mục tiêu của bạn mà phân tích dữ liệu cũng được chia thành những dạng khác nhau. Có 4 dạng phân tích dữ liệu chính:

Phân tích miêu tả (Descriptive analytics)

Chuyện gì đã xảy ra?

Phân tích miêu tả vận dụng dữ liệu thô từ nhiều nguồn để cung cấp thông tin về quá khứ. Tuy nhiên, các findings đến từ loại phân tích này chỉ cho ta biết ĐIỀU GÌ ĐÃ XẢY RA, mà không giải thích tại sao?

Ví dụ, các Data Analyst làm việc với team E-commerce Marketing để xem lại doanh số hàng bán nhằm xác định xu hướng và các patterns. Bài phân tích này sẽ chỉ cho thấy mức tăng hoặc giảm của doanh số so với năm trước, cụ thể ở khu vực nào và tỷ lệ thay đổi là bao nhiêu.

Phân tích chẩn đoán (Diagnostic analytics)

Tại sao điều đó xảy ra?

Giống như phân tích miêu tả, phân tích chẩn đoán cũng tập trung vào quá khứ. Tuy nhiên, các bài phân tích loại này đi tìm nguyên nhân và kết quả để minh họa và lý giải cho việc tại sao điều đó lại xảy ra. Mục đích là so sánh các sự kiện trong quá khứ để xác định nguyên nhân. Tất nhiên, phân tích này không cho ta một câu trả lời đen trắng rõ ràng mà được đặt trong bối cảnh của xác suất, khả năng hoặc kết quả phân phối.

Phân tích chẩn đoán giúp:

  • Xác định các điểm ngoại lai (outliers)
  • Phân tách các patterns
  • Khám phá các mối quan hệ

Trở lại với ví dụ phía trên, với phân tích mô tả, bạn thấy được có sự sụt giảm về doanh số, tiếp theo, chúng ta sẽ xác định lý do tại sao lại có sự sụt giảm đột ngột này? Bạn có thể kiểm tra, xem xét thêm về các dữ liệu bổ sung khác như lượng truy cập trang web, ngân sách marketing, hàng tồn kho sẵn có và đào sâu vào các mối tương quan giữa những thông tin này để khám phá xem có mối liên kết nào giữa chúng không. Với những phân tích phức tạp hơn, người làm phân tích dữ liệu có thể tận dụng lý thuyết về xác suất, phân tích hồi quy hay là phân tích chuỗi thời gian để xác định nguyên nhân và hệ quả.

Phân tích dự đoán (Predictive analytics)

Có khả năng gì sẽ xảy ra?

Phân tích dự đoán cho biết điều gì có khả năng xảy ra trong tương lai. Những phân tích dạng này tận dụng các findings có được từ phân tích miêu tả và chẩn đoán để dự đoán xu hướng tương lai. Những bài phân tích dự đoán thường khá phức tạp dựa trên Machine Learning hay Deep Learning.

Tuy nhiên, cần nhớ rằng không có phân tích dữ liệu nào sẽ có thể cho bạn biết chính xác điều gì sẽ xảy ra trong tương lai. Phân tích dự đoán đưa ra cái nhìn về những gì có thể xảy ra và xác suất xảy ra của chúng.

Ví dụ, sau khi phân tích miêu tả và phân tích chẩn đoán, chúng ta đã biết doanh số sụt giảm và lí do vì sao. Tiếp theo, phân tích dự đoán giúp tìm ra doanh số dự kiến trong tháng, quý hoặc năm tiếp theo, v.v. dựa trên xu hướng trong quá khứ, kết hợp với những yếu tố có thể ảnh hưởng khác như mức độ đầu tư của công ty, tình hình kinh tế, mức cạnh tranh từ đối thủ,…

Phân tích đề xuất (Prescriptive analytics)

Nên hành động như thế nào?

Mục đích của phân tích đề xuất là đưa ra những hướng dẫn cụ thể về hành động để đạt được điều gì đó trong tương lai. Các phân tích dạng này thường sử dụng những công cụ và công nghệ hiện đại (VD: Machine Learning) kết hợp với kiến thức kinh doanh và các thuật toán, khá phức tạp để triển khai và quản lý. Ngoài ra, loại phân tích dữ liệu này yêu cầu không chỉ dữ liệu nội bộ lịch sử mà còn thông tin bên ngoài do tính chất của thuật toán mà nó sử dụng.

Ví dụ với phân tích dự đoán, bạn đưa ra được findings là doanh số sẽ có thể tăng trở lại 10% trong năm tiếp theo. Vậy để việc này xảy ra, với phân tích đề xuất, bạn có thể đưa ra quyết định đúng thời điểm như giảm giá, tiếp thị nhiều hơn, lưu trữ đủ hàng hoá trên các kênh bán hàng khác nhau…

Tổng kết,

Phần lớn Data Analyst ở Việt Nam chủ yếu sử dụng Phân tích mô tả và Phân tích chẩn đoán, trong khi Phân tích dự đoán và Phân tích đề xuất phức tạp hơn rất nhiều và thường thấy trong phạm vi làm việc của Data Scientist. Dù có lựa chọn đi theo con đường nào trên sự nghiệp về Data đi nữa, việc hiểu rõ 4 loại phân tích này cũng giúp bạn có cái nhìn tổng quan và cách tiếp cận, vận dụng chúng trong quá trình làm việc nhé.

Nguồn: Medium

Lược dịch và bổ sung bởi DataStation

Leave a Reply

Your email address will not be published. Required fields are marked *