Hướng dẫn data analyst with excel

Microsoft Excel là một trong những ứng dụng phổ biến nhất để phân tích dữ liệu. Được trang bị các pivot table tích hợp, chúng là công cụ phân tích được tìm kiếm nhiều nhất hiện nay. Đây là phần mềm quản lý  tất cả dữ liệu cho phép bạn dễ dàng import, khám phá, làm sạch, phân tích và trực quan hóa dữ liệu của mình. Trong bài viết này, chúng ta sẽ thảo luận về các phương pháp phân tích dữ liệu khác nhau trong Excel.

Sorting (Sắp xếp)

Sắp xếp là một phần rất quan trọng trong Phân tích dữ liệu. Bạn có thể sắp xếp dữ liệu Excel của mình theo nhiều cột hoặc thậm chí một cột duy nhất. Việc sắp xếp cũng được thực hiện theo thứ tự tăng dần hoặc giảm dần.

Cột đơn

Hãy xem xét các dữ liệu sau:

Hướng dẫn data analyst with excel

Để sắp xếp dữ liệu trên cột Units, hãy thực hiện theo các bước sau đây:

  • Bước đầu tiên là nhấp vào bất kỳ ô nào trong cột mà bạn muốn sắp xếp.
  • Tiếp theo, để sắp xếp theo thứ tự tăng dần, click vào AZ được tìm thấy trên tab Data, trong nhóm Sort & Filter.
Hướng dẫn data analyst with excel

Kết quả:

Hướng dẫn data analyst with excel

Lưu ý: Để sắp xếp theo thứ tự giảm dần, hãy click vào ZA.

Nhiều cột


Bạn cũng có thể sắp xếp nhiều cột trong trang tính của mình. Hãy thực hiện theo các bước sau:

  • Bấm vào Sort (trên tab Data, trong nhóm Sort & Filter)
Hướng dẫn data analyst with excel

Hộp thoại Sort sẽ xuất hiện.

  • Thêm các cấp độ mà bạn muốn sắp xếp.
Hướng dẫn data analyst with excel

Nhấn OK

Hướng dẫn data analyst with excel

Filtering (Lọc)

Chúng ta sử dụng bộ lọc khi muốn lấy dữ liệu phù hợp với các điều kiện cụ thể.

  • Nhấn vào bất kỳ ô đơn nào bên trong dữ liệu của bạn.
  • Chuyển đến Tab Data > Sort and Filter > Filter
  • Bạn sẽ thấy đầu mũi tên xuất hiện trên các cột.
Hướng dẫn data analyst with excel

Bây giờ bạn có thể lọc theo nhu cầu của mình.

Hướng dẫn data analyst with excel

COUNTIF

COUNTIF là một hàm Excel rất phổ biến được sử dụng để đếm các ô trong phạm vi thỏa mãn một điều kiện duy nhất.

Cú pháp:

= COUNTIF (range, criteria)

Thí dụ:
Hãy tính số mục lớn hơn 100.

Hướng dẫn data analyst with excel
Hướng dẫn data analyst with excel

SUMIF

Hàm SUMIF trong Excel trả về tổng các ô đáp ứng một điều kiện duy nhất.

Cú pháp:

= SUMIF (range, criteria, [sum_range])

Thí dụ:
Hãy sử dụng hàm SUMIF để tính toán các ô dựa trên các số đáp ứng tiêu chí.

Hướng dẫn data analyst with excel

Pivot Tables

PivotTable được biết đến là công cụ mạnh mẽ nhất trong Excel, đặc biệt hiệu quả khi cần thống kê nhanh. Chúng ta sử dụng nó để tính toán, tóm tắt và phân tích dữ liệu. Điều đó giúp chúng ta có thể xem các kết quả so sánh, mẫu hình và xu hướng trong dữ liệu của mình.

Dữ liệu mẫu

Dữ liệu mẫu mà chúng ta sử dụng chứa 41 bản ghi với 5 trường thông tin người mua. Đây là dữ liệu hoàn hảo để hiểu pivot table.

Hướng dẫn data analyst with excel

Chèn Pivot Tables

Để chèn pivot table vào trang tính của bạn, hãy làm theo các bước dưới đây:

  • Nhấp vào bất kỳ ô nào trong dữ liệu.
  • Trên tab Insert, trong nhóm Tables, bấm PivotTable.
Hướng dẫn data analyst with excel

Một hộp thoại sẽ xuất hiện. Excel sẽ tự động chọn tập dữ liệu của bạn. Nó cũng sẽ tạo một trang tính mới cho pivot table.

  • Nhấp vào Ok. Sau đó, nó sẽ tạo một trang tính pivot table.
Hướng dẫn data analyst with excel

Drag Fields (kéo các trường)


Để biết tổng số items mà mỗi người đã mua, hãy kéo các trường vào các ô sau:

  • Buyer vào ô Rows.
  • Items vào ô Values.
Hướng dẫn data analyst with excel

What-If Analysis với Solver

What-If Analysis là một tính năng có sẵn trong Excel, đây là công cụ hữu ích để giải bài toán Nếu - Thì. Sử dụng What-If Analysis, bạn có thể sử dụng một số bộ giá trị khác nhau trong một hoặc nhiều công thức để khám phá tất cả các kết quả khác nhau.

Đối với việc phân tích what-if, solver là chương trình bổ trợ Microsoft Excel hữu ích ở nhiều cấp độ. Bạn có thể sử dụng tính năng này để tìm giá trị tối ưu (max hoặc min) cho công thức trong một ô, được gọi là ô mục tiêu (objective cell). Điều này tuân theo một số ràng buộc (constraints) hoặc giới hạn về giá trị của các ô công thức khác trên trang tính.

Solver làm việc với một nhóm ô, được gọi là biến quyết định hoặc đơn giản là ô biến, được sử dụng để tính toán các công thức trong ô mục tiêu (objective cells) và ô ràng buộc (constraint cells). Solver cũng điều chỉnh giá trị của các ô biến quyết định để hoạt động trên các giới hạn trên các ô ràng buộc (constraint cells). Điều này giúp tạo ra kết quả mong muốn cho ô mục tiêu (objective cell).

Kích hoạt Add-in Solver

  • Trên tab File, bấm vào Options.
  • Đi tới Add-ins, chọn Solver Add-in và nhấp vào nút Go button.
Hướng dẫn data analyst with excel
  • Nhấn vào Solver Add-in và nhấp vào OK.
Hướng dẫn data analyst with excel

Trong tab Dữ liệu, trong nhóm Analyze, bạn có thể thấy Solver được thêm vào.

Hướng dẫn data analyst with excel

Cách sử dụng Solver trong Excel

Trong ví dụ này, chúng ta sẽ cố gắng tìm giải pháp cho bài toán tối ưu đơn giản.

Vấn đề: Giả sử bạn là chủ một doanh nghiệp và bạn muốn thu nhập của mình là $ 3000.

Mục tiêu: Tính toán các đơn vị sẽ được bán và giá mỗi đơn vị để đạt được mục tiêu.

Ví dụ: chúng tôi đã tạo ra mô hình sau:

Hướng dẫn data analyst with excel
  • Trên tab Data, trong nhóm Analysis, hãy bấm vào nút Solver.
  • Trong set objective, hãy chọn ô thu nhập và đặt giá trị của ô đó thành $ 3000.
  • Để thay đổi ô biến (variable cell), hãy chọn các ô C3, C4 và C8.
Hướng dẫn data analyst with excel
  • Nhấp vào Solve

Mô hình dữ liệu của bạn sẽ thay đổi theo các điều kiện.

Hướng dẫn data analyst with excel
  • Bấm vào tab File, bấm vào Options, sau đó bấm vào danh mục Add-Ins.
  • Chọn Analysis ToolPak và nhấp vào nút Go button.
  • Kiểm tra Analysis ToolPak và nhấp vào OK.
Hướng dẫn data analyst with excel

Trên tab Data, trong nhóm Analysis, bây giờ bạn có thể bấm vào Data Analysis.

Hướng dẫn data analyst with excel

Descriptive Statistics (Thống kê mô tả)


Thống kê mô tả là một trong những thông tin cơ bản, cần phải biết đối với bất kỳ tập dữ liệu nào. Nó giúp bạn biế t đến những kiến thức như:

  • Trung bình (mean), trung vị (median), và yếu vị (tần suất xuất hiện cao nhất) (mode) và khoảng biến thiên (range)
  • Phương sai và độ lệch chuẩn.

Giả sử chúng ta có số điểm của một tay vợt trong 10 trận gần nhất của anh ta. Để tạo ra phân tích mô tả, hãy làm theo các bước dưới đây.

  • Chuyển đến tab Data> Nhóm Analysis> Data analysis.
  • Chọn Descriptive Statistics và nhấp OK.
Hướng dẫn data analyst with excel
  • Chọn phạm vi đầu vào (input) của bạn.
  • Chọn phạm vi bạn muốn hiển thị kết quả đầu ra.
  • Kiểm tra các số liệu thống kê tóm tắt.

Thống kê mô tả (descriptive statistics) của bạn đã sẵn sàng.

Hướng dẫn data analyst with excel

ANOVA


ANOVA (Phân tích phương sai) trong Excel là một phương pháp thống kê được sử dụng để kiểm tra sự khác biệt giữa hai hoặc nhiều giá trị trung bình (means).

Dưới đây, bạn có thể thấy điểm số của ba cầu thủ bóng bàn trong 8 trận gần đây nhất.

Hướng dẫn data analyst with excel

Để triển khai single factor ANOVA, hãy làm theo các bước sau:

  • Chuyển đến tab Data> Nhóm Analysis> Data analysis.
  • Chọn Anova: Single Factor và nhấp vào OK.
Hướng dẫn data analyst with excel
  • Chọn phạm vi đầu vào ( input) và đầu ra (output) và nhấp vào OK.
Hướng dẫn data analyst with excel

Single factor ANOVA của bạn đã sẵn sàng.

Hướng dẫn data analyst with excel

Regression (hồi quy)

Trong Excel, chúng ta sử dụng phân tích hồi quy để ước tính mối quan hệ giữa hai hoặc nhiều biến.

Hãy xem xét dữ liệu sau, trong đó chúng ta có số ca nhiễm Covid (Covid Cases) và khẩu trang đã bán (Mask Sold) trong từng tháng cụ thể.

Hướng dẫn data analyst with excel
  • Chuyển đến tab Data> Nhóm Analysis> Data analysis.
  • Chọn hồi quy và nhấp vào OK.

Cửa sổ sau sẽ mở ra.

Hướng dẫn data analyst with excel

Chọn Input Y Range làm số lượng khẩu trang đã bán (Mask Sold) và Input X Range làm số lượng ca nhiễm Covid (Covid Cases). Kiểm tra các phần còn lại và nhấp vào OK.

Bạn sẽ nhận được Summary Output.

Hướng dẫn data analyst with excel

Multiple R là hệ số tương quan (Correlation Coefficient) đo lường sức mạnh của mối quan hệ tuyến tính giữa hai biến.

R Square biểu thị hệ số xác định (Coefficient of Determination), được sử dụng như một chỉ báo về mức độ phù hợp. Với sự trợ giúp của R Square, bạn có thể theo dõi có bao nhiêu điểm rơi trên đường hồi quy.
Standard Error là một thước đo phù hợp khác cho thấy độ chính xác của phân tích hồi quy.

Kết:


Chúng ta cùng nhau đi đến phần cuối của bài "phân tích dữ liệu trong excel". Ở phần trên, chúng ta đã xem và tìm ra một số ví dụ về những phương pháp và tính năng mạnh mẽ của phân tích dữ liệu trong Excel.

200Lab hy vọng bài viết này đem đến cho bạn những kiến thức hữu ích, giúp bạn giải quyết những vấn đề của mình.

Bên cạnh đó, bạn cũng có thể thúc đẩy con đường sự nghiệp của mình bằng cách học thêm những kỹ năng Excel mới mạnh mẽ qua những khóa học trực tuyến miễn phí và có phí trên internet.

Bài viết được dịch từ đây.

Nếu bạn có định hướng trở thành Data Analyst chuyên nghiệp thì bạn có thể tham khảo bộ khóa học toàn diện chuyên nghiệp với combo 4 khóa học trong 1 bootcamp của 200Lab tại đây.

Ngoài ra, bạn có thể nhấn vào link này để tham gia vào nhóm và nhận thêm nhiều tài liệu hữu ích khác về Data nhé!