Hướng dẫn data analyst with excel
Microsoft Excel là một trong những ứng dụng phổ biến nhất để phân tích dữ liệu. Được trang bị các pivot table tích hợp, chúng là công cụ phân tích được tìm kiếm nhiều nhất hiện nay. Đây là phần mềm quản lý tất cả dữ liệu cho phép bạn dễ dàng import, khám phá, làm sạch, phân tích và trực quan hóa dữ liệu của mình. Trong bài viết này, chúng ta sẽ thảo luận về các phương pháp phân tích dữ liệu khác nhau trong Excel. Show Sorting (Sắp xếp)Sắp xếp là một phần rất quan trọng trong Phân tích dữ liệu. Bạn có thể sắp xếp dữ liệu Excel của mình theo nhiều cột hoặc thậm chí một cột duy nhất. Việc sắp xếp cũng được thực hiện theo thứ tự tăng dần hoặc giảm dần. Cột đơnHãy xem xét các dữ liệu sau: Để sắp xếp dữ liệu trên cột Units, hãy thực hiện theo các bước sau đây:
Kết quả: Lưu ý: Để sắp xếp theo thứ tự giảm dần, hãy click vào ZA. Nhiều cột
Hộp thoại Sort sẽ xuất hiện.
Nhấn OK Filtering (Lọc)Chúng ta sử dụng bộ lọc khi muốn lấy dữ liệu phù hợp với các điều kiện cụ thể.
Bây giờ bạn có thể lọc theo nhu cầu của mình. COUNTIFCOUNTIF là một hàm Excel rất phổ biến được sử dụng để đếm các ô trong phạm vi thỏa mãn một điều kiện duy nhất. Cú pháp: = COUNTIF (range, criteria) Thí dụ: SUMIFHàm SUMIF trong Excel trả về tổng các ô đáp ứng một điều kiện duy nhất. Cú pháp: = SUMIF (range, criteria, [sum_range]) Thí dụ: Pivot TablesPivotTable được biết đến là công cụ mạnh mẽ nhất trong Excel, đặc biệt hiệu quả khi cần thống kê nhanh. Chúng ta sử dụng nó để tính toán, tóm tắt và phân tích dữ liệu. Điều đó giúp chúng ta có thể xem các kết quả so sánh, mẫu hình và xu hướng trong dữ liệu của mình. Dữ liệu mẫuDữ liệu mẫu mà chúng ta sử dụng chứa 41 bản ghi với 5 trường thông tin người mua. Đây là dữ liệu hoàn hảo để hiểu pivot table. Chèn Pivot TablesĐể chèn pivot table vào trang tính của bạn, hãy làm theo các bước dưới đây:
Một hộp thoại sẽ xuất hiện. Excel sẽ tự động chọn tập dữ liệu của bạn. Nó cũng sẽ tạo một trang tính mới cho pivot table.
Drag Fields (kéo các trường)
What-If Analysis với SolverWhat-If Analysis là một tính năng có sẵn trong Excel, đây là công cụ hữu ích để giải bài toán Nếu - Thì. Sử dụng What-If Analysis, bạn có thể sử dụng một số bộ giá trị khác nhau trong một hoặc nhiều công thức để khám phá tất cả các kết quả khác nhau. Đối với việc phân tích what-if, solver là chương trình bổ trợ Microsoft Excel hữu ích ở nhiều cấp độ. Bạn có thể sử dụng tính năng này để tìm giá trị tối ưu (max hoặc min) cho công thức trong một ô, được gọi là ô mục tiêu (objective cell). Điều này tuân theo một số ràng buộc (constraints) hoặc giới hạn về giá trị của các ô công thức khác trên trang tính. Solver làm việc với một nhóm ô, được gọi là biến quyết định hoặc đơn giản là ô biến, được sử dụng để tính toán các công thức trong ô mục tiêu (objective cells) và ô ràng buộc (constraint cells). Solver cũng điều chỉnh giá trị của các ô biến quyết định để hoạt động trên các giới hạn trên các ô ràng buộc (constraint cells). Điều này giúp tạo ra kết quả mong muốn cho ô mục tiêu (objective cell). Kích hoạt Add-in Solver
Trong tab Dữ liệu, trong nhóm Analyze, bạn có thể thấy Solver được thêm vào. Cách sử dụng Solver trong ExcelTrong ví dụ này, chúng ta sẽ cố gắng tìm giải pháp cho bài toán tối ưu đơn giản. Vấn đề: Giả sử bạn là chủ một doanh nghiệp và bạn muốn thu nhập của mình là $ 3000. Mục tiêu: Tính toán các đơn vị sẽ được bán và giá mỗi đơn vị để đạt được mục tiêu. Ví dụ: chúng tôi đã tạo ra mô hình sau:
Mô hình dữ liệu của bạn sẽ thay đổi theo các điều kiện.
Trên tab Data, trong nhóm Analysis, bây giờ bạn có thể bấm vào Data Analysis. Descriptive Statistics (Thống kê mô tả)
Giả sử chúng ta có số điểm của một tay vợt trong 10 trận gần nhất của anh ta. Để tạo ra phân tích mô tả, hãy làm theo các bước dưới đây.
Thống kê mô tả (descriptive statistics) của bạn đã sẵn sàng. ANOVA
Dưới đây, bạn có thể thấy điểm số của ba cầu thủ bóng bàn trong 8 trận gần đây nhất. Để triển khai single factor ANOVA, hãy làm theo các bước sau:
Single factor ANOVA của bạn đã sẵn sàng. Regression (hồi quy)Trong Excel, chúng ta sử dụng phân tích hồi quy để ước tính mối quan hệ giữa hai hoặc nhiều biến. Hãy xem xét dữ liệu sau, trong đó chúng ta có số ca nhiễm Covid (Covid Cases) và khẩu trang đã bán (Mask Sold) trong từng tháng cụ thể.
Cửa sổ sau sẽ mở ra. Chọn Input Y Range làm số lượng khẩu trang đã bán (Mask Sold) và Input X Range làm số lượng ca nhiễm Covid (Covid Cases). Kiểm tra các phần còn lại và nhấp vào OK. Bạn sẽ nhận được Summary Output. Multiple R là hệ số tương quan (Correlation Coefficient) đo lường sức mạnh của mối quan hệ tuyến tính giữa hai biến. R Square biểu thị hệ số xác
định (Coefficient of Determination), được sử dụng như một chỉ báo về mức độ phù hợp. Với sự trợ giúp của R Square, bạn có thể theo dõi có bao nhiêu điểm rơi trên đường hồi quy. Kết:
200Lab hy vọng bài viết này đem đến cho bạn những kiến thức hữu ích, giúp bạn giải quyết những vấn đề của mình. Bên cạnh đó, bạn cũng có thể thúc đẩy con đường sự nghiệp của mình bằng cách học thêm những kỹ năng Excel mới mạnh mẽ qua những khóa học trực tuyến miễn phí và có phí trên internet. Bài viết được dịch từ đây. Nếu bạn có định hướng trở thành Data Analyst chuyên nghiệp thì bạn có thể tham khảo bộ khóa học toàn diện chuyên nghiệp với combo 4 khóa học trong 1 bootcamp của 200Lab tại đây. Ngoài ra, bạn có thể nhấn vào link này để tham gia vào nhóm và nhận thêm nhiều tài liệu hữu ích khác về Data nhé! |