Bạn có thể sử dụng Python để phân tích dữ liệu Excel không?
Excel được sử dụng rộng rãi để phân tích dữ liệu và có rất nhiều chức năng để phân tích, thao tác, trực quan hóa, v.v. Sử dụng excel phải là một trong những kỹ năng chính cần có đối với Nhà phân tích dữ liệu, Nhà phân tích sản phẩm và Nhà phân tích kinh doanh. Nó giúp hiểu dữ liệu và cách chúng ta có thể sử dụng nó để tạo ra những hiểu biết hữu ích Show
Python cũng được sử dụng rộng rãi cho mục đích Phân tích dữ liệu và cũng khắc phục được những nhược điểm của Excel. Với một chút kiến thức về Python, chúng ta có thể nâng cao kỹ năng Phân tích dữ liệu của mình và cũng tạo ra nhiều thông tin chi tiết hữu ích hơn Kết hợp cả Excel và Python có thể hiệu quả và làm cho Phân tích dữ liệu trở nên thú vị hơn. ExcelWriter được sử dụng để thực hiện các thao tác Excel khác nhau bằng Python. Nó cung cấp nhiều chức năng như tạo Excel, ghi dữ liệu vào trang tính Excel, tạo trực quan hóa trong Excel, v.v. Trong bài viết này, chúng ta sẽ khám phá ExcelWriter và tạo một số trực quan hóa bằng cách sử dụng nó Bắt đầu nào… Cài đặt các thư viện cần thiếtExcelwriter được định nghĩa trong Pandas nên chúng ta không cần cài đặt riêng Nhập thư viện cần thiếtTrong bước này, chúng tôi sẽ nhập tất cả các thư viện cần thiết để đọc Excel và tạo trực quan hóa trong Excel bằng Python import pandas as pd Đang tải tập dữ liệuĐối với bài viết này, chúng tôi sẽ sử dụng bộ dữ liệu Bệnh tiểu đường nổi tiếng có thể tải xuống từ các nguồn trực tuyến. Ngoài ra, chúng tôi sẽ tạo một tệp excel bằng trình soạn thảo excel, nơi chúng tôi sẽ tạo trực quan hóa df = pd.DataFrame(pd.read_csv("/content/test.csv")) Tạo trực quan hóa trong ExcelTrong bước này, chúng ta sẽ tạo các loại hình ảnh khác nhau, ghi chúng vào tệp excel mà chúng tôi đã tạo và sau đó lưu hình ảnh. Trước khi tạo các trực quan hóa, chúng tôi cũng sẽ tạo các đối tượng để người viết sử dụng cho các thao tác tiếp theo Mã được đưa ra dưới đây sẽ tạo các đối tượng và các biểu đồ khác nhau là Biểu đồ thanh, Biểu đồ phân tán, Biểu đồ đường và Biểu đồ vùng book = writer.book
Phương pháp 1. Đọc tệp excel bằng Python sử dụng PandasTrong phương pháp này, trước tiên chúng tôi sẽ nhập mô-đun Pandas, sau đó chúng tôi sẽ sử dụng Pandas để đọc tệp excel của chúng tôi. Bạn có thể đọc thêm các thao tác sử dụng file excel sử dụng Pandas tại bài viết này. Bấm vào đây Python3df = pd.DataFrame(pd.read_csv("/content/test.csv")) 4df = pd.DataFrame(pd.read_csv("/content/test.csv")) 5 df = pd.DataFrame(pd.read_csv("/content/test.csv")) 6
df = pd.DataFrame(pd.read_csv("/content/test.csv")) 7df = pd.DataFrame(pd.read_csv("/content/test.csv")) 8df = pd.DataFrame(pd.read_csv("/content/test.csv")) 9 book = writer.book0 book = writer.book1 Result: ['Name Age Stream Percentage', '0 Ankit 18 Math 95', '1 Rahul 19 Science 90', '2 Shaurya 20 Commerce 85', '3 Aishwarya 18 Math 80', '4 Priyanka 19 Science 75', None]0
Result: ['Name Age Stream Percentage', '0 Ankit 18 Math 95', '1 Rahul 19 Science 90', '2 Shaurya 20 Commerce 85', '3 Aishwarya 18 Math 80', '4 Priyanka 19 Science 75', None]1 Result: ['Name Age Stream Percentage', '0 Ankit 18 Math 95', '1 Rahul 19 Science 90', '2 Shaurya 20 Commerce 85', '3 Aishwarya 18 Math 80', '4 Priyanka 19 Science 75', None]2 đầu ra
Phương pháp 2. Đọc tệp excel bằng Python sử dụng openpyxlHàm load_workbook() mở Sách. tệp xlsx để đọc. Tệp này được truyền dưới dạng đối số cho hàm này. Đối tượng của khung dữ liệu. active đã được tạo trong tập lệnh để đọc các giá trị của thuộc tính max_row và max_column. Các giá trị này được sử dụng trong các vòng lặp để đọc nội dung của Books2. tập tin xlsx. Bạn có thể đọc các thao tác khác sử dụng openpyxl trong bài viết này Python3df = pd.DataFrame(pd.read_csv("/content/test.csv")) 5 Result: ['Name Age Stream Percentage', '0 Ankit 18 Math 95', '1 Rahul 19 Science 90', '2 Shaurya 20 Commerce 85', '3 Aishwarya 18 Math 80', '4 Priyanka 19 Science 75', None]4
Result: ['Name Age Stream Percentage', '0 Ankit 18 Math 95', '1 Rahul 19 Science 90', '2 Shaurya 20 Commerce 85', '3 Aishwarya 18 Math 80', '4 Priyanka 19 Science 75', None]5 Result: ['Name Age Stream Percentage', '0 Ankit 18 Math 95', '1 Rahul 19 Science 90', '2 Shaurya 20 Commerce 85', '3 Aishwarya 18 Math 80', '4 Priyanka 19 Science 75', None]6 df = pd.DataFrame(pd.read_csv("/content/test.csv")) 9 Result: ['Name Age Stream Percentage', '0 Ankit 18 Math 95', '1 Rahul 19 Science 90', '2 Shaurya 20 Commerce 85', '3 Aishwarya 18 Math 80', '4 Priyanka 19 Science 75', None]8 Result: ['Name Age Stream Percentage', '0 Ankit 18 Math 95', '1 Rahul 19 Science 90', '2 Shaurya 20 Commerce 85', '3 Aishwarya 18 Math 80', '4 Priyanka 19 Science 75', None]9 Result: ['Name Age Stream Percentage', '0 Ankit 18 Math 95', '1 Rahul 19 Science 90', '2 Shaurya 20 Commerce 85', '3 Aishwarya 18 Math 80', '4 Priyanka 19 Science 75', None]0
df = pd.DataFrame(pd.read_csv("/content/test.csv")) 41df = pd.DataFrame(pd.read_csv("/content/test.csv")) 8df = pd.DataFrame(pd.read_csv("/content/test.csv")) 9 df = pd.DataFrame(pd.read_csv("/content/test.csv")) 44
df = pd.DataFrame(pd.read_csv("/content/test.csv")) 45df = pd.DataFrame(pd.read_csv("/content/test.csv")) 46 df = pd.DataFrame(pd.read_csv("/content/test.csv")) 47df = pd.DataFrame(pd.read_csv("/content/test.csv")) 48 df = pd.DataFrame(pd.read_csv("/content/test.csv")) 49df = pd.DataFrame(pd.read_csv("/content/test.csv")) 50df = pd.DataFrame(pd.read_csv("/content/test.csv")) 51df = pd.DataFrame(pd.read_csv("/content/test.csv")) 52df = pd.DataFrame(pd.read_csv("/content/test.csv")) 53df = pd.DataFrame(pd.read_csv("/content/test.csv")) 46 df = pd.DataFrame(pd.read_csv("/content/test.csv")) 55df = pd.DataFrame(pd.read_csv("/content/test.csv")) 48 df = pd.DataFrame(pd.read_csv("/content/test.csv")) 57df = pd.DataFrame(pd.read_csv("/content/test.csv")) 58df = pd.DataFrame(pd.read_csv("/content/test.csv")) 59_______160____41____162 đầu ra.
Phương pháp 3. Đọc tệp excel bằng Python bằng XlwingsXlwings có thể được sử dụng để chèn dữ liệu vào tệp Excel tương tự như khi đọc từ tệp Excel. Dữ liệu có thể được cung cấp dưới dạng danh sách hoặc một đầu vào cho một ô nhất định hoặc một vùng chọn ô. Bạn có thể đọc các thao tác khác sử dụng Xlwings trong bài viết này Python có thể đọc dữ liệu từ Excel không?Hàm read_excel của thư viện pandas được sử dụng để đọc nội dung của tệp Excel vào môi trường python dưới dạng DataFrame của gấu trúc . Hàm có thể đọc các tệp từ HĐH bằng cách sử dụng đường dẫn thích hợp tới tệp.
Python phân tích dữ liệu trong Excel như thế nào?Khóa học phân tích dữ liệu với Python dành cho người dùng Excel . Cài đặt Python và Jupyter Notebook với Anaconda Giao diện máy tính xách tay Jupyter Các loại ô và chế độ ô Phím tắt máy tính xách tay Jupyter Mô-đun 1 - Xin chào thế giới Loại dữ liệu Biến danh sách Excel hay Python tốt hơn để phân tích dữ liệu?Python được coi là công cụ phân tích dữ liệu hiệu quả hơn dành cho các phép tính phức tạp và khối lượng dữ liệu lớn. Tuy nhiên, nhìn chung Excel vẫn phổ biến hơn Python và được nhiều người sử dụng trong phân tích tài chính.
Python có tốt cho Excel không?Tự động hóa dễ dàng hơn
. Ví dụ: nếu bạn cần chạy cùng một phân tích trên một tập hợp dữ liệu bán hàng mới mỗi tuần, thì việc thực hiện điều này trong Excel sẽ yêu cầu mở một tệp khác theo cách thủ công mỗi tuần và nhập lại công thức cũng như các yếu tố khác cần thiết cho phân tích |