Hướng dẫn how do i merge sheets in excel using pandas? - làm cách nào để hợp nhất các trang tính trong excel bằng gấu trúc?
Giới thiệuMột trong những hàm gấu trúc được sử dụng phổ biến nhất là Đối với những người muốn TLDR, đây là lệnh & nbsp;TLDR, here is the command: df = pd.concat(pd.read_excel('2018_Sales_Total.xlsx', sheet_name=None), ignore_index=True) Đọc để giải thích về thời điểm sử dụng này và cách thức hoạt động của nó. Excel WorksheetsĐối với các mục đích của ví dụ này, chúng tôi giả định rằng sổ làm việc Excel được cấu trúc như & nbsp; điều này: Quá trình tôi sẽ mô tả các công trình & nbsp; khi:
Understanding read_excelHàm Hầu hết thời gian, bạn sẽ đọc trong một tờ cụ thể từ tệp Excel & NBSP; import pandas as pd workbook_url = 'https://github.com/chris1610/pbpython/raw/master/data/2018_Sales_Total_Tabs.xlsx' single_df = pd.read_excel(workbook_url, sheet_name='Sheet1') Nếu bạn cẩn thận nhìn vào tài liệu, bạn có thể nhận thấy rằng nếu bạn sử dụng all_dfs = pd.read_excel(workbook_url, sheet_name=None) Pandas sẽ đọc trong tất cả các tờ và trả lại một đối tượng import pandas as pd workbook_url = 'https://github.com/chris1610/pbpython/raw/master/data/2018_Sales_Total_Tabs.xlsx' single_df = pd.read_excel(workbook_url, sheet_name='Sheet1')0. Đối với các mục đích của khả năng đọc của bài viết này, tôi đã xác định URL đầy đủ và chuyển nó sang
read_excel . Trong thực tế, bạn có thể quyết định thực hiện lệnh này & nbsp;Hãy để kiểm tra kết quả import pandas as pd workbook_url = 'https://github.com/chris1610/pbpython/raw/master/data/2018_Sales_Total_Tabs.xlsx' single_df = pd.read_excel(workbook_url, sheet_name='Sheet1')2: odict_keys(['Sheet1', 'Sheet2', 'Sheet3', 'Sheet4', 'Sheet5', 'Sheet6']) Nếu bạn muốn truy cập một tờ duy nhất dưới dạng A & NBSP; DataFrame:
Nếu chúng ta muốn tham gia tất cả các khung dữ liệu riêng lẻ vào một DataFrame, hãy sử dụng pd.concat: df = pd.concat(all_dfs, ignore_index=True) Trong trường hợp này, chúng tôi sử dụng import pandas as pd workbook_url = 'https://github.com/chris1610/pbpython/raw/master/data/2018_Sales_Total_Tabs.xlsx' single_df = pd.read_excel(workbook_url, sheet_name='Sheet1')3 vì các chỉ số được tạo tự động là import pandas as pd workbook_url = 'https://github.com/chris1610/pbpython/raw/master/data/2018_Sales_Total_Tabs.xlsx' single_df = pd.read_excel(workbook_url, sheet_name='Sheet1')4, import pandas as pd workbook_url = 'https://github.com/chris1610/pbpython/raw/master/data/2018_Sales_Total_Tabs.xlsx' single_df = pd.read_excel(workbook_url, sheet_name='Sheet1')5, v.v. không & nbsp; có ý nghĩa. Nếu dữ liệu của bạn đáp ứng cấu trúc được nêu ở trên, một lớp lót này sẽ trả về một khung dữ liệu gấu trúc duy nhất kết hợp dữ liệu trong mỗi excel & nbsp; bảng tính: bảng tính: df = pd.concat(pd.read_excel(workbook_url, sheet_name=None), ignore_index=True) Bản tóm tắtThủ thuật này có thể hữu ích trong các trường hợp phù hợp. Nó cũng minh họa số lượng năng lượng có trong một lệnh gấu trúc mà chỉ cần đọc trong một tệp excel. Notebook đầy đủ có sẵn trên GitHub nếu bạn muốn dùng thử & nbsp; |