Hướng dẫn how do i combine multiple excel files in python? - làm cách nào để kết hợp nhiều tệp excel trong python?

Thông thường, chúng tôi làm việc với các tệp Excel và chúng tôi chắc chắn đã bắt gặp một kịch bản mà chúng tôi cần hợp nhất nhiều tệp Excel thành một. Phương pháp truyền thống luôn luôn sử dụng mã VBA bên trong Excel thực hiện công việc nhưng là một quá trình nhiều bước và không dễ hiểu. Một phương pháp khác là sao chép thủ công các tệp excel dài thành một phương pháp không chỉ tiêu thụ thời gian, rắc rối mà còn dễ bị lỗi. & Nbsp;

Nhiệm vụ này có thể được thực hiện dễ dàng và nhanh chóng với một vài dòng mã trong Python với mô -đun Pandas. Đầu tiên, chúng ta cần cài đặt mô -đun với PIP. Vì vậy, hãy để Lừa có được cài đặt theo cách của chúng tôi. & NBSP;Python with the Pandas module. First, we need to install the module with pip. So let’s get the installation out of our way. 

Sử dụng lệnh sau trong thiết bị đầu cuối:

pip install pandas

Phương pháp 1: Sử dụng DataFrame.Append ()dataframe.append()

Chức năng Pandas DataFrame.Append () được sử dụng để nối các hàng của DataFrame khác vào cuối của DataFrame đã cho, trả về một đối tượng DataFrame mới. Các cột không có trong các khung dữ liệu gốc được thêm vào dưới dạng các cột mới và các ô mới được điền với giá trị NAN.dataframe.append() function is used to append rows of other dataframe to the end of the given dataframe, returning a new dataframe object. Columns not in the original dataframes are added as new columns and the new cells are populated with NaN value.

Cú pháp: dataFrame.Append (khác, bỏ qua_index = false, verify_integrity = false, sort = none) DataFrame.append(other, ignore_index=False, verify_integrity=False, sort=None)

Thông số :

  • Khác: DataFrame hoặc Sê-ri/đối tượng giống như Dict hoặc Danh sách các trong số này DataFrame or Series/dict-like object, or list of these
  • bỏ qua_index: Nếu đúng, không sử dụng nhãn chỉ mục. Mặc định sai. If True, do not use the index labels. default False.
  • Verify_Integrity: Nếu đúng, hãy nâng cao giá trị khi tạo chỉ mục với các bản sao. Mặc định sai. If True, raise ValueError on creating index with duplicates. default False.
  • Sắp xếp: Sắp xếp các cột nếu các cột của bản thân và các cột khác không được căn chỉnh. Mặc định sai. Sort columns if the columns of self and other are not aligned. default False.

Trả về: DataFrame được nối thêm: appended DataFrame

Example:

Excel được sử dụng: Thực phẩm1-1, Thực phẩm2-1 & NBSP; FoodSales1-1, FoodSales2-1
 

Python3

import glob

import pandas as pd

path = "C:/downloads"

file_list = import0import1 import2import3

import4= import6

import7 import8 import9 glob0

glob1glob2import8glob4

glob5= glob7

import7 glob9import9 import1

glob1glob5= import5

import6import7=import9import3

pandas as pd1pandas as pd2pandas as pd3=pandas as pd5import3

Đầu ra:

Hướng dẫn how do i combine multiple excel files in python? - làm cách nào để kết hợp nhiều tệp excel trong python?

Total_food_sales.xlsx

Phương pháp 2: Sử dụng pandas.concat ()pandas.concat()

Hàm pandas.concat () thực hiện tất cả các hoạt động nặng thực hiện các hoạt động nối cùng với trục của các đối tượng gấu trúc trong khi thực hiện logic đặt tùy chọn (liên kết hoặc giao lộ) của các chỉ mục (nếu có) trên các trục khác.

Cú pháp: Concat (objs, trục, tham gia, bỏ qua_index, khóa, cấp độ, tên, verify_integrity, sắp xếp, sao chép) concat(objs, axis, join, ignore_index, keys, levels, names, verify_integrity, sort, copy)

Parameters:

  • OBJS: Các đối tượng Data hoặc DataFrame Series or DataFrame objects
  • Trục: trục để nối dọc theo; mặc định = 0 // dọc theo các hàng axis to concatenate along; default = 0 //along rows
  • Tham gia: Cách xử lý các chỉ mục trên trục khác; mặc định = ‘bên ngoài way to handle indexes on other axis; default = ‘outer’
  • bỏ qua_index: nếu đúng, không sử dụng các giá trị chỉ mục dọc theo trục nối; Mặc định = Sai if True, do not use the index values along the concatenation axis; default = False
  • Khóa: Trình tự để thêm một định danh vào các chỉ mục kết quả; Mặc định = Không có sequence to add an identifier to the result indexes; default = None
  • Cấp độ: Cấp độ cụ thể (giá trị duy nhất) để sử dụng để xây dựng đa dạng; Mặc định = Không có specific levels (unique values) to use for constructing a MultiIndex; default = None
  • Tên: Tên cho các cấp độ trong chỉ số phân cấp kết quả; Mặc định = Không cónames for the levels in the resulting hierarchical index; default = None
  • Verify_Integrity: Kiểm tra xem trục được nối mới có chứa các bản sao hay không; Mặc định = Saicheck whether the new concatenated axis contains duplicates; default = False
  • Sắp xếp: Sắp xếp trục không liên kết nếu nó chưa được căn chỉnh khi tham gia là ‘bên ngoài; Mặc định = Saisort non-concatenation axis if it is not already aligned when join is ‘outer’; default = False
  • Sao chép: Nếu sai, không sao chép dữ liệu một cách không cần thiết; Mặc định = trueif False, do not copy data unnecessarily; default = True

Trả về: Một dữ liệu gấu trúc với dữ liệu được nối.a pandas dataframe with concatenated data.

Example:

Trong ví dụ cuối cùng, chúng tôi chỉ làm việc trên hai tệp Excel với một vài hàng. Hãy cùng thử hợp nhất nhiều tệp hơn, mỗi tệp chứa khoảng 5000 hàng và 7 cột. Chúng tôi có 5 tệp Banke, Bankd, Bankc, Bankb, Banka có dữ liệu cổ phiếu lịch sử cho ngân hàng tương ứng. Hãy để hợp nhất chúng vào một tệp ‘Bank_stocks.xlsx duy nhất. Ở đây chúng tôi đang sử dụng phương thức pandas.concat ().

Python3

import glob

import pandas as pd

path = "C:/downloads"

file_list = import0import1 import2import3

import4= import6

import7 import8 import9 glob0

glob1glob2import8glob4

glob5= glob7

pandas as pd1"C:/downloads"8pandas as pd3=pandas as pd5import3

Đầu ra:

Hướng dẫn how do i combine multiple excel files in python? - làm cách nào để kết hợp nhiều tệp excel trong python?

Bank_Stocks.xlsx


Làm cách nào để hợp nhất các tệp excel thành một trong python?

Mục lục..
Yêu cầu hệ thống :.
Bước 1: Nhập các mô -đun ..
Bước 2: Đọc các tệp Excel ..
Bước 3: Tham gia các hoạt động trên các khung dữ liệu ..
Bước 4: Viết kết quả vào tệp CSV ..

Làm cách nào để kết hợp nhiều sổ làm việc excel thành một?

Mở tệp Excel nơi bạn muốn hợp nhất các tờ từ các sổ làm việc khác và làm như sau:..
Nhấn Alt + F8 để mở hộp thoại Macro ..
Dưới tên macro, chọn MergeExcelfiles và nhấp vào Chạy ..
Cửa sổ Explorer Standard sẽ mở, bạn chọn một hoặc nhiều sổ làm việc bạn muốn kết hợp và nhấp vào mở ..

Làm cách nào để đọc dữ liệu từ nhiều tệp excel trong Python?

Approach:..
Nhập các gói Python cần thiết như Gandas, Glob và OS ..
Sử dụng gói Glob Python để truy xuất các tệp/tên đường dẫn khớp với một mẫu được chỉ định, tức là '.xlsx '.
Vòng lặp qua danh sách các tệp excel, đọc tệp đó bằng gấu trúc.....
Chuyển đổi từng tệp Excel thành DataFrame ..
Hiển thị vị trí, tên và nội dung của nó ..