Hướng dẫn can we read excel file in python? - chúng ta có thể đọc tệp excel bằng python không?

Bạn có thể dễ dàng nhập một tệp excel vào Python bằng gấu trúc. Để thực hiện mục tiêu này, bạn sẽ cần sử dụng read_excel:

import pandas as pd

df = pd.read_excel[r'Path where the Excel file is stored\File name.xlsx']
print[df]

Lưu ý rằng đối với phiên bản Excel trước đó, bạn có thể cần sử dụng phần mở rộng tệp của ‘XLS,

Và nếu bạn có một bảng Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng:Excel sheet that you’d like to import, you may then apply:

import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]

Bây giờ, hãy xem xét một ví dụ bao gồm dữ liệu sẽ được nhập vào Python.

Dữ liệu được nhập vào Python

Giả sử rằng bạn có bảng sau được lưu trữ trong Excel [trong đó tên tệp Excel là ‘Danh sách sản phẩm‘]:Product List‘]:

Sản phẩm Giá bán
Máy tính desktop700
Máy tính bảng250
Máy in120
Máy tính xách tay1200

Sau đó, bạn sẽ nhập dữ liệu trên vào Python như thế nào?

Bạn có thể làm theo các bước dưới đây để nhập tệp Excel vào Python.

Bước 1: Chụp đường dẫn tệp

Đầu tiên, bạn sẽ cần phải chụp toàn bộ đường dẫn nơi tệp Excel được lưu trữ trên máy tính của bạn.

Ví dụ, hãy để giả sử rằng một tệp excel được lưu trữ theo đường dẫn sau:

C: \ Users \ Ron \ Desktop \ Sản phẩm Danh sách.xlsxProduct List.xlsx

Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn.

Don Tiết quên bao gồm tên tệp [trong ví dụ của chúng tôi, nó ‘Danh sách sản phẩm‘ như được tô sáng màu xanh]. Bạn cũng cần bao gồm phần mở rộng tệp Excel [trong trường hợp của chúng tôi, nó ‘.xlsx‘ như được tô sáng màu xanh lá cây].Product list‘ as highlighted in blue]. You’ll also need to include the Excel file extension [in our case, it’s ‘.xlsx‘ as highlighted in green].

Bước 2: Áp dụng mã Python

Và đây là mã Python cho ví dụ của chúng tôi:

import pandas as pd

df = pd.read_excel[r'C:\Users\Ron\Desktop\Product List.xlsx']
print[df]

Lưu ý rằng bạn nên đặt ra R R R trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\. Ngoài ra, don không quên đặt tên tệp ở cuối đường dẫn + .xlsx, that you should place “r” before the path string to address special characters, such as ‘\’. In addition, don’t forget to put the file name at the end of the path + ‘.xlsx’

Bước 3: Chạy mã Python để nhập tệp Excel

Chạy mã Python [được điều chỉnh theo đường dẫn của bạn] và bạn sẽ nhận được bộ dữ liệu sau:

            Product  Price
0  Desktop Computer    700
1            Tablet    250
2           Printer    120
3            Laptop   1200

Lưu ý rằng chúng tôi có kết quả giống như những kết quả được lưu trữ trong tệp Excel.

Lưu ý: Bạn sẽ phải cài đặt gói bổ sung nếu bạn gặp lỗi sau khi chạy mã:: you will have to install an additional package if you get the following error when running the code:

Bước nhập khẩu: Thiếu phụ thuộc tùy chọn ‘XLRD

Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt OpenPyXL cho các tệp .xlsx:

pip install openpyxl

Bước tùy chọn: Chọn tập hợp con của các cột

Bây giờ nếu bạn muốn chọn một cột hoặc cột cụ thể từ tệp Excel?

Ví dụ: nếu bạn muốn chỉ chọn cột sản phẩm thì sao? Nếu trường hợp đó, bạn có thể chỉ định tên cột này như đã bị bắt dưới đây:

import pandas as pd

data = pd.read_excel[r'C:\Users\Ron\Desktop\Product List.xlsx'] 
df = pd.DataFrame[data, columns=['Product']]
print[df]

Chạy mã [sau khi điều chỉnh đường dẫn tệp] và bạn sẽ chỉ nhận được cột sản phẩm:

            Product
0  Desktop Computer
1            Tablet
2           Printer
3            Laptop

Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của họ bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột sản phẩm và giá cả, bạn có thể sử dụng cú pháp này:

import pandas as pd

data = pd.read_excel[r'C:\Users\Ron\Desktop\Product List.xlsx'] 
df = pd.DataFrame[data, columns=['Product', 'Price']]
print[df]

Bạn cần phải đảm bảo rằng các tên cột được chỉ định trong mã khớp chính xác với các tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NAN.

Sự kết luận

Bạn chỉ thấy cách nhập một tệp excel vào Python bằng gấu trúc.

Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu trường hợp đó, bạn có thể muốn kiểm tra hướng dẫn sau đây rằng & nbsp; giải thích cách nhập tệp CSV vào Python bằng Pandas.

Bạn cũng có thể kiểm tra tài liệu Pandas & nbsp; để tìm ra & nbsp; thêm về các tùy chọn khác nhau mà bạn có thể áp dụng liên quan đến read_excel.

Đọc các tệp excel [tiện ích mở rộng: .xlsx, .xls] với python pandas. Để đọc tệp Excel dưới dạng DataFrame, hãy sử dụng phương thức Pandas

            Product  Price
0  Desktop Computer    700
1            Tablet    250
2           Printer    120
3            Laptop   1200
0.

Bạn có thể đọc tờ đầu tiên, tờ cụ thể, nhiều tờ hoặc tất cả các tờ. Pandas chuyển đổi điều này thành cấu trúc DataFrame, là một cấu trúc giống như bảng.

Khóa học liên quan: Phân tích dữ liệu với Python Pandas Data Analysis with Python Pandas

Excel

Trong bài viết này, chúng tôi sử dụng một tệp excel ví dụ. Các chương trình mà chúng tôi sẽ làm cho đọc xuất sắc thành Python.

Tạo một tệp Excel với hai tờ, Sheet1 và Sheet2. Bạn có thể sử dụng bất kỳ chương trình hỗ trợ Excel nào như Microsoft Excel hoặc Google Sheets.

Nội dung của mỗi nội dung như sau:

sheet1:

sheet2:

Cài đặt XLRD

Gấu trúc. .read_excel a.] uses a library called xlrd internally.

XLRD là một thư viện để đọc [đầu vào] các tệp excel [.xlsx, .xls] trong python.

Bài viết liên quan: Cách sử dụng XLRD, XLWT để đọc và ghi các tệp Excel trong Python

Nếu bạn gọi pandas.read_excel s [] trong môi trường không cài đặt XLRD, bạn sẽ nhận được thông báo lỗi tương tự như sau:

Bộ nhập khẩu: Cài đặt XLRD> = 0.9.0 cho hỗ trợ Excel

XLRD có thể được cài đặt với PIP. [PIP3 tùy thuộc vào môi trường]

________số 8
$ pip install xlrd

Đọc Excel

Chỉ định đường dẫn hoặc URL của tệp Excel trong đối số đầu tiên. Nếu có nhiều bảng, chỉ có bảng đầu tiên được Pandas.it đọc là DataFrame.
If there are multiple sheets, only the first sheet is used by pandas.
It reads as DataFrame.

import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
0
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
1

Mã trên xuất ra nội dung bảng Excel:

import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
2
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
3

Nhận tờ

Bạn có thể chỉ định trang tính để đọc với argune feet_name.

Chỉ định theo số [bắt đầu từ 0]

import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
4
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
5
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
2
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
3

Nhận tờ

import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
4
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
5
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
2
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
3

Nhận tờ

Bạn có thể chỉ định trang tính để đọc với argune feet_name.

Chỉ định theo số [bắt đầu từ 0]

import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
4
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
5

import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
7

Chỉ định theo tên trang:
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
9

Tải nhiều tờ

Cũng có thể chỉ định một danh sách trong armentSheet_name. Nó là ok ngay cả khi đó là một số 0 bắt đầu hoặc tên trang tính.

Số được chỉ định hoặc tên trang tính là khóa khóa và gấu trúc dữ liệu. DataFrame được đọc dưới dạng từ điển theo thứ tự đã đặt hàng với giá trị giá trị.
import pandas as pd

df = pd.read_excel[r'C:\Users\Ron\Desktop\Product List.xlsx']
print[df]
3

Sau đó, bạn có thể sử dụng nó như thế này:

Chỉ định theo tên trang:
import pandas as pd

df = pd.read_excel[r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name']
print[df]
9

Tải nhiều tờ Data Analysis with Python Pandas

Python có thể đọc các tệp excel không?

Về mặt kỹ thuật, nhiều gói cho phép chúng tôi làm việc với các tệp Excel trong Python. Tuy nhiên, trong hướng dẫn này, chúng tôi sẽ sử dụng các thư viện Pandas và XLRD để tương tác với sổ làm việc Excel. Về cơ bản, bạn có thể nghĩ về một gấu trúc DataFrame như một bảng tính với các hàng và cột được lưu trữ trong các đối tượng loạt.multiple packages allow us to work with Excel files in Python. However, in this tutorial, we'll use pandas and xlrd libraries to interact with Excel workbooks. Essentially, you can think of a pandas DataFrame as a spreadsheet with rows and columns stored in Series objects.

Làm cách nào để xem bảng tính Excel trong Python?

Các bước để nhập một tệp Excel vào Python bằng Pandas..
Bước 1: Chụp đường dẫn tệp.Đầu tiên, bạn sẽ cần ghi lại đường dẫn đầy đủ nơi lưu trữ tệp Excel trên máy tính của bạn.....
Bước 2: Áp dụng mã Python.....
Bước 3: Chạy mã Python để nhập tệp Excel ..

Làm thế nào đọc tất cả các tệp excel trong Python?

Khoa học dữ liệu thực tế sử dụng Python để đọc tất cả các tệp Excel trong một thư mục, sử dụng mô -đun GLOB và phương thức read_excel [].use the Glob module and the read_excel[] method.

Thư viện nào được sử dụng để đọc tệp Excel trong Python?

OpenPyXL là một thư viện Python được sử dụng để đọc từ tệp excel hoặc ghi vào tệp excel.Các nhà khoa học dữ liệu sử dụng OpenPyXL để phân tích dữ liệu, sao chép dữ liệu, khai thác dữ liệu, biểu đồ vẽ, bảng kiểu dáng, thêm công thức, v.v. is a Python library that is used to read from an Excel file or write to an Excel file. Data scientists use Openpyxl for data analysis, data copying, data mining, drawing charts, styling sheets, adding formulas, and more.

Bài Viết Liên Quan

Chủ Đề