21
Mới! Lưu câu hỏi hoặc câu trả lời và sắp xếp nội dung yêu thích của bạn. Tìm hiểu thêm.
Learn more.
Tôi đã đọc một tờ Excel vào một bản dữ liệu gấu trúc theo cách này:
import pandas as pd
xl = pd.ExcelFile["Path + filename"]
df = xl.parse["Sheet1"]
Giá trị ô đầu tiên của mỗi cột được chọn làm tên cột cho DataFrame, tôi muốn chỉ định tên cột của riêng tôi, làm cách nào để làm điều này?
Đã hỏi ngày 27 tháng 6 năm 2013 lúc 6:05Jun 27, 2013 at 6:05
Chủ đề này đã 5 tuổi và đã lỗi thời, nhưng vẫn xuất hiện trên đầu danh sách từ một tìm kiếm chung. Vì vậy, tôi đang thêm ghi chú này. Pandas Now [v0.22] có một từ khóa để chỉ định tên cột tại các tệp excel phân tích cú pháp. Sử dụng:
import pandas as pd
xl = pd.ExcelFile["Path + filename"]
df = xl.parse["Sheet 1", header=None, names=['A', 'B', 'C']]
Nếu Header = Không có được đặt, PD dường như coi hàng đầu tiên là tiêu đề và xóa nó trong quá trình phân tích cú pháp. Nếu thực sự có một tiêu đề, nhưng bạn không muốn sử dụng nó, bạn có hai lựa chọn, chỉ [1] chỉ sử dụng "tên" kwarg; hoặc [2] sử dụng "tên" với tiêu đề = không có và bỏ qua = 1. Cá nhân tôi thích tùy chọn thứ hai, vì nó rõ ràng lưu ý rằng tệp đầu vào không ở định dạng tôi muốn và tôi đang làm gì đó để đi xung quanh nó.
Đã trả lời ngày 20 tháng 4 năm 2018 lúc 14:21Apr 20, 2018 at 14:21
1
Tôi nghĩ rằng việc thiết lập chúng sau đó là cách duy nhất trong trường hợp này, vì vậy nếu bạn có bốn cột trong DataFrame của mình:
df.columns = ['W','X','Y','Z']
Nếu bạn biết trước những gì các tiêu đề trong phần khai thác thì có lẽ tốt hơn là đổi tên chúng, thì điều này sẽ đổi tên W thành A, v.v.
df.rename[columns={'W':'A', 'X':'B', etc}]
Đã trả lời ngày 27 tháng 6 năm 2013 lúc 6:12Jun 27, 2013 at 6:12
Rutger Kassiesrutger KassiesRutger Kassies
57.3K16 Huy hiệu vàng109 Huy hiệu bạc95 Huy hiệu Đồng16 gold badges109 silver badges95 bronze badges
1
Như Ram đã nói, bài đăng này xuất hiện trên đầu và có thể hữu ích cho một số .... trong Pandas 0,24.2 [cũng có thể sớm hơn], bản thân Read_excel có khả năng bỏ qua các tiêu đề nguồn và đặt tên COL của riêng bạn và Một vài điều khiển tốt khác:
DID = pd.read_excel[file1, sheet_name=0, header=None, usecols=[0, 1, 6], names=['A', 'ID', 'B'], dtype={2:str}, skiprows=10]
# for example....
# usecols => read only specific col indexes
# dtype => specifying the data types
# skiprows => skip number of rows from the top.
Đã trả lời ngày 11 tháng 4 năm 2019 lúc 0:40Apr 11, 2019 at 0:40
LokurokuLoku
Bạc bạc 2012 huy hiệu đồng2 silver badges5 bronze badges
Gọi .parse
với đối số từ khóa header=None
.
df = xl.parse["Sheet1", header=None]
Đã trả lời ngày 27 tháng 6 năm 2013 lúc 6:25Jun 27, 2013 at 6:25
Falsetrufalsetrufalsetru
344K58 Huy hiệu vàng687 Huy hiệu bạc610 Huy hiệu Đồng58 gold badges687 silver badges610 bronze badges
Trong trường hợp tờ Excel chỉ chứa dữ liệu không có tiêu đề:
df=pd.read_excel["the excel file",header=None,names=["A","B","C"]]
Trong trường hợp tờ Excel đã chứa tên tiêu đề, thì hãy sử dụng
import pandas as pd
xl = pd.ExcelFile["Path + filename"]
df = xl.parse["Sheet 1", header=None, names=['A', 'B', 'C']]
0 để bỏ qua dòng:df=pd.read_excel["the excel file",header=None,names=["A","B","C"],skiprows=1]
Wtower
17.7K11 Huy hiệu vàng102 Huy hiệu bạc75 Huy hiệu đồng11 gold badges102 silver badges75 bronze badges
Đã trả lời ngày 4 tháng 8 năm 2020 lúc 6:11Aug 4, 2020 at 6:11
code-freezecode-freezecode-freeze
4356 Huy hiệu bạc7 Huy hiệu Đồng6 silver badges7 bronze badges