Pd read_excel

Nếu Spark cơ bản dưới 3. 0, tham số dưới dạng chuỗi không được hỗ trợ. Bạn có thể sử dụng ps. from_pandas[pd. read_Excel[…]] như một giải pháp thay thế

sheet_namestr, int, list hoặc Không, mặc định 0

Chuỗi được sử dụng cho tên trang tính. Số nguyên được sử dụng ở các vị trí bảng không được lập chỉ mục. Danh sách các chuỗi/số nguyên được sử dụng để yêu cầu nhiều trang tính. Chỉ định Không có để nhận tất cả các trang tính

trường hợp có sẵn

  • Mặc định là 0. Tờ đầu tiên dưới dạng DataFrame

  • 1. Tờ thứ 2 dưới dạng DataFrame

  • "Sheet1". Tải trang tính có tên “Sheet1”

  • [0, 1, "Sheet5"]. Tải đầu tiên, thứ hai và trang tính có tên “Sheet5” dưới dạng lệnh của DataFrame

  • Không có. Tất cả các tờ

tiêu đề, danh sách int, mặc định 0

Hàng [được lập chỉ mục 0] để sử dụng cho các nhãn cột của Khung dữ liệu được phân tích cú pháp. Nếu một danh sách các số nguyên được thông qua, các vị trí hàng đó sẽ được kết hợp thành một MultiIndex. Sử dụng Không có nếu không có tiêu đề

giống như namearray, mặc định Không có

Danh sách các tên cột để sử dụng. Nếu tệp không chứa hàng tiêu đề, thì bạn nên chuyển rõ ràng header=None

index_colint, danh sách int, mặc định Không có

Cột [được lập chỉ mục 0] để sử dụng làm nhãn hàng của DataFrame. Vượt qua Không nếu không có cột như vậy. Nếu một danh sách được thông qua, các cột đó sẽ được kết hợp thành một MultiIndex. Nếu một tập hợp con dữ liệu được chọn với usecols, thì index_col dựa trên tập hợp con đó

mặc định usecolsint, str, list-like hoặc callable Không có

Trả về một tập hợp con của các cột

  • Nếu không, sau đó phân tích tất cả các cột

  • Nếu str, thì biểu thị danh sách các chữ cái cột Excel và phạm vi cột được phân tách bằng dấu phẩy [e. g. "MỘT. E” hoặc “A,C,E. f”]. Phạm vi bao gồm cả hai bên

  • Nếu danh sách int, thì cho biết danh sách số cột sẽ được phân tích cú pháp

  • Nếu danh sách chuỗi, thì cho biết danh sách tên cột sẽ được phân tích cú pháp

  • Nếu có thể gọi được, sau đó đánh giá từng tên cột dựa vào tên đó và phân tích cú pháp cột nếu có thể gọi được trả về True

bóp, mặc định Sai

Nếu dữ liệu được phân tích cú pháp chỉ chứa một cột thì trả về Sê-ri

tên dtypeType hoặc lệnh của cột -> loại, mặc định Không có

Kiểu dữ liệu cho dữ liệu hoặc cột. e. g. {'một'. np. float64, 'b'. np. int32} Sử dụng đối tượng để bảo toàn dữ liệu như được lưu trữ trong Excel và không diễn giải dtype. Nếu bộ chuyển đổi được chỉ định, chúng sẽ được áp dụng THAY THẾ cho chuyển đổi dtype

enginetr, mặc định Không có

Nếu io không phải là bộ đệm hoặc đường dẫn, điều này phải được đặt để xác định io. Các giá trị được chấp nhận là Không có hoặc xlrd

bộ chuyển đổi, mặc định Không có

Dict của các chức năng để chuyển đổi các giá trị trong các cột nhất định. Các khóa có thể là số nguyên hoặc nhãn cột, giá trị là các hàm nhận một đối số đầu vào, nội dung ô Excel và trả về nội dung đã chuyển đổi

true_valueslist, mặc định Không có

Các giá trị được coi là True

false_valueslist, mặc định Không có

Các giá trị được coi là Sai

giống như danh sách bỏ qua

Các hàng cần bỏ qua ở đầu [được lập chỉ mục 0]

nrowsint, mặc định Không có

Số hàng để phân tích cú pháp

na_valuesscalar, str, list-like hoặc dict, mặc định Không có

Các chuỗi bổ sung để nhận dạng là NA/NaN. Nếu dict được thông qua, các giá trị NA cụ thể trên mỗi cột. Theo mặc định, các giá trị sau được hiểu là NaN

keep_default_nabool, mặc định là True

Nếu na_values ​​được chỉ định và keep_default_na là Sai, các giá trị NaN mặc định sẽ bị ghi đè, nếu không, chúng sẽ được thêm vào

verbosebool, mặc định Sai

Cho biết số lượng giá trị NA được đặt trong các cột không phải là số

parse_datesbool, dạng danh sách hoặc dict, mặc định Sai

Hành vi như sau

  • bool. Nếu Đúng -> thử phân tích cú pháp chỉ mục

  • danh sách int hoặc tên. e. g. Nếu [1, 2, 3] -> thử phân tích từng cột 1, 2, 3 thành một cột ngày riêng biệt

  • danh sách các danh sách. e. g. Nếu [[1, 3]] -> kết hợp cột 1 và 3 và phân tích dưới dạng một cột ngày

  • chính tả, e. g. {{'foo'. [1, 3]}} -> phân tích cột 1, 3 thành ngày và gọi kết quả là 'foo'

Nếu một cột hoặc chỉ mục chứa một ngày không thể phân tích cú pháp, thì toàn bộ cột hoặc chỉ mục đó sẽ được trả về không thay đổi dưới dạng một kiểu dữ liệu đối tượng. Để phân tích cú pháp ngày giờ không theo tiêu chuẩn, hãy sử dụng pd.to_datetime sau pd.read_csv

Ghi chú. Đường dẫn nhanh tồn tại cho các ngày có định dạng iso8601

date_parserfunction, tùy chọn

Hàm sử dụng để chuyển đổi một chuỗi các cột chuỗi thành một mảng các thể hiện thời gian. Mặc định sử dụng 10 để thực hiện chuyển đổi. pandas-on-Spark sẽ cố gắng gọi date_parser theo ba cách khác nhau, chuyển sang cách tiếp theo nếu xảy ra ngoại lệ. 1] Chuyển một hoặc nhiều mảng [như được định nghĩa bởi parse_dates] làm đối số;

hàng ngàn, mặc định Không có

Dấu phân cách hàng nghìn để phân tích các cột chuỗi thành số. Lưu ý rằng tham số này chỉ cần thiết cho các cột được lưu dưới dạng TEXT trong Excel, mọi cột số sẽ tự động được phân tích cú pháp, bất kể định dạng hiển thị

commentstr, mặc định Không có

Nhận xét phần còn lại của dòng. Truyền một hoặc nhiều ký tự cho đối số này để biểu thị nhận xét trong tệp đầu vào. Bất kỳ dữ liệu nào giữa chuỗi nhận xét và cuối dòng hiện tại đều bị bỏ qua

bỏ qua footerint, mặc định 0

Hàng ở cuối để bỏ qua [0-lập chỉ mục]

convert_floatbool, mặc định là True

Chuyển đổi số float tích phân thành int [i. e. , 1. 0 -> 1]. Nếu Sai, tất cả dữ liệu số sẽ được đọc dưới dạng số float. Excel lưu trữ tất cả các số dưới dạng số float trong nội bộ

mangle_dupe_colsbool, mặc định là True

Các cột trùng lặp sẽ được chỉ định là 'X', 'X. 1’, …’X. N', thay vì 'X'...'X'. Truyền vào Sai sẽ khiến dữ liệu bị ghi đè nếu có tên trùng lặp trong các cột

PD read_excel là gì?

Chúng ta có thể sử dụng hàm read_excel[] của mô-đun pandas để đọc dữ liệu tệp excel vào đối tượng DataFrame . Nếu bạn nhìn vào một bảng excel, đó là một bảng hai chiều. Đối tượng DataFrame cũng đại diện cho cấu trúc dữ liệu dạng bảng hai chiều.

PD read_excel trả về cái gì?

gấu trúc. hàm read_excel[] được sử dụng để đọc bảng excel có phần mở rộng xlsx vào DataFrame của gấu trúc. Bằng cách đọc một trang tính, nó trả về một đối tượng DataFrame của gấu trúc, nhưng đọc hai trang tính, nó trả về một Dict of DataFrame .

Làm cách nào để đọc tệp xlsx trong gấu trúc Python?

Các bước để nhập tệp Excel vào Python bằng Pandas .
Bước 1. Chụp đường dẫn tập tin. Trước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn. .
Bước 2. Áp dụng mã Python. .
Bước 3. Chạy mã Python để nhập tệp Excel

PD read_excel có tạo DataFrame không?

DataFrame được tạo bằng hàm read_excel[] . Từ DataFrame, chúng ta có thể sử dụng dữ liệu một cột để tạo một danh sách bằng cách sử dụng tolist[].

Chủ Đề