Hướng dẫn how do i extract rows and columns from a csv file in python? - làm cách nào để trích xuất các hàng và cột từ tệp csv trong python?
Chúng tôi sẽ tiếp tục tập phim này từ nơi chúng tôi rời khỏi tập cuối. Nếu bạn đã khởi động lại Jupyter hoặc bạn muốn sử dụng một cuốn sổ mới, hãy chắc chắn rằng bạn nhập gấu trúc và đã đọc bộ dữ liệu SN7577.TAB vào DataFrame.
Chọn các hàng và cột từ một khung dữ liệu gấu trúcNếu chúng ta biết những cột nào chúng ta muốn trước khi chúng ta đọc dữ liệu từ tệp, chúng ta có thể nói 6 chỉ nhập các cột đó bằng cách chỉ định các cột theo số chỉ mục của chúng (bắt đầu từ 0) dưới dạng danh sách vào tham số 7. Ngoài ra, chúng tôi cũng có thể cung cấp một danh sách các tên cột.
Bây giờ chúng ta hãy giả sử rằng chúng ta đọc trong tệp hoàn chỉnh hiện có trong DataFrame 8, làm thế nào bây giờ chúng ta có thể tham khảo các cột cụ thể?Có hai cách thực hiện việc này bằng cách sử dụng tên cột (hoặc nhãn):
Nếu chúng ta quan tâm đến nhiều cột, phương thức thứ 2 ở trên không thể được sử dụng. Tuy nhiên, trong lần đầu tiên, mặc dù chúng tôi đã sử dụng một chuỗi với giá trị 9, chúng tôi cũng có thể đã cung cấp một danh sách các chuỗi. Hãy nhớ rằng các danh sách được đính kèm trong 0.
Lọc theo hàngBạn có thể lọc DataFrame bằng các hàng bằng cách chỉ định một phạm vi dưới dạng 1. 2 là hàng đầu tiên và 3 là một hàng ngoài hàng cuối cùng được yêu cầu.
Bạn có thể lọc DataFrame bằng các hàng bằng cách chỉ định một phạm vi dưới dạng (1286, 6) Index(['Q1', 'Q2', 'Q3', 'sex', 'age', 'agegroups'], dtype='object') Index(['Q1', 'Q2', 'Q3', 'sex', 'age', 'agegroups'], dtype='object') 1. (1286, 6) Index(['Q1', 'Q2', 'Q3', 'sex', 'age', 'agegroups'], dtype='object') Index(['Q1', 'Q2', 'Q3', 'sex', 'age', 'agegroups'], dtype='object') 2 là hàng đầu tiên và (1286, 6) Index(['Q1', 'Q2', 'Q3', 'sex', 'age', 'agegroups'], dtype='object') Index(['Q1', 'Q2', 'Q3', 'sex', 'age', 'agegroups'], dtype='object') 3 là một hàng ngoài hàng cuối cùng được yêu cầu.Điều gì xảy ra nếu chúng ta yêu cầu một hàng thay vì phạm vi?
Bạn gặp lỗi nếu bạn chỉ chỉ định 4. Bạn cần sử dụng 5 hoặc 6 để trả lại hàng đầu tiên. 7 luôn được yêu cầu. Bạn có thể sử dụng 7 một mình để trả lại tất cả các hàng.
Sử dụng các tiêu chí để lọc hàng Nhiều khả năng bạn sẽ muốn chọn các hàng từ DataFrame dựa trên một số tiêu chí, chẳng hạn như tất cả các hàng trong đó giá trị cho Q2 là -1. Các tiêu chí có thể phức tạp hơn và không giới hạn trong một giá trị của một cột: Chúng ta có thể kết hợp lựa chọn hàng với lựa chọn cột: 1 0Chọn các hàng trên chỉ mục hàng được sử dụng hạn chế trừ khi bạn cần chọn một phạm vi tiếp giáp của hàng. 2Tuy nhiên, có một cách khác để chọn hàng bằng chỉ mục hàng: 3Sử dụng phương thức 9 cho kết quả tương tự như ví dụ trước của chúng tôi. 4Tuy nhiên, bây giờ chúng tôi có thể chỉ định một giá trị duy nhất và quan trọng hơn là chúng tôi có thể sử dụng hàm # Both of these statements are the same print(df_SN7577['Q1']) # and print(df_SN7577.Q1) 0 để chỉ ra các bản ghi mà chúng tôi muốn. Điều này có thể hữu ích để thực hiện các lựa chọn giả ngẫu nhiên của các hàng từ khắp DataFrame.Bạn cũng có thể chỉ định các phạm vi cột bằng phương thức 9 một lần nữa bằng cách sử dụng các số chỉ mục cột: 5
|