Df [] làm gì trong python?
Trong bài viết này, chúng ta tìm hiểu cách đặt lại chỉ mục trong Pandas DataFrame. Chúng tôi thảo luận về tất cả các trường hợp đặt lại chỉ mục hàng của DataFrame đơn giản và đa cấp Show
DataFrame là cấu trúc dạng bảng trong thư viện gấu trúc Python. Nó đại diện cho mỗi hàng và cột bằng nhãn. Nhãn hàng được gọi là chỉ mục, trong khi nhãn cột được gọi là chỉ mục/tiêu đề cột Sau khi thực hiện các thao tác và lọc trên tập dữ liệu lớn, cuối cùng chúng ta cũng có được DataFrame chính xác theo yêu cầu. Nhưng, nó mang chỉ mục của tập dữ liệu gốc. Trong trường hợp như vậy, chúng ta cần đặt lại chỉ mục của DataFrame Mục lục
Hàm Original DataFrame: Name Age Marks s1 Joe 20.0 85.10 s2 Nat 21.0 77.80 s3 Sam NaN NaN s4 Harry 19.0 91.54 DataFrame after dropping NA: Name Age Marks s1 Joe 20.0 85.10 s2 Nat 21.0 77.80 s4 Harry 19.0 91.54 DataFrame after resetting index: index Name Age Marks 0 s1 Joe 20.0 85.10 1 s2 Nat 21.0 77.80 2 s4 Harry 19.0 91.542Sau khi thả và lọc các hàng, chức năng này được sử dụng để đặt lại chỉ mục của Khung dữ liệu Python kết quả. Hãy thảo luận chi tiết về cách sử dụng hàm Original DataFrame:
2cú pháp
Thông số
trả lại DataFrame với chỉ mục mới hoặc Không có nếu Original DataFrame:
9Đặt lại chỉ mục để bắt đầu từ 0Cách đặt lại chỉ mục trong DataFrame của gấu trúc
Ví dụ Chúng tôi có một Khung dữ liệu dành cho sinh viên với chỉ số hàng 's1', 's2'. tương tự như vậy. Nó chứa một hàng có các giá trị bị thiếu mà chúng tôi muốn xóa. Sau khi chúng tôi xóa nó bằng hàm 9, chỉ mục hàng của nó vẫn như cũ. Nhưng bây giờ, chỉ mục không theo thứ tựTrong trường hợp như vậy, hãy xem cách đặt lại chỉ mục thành chuỗi số bằng cách sử dụng Original DataFrame:
2 0đầu ra Original DataFrame:
Đặt lại chỉ mục mà không có cột mớiTheo mặc định, Original DataFrame:
2 thêm chỉ mục hàng hiện tại dưới dạng cột 'chỉ mục' mới trong DataFrame. Nếu chúng ta không muốn thêm cột mới, chúng ta có thể sử dụng tham số drop
Ví dụ Hãy xem cách chúng tôi có thể đặt lại chỉ mục mà không cần thêm cột mới
đầu ra 3Đặt lại chỉ mục tại chỗTrong các ví dụ trên, bất cứ khi nào chúng tôi thực hiện thao tác đặt lại chỉ mục, gấu trúc đã tạo một bản sao mới của DataFrame vì sửa đổi không đúng chỗ Chỉ định Original DataFrame:
9 để đặt lại chỉ mục trong DataFrame hiện tại thay vì tạo bản sao của nó
Ghi chú. Bạn không cần gán lại kết quả cho một biến vì chúng tôi đang thực hiện các sửa đổi tại chỗ Ví dụ Original DataFrame:
0đầu ra Original DataFrame:
1Đặt lại chỉ mục bắt đầu từ 1Giả sử chúng ta có một tập dữ liệu khổng lồ cần lọc. Sau khi lọc DataFrame, nó vẫn mang chỉ mục gốc. Khi chúng tôi muốn đặt lại chỉ mục của DataFrame sao cho chỉ mục mới sẽ bắt đầu bằng 1, chúng tôi có thể thực hiện điều đó theo hai bước,
Ví dụ Trong ví dụ dưới đây, trước tiên chúng tôi đặt lại chỉ mục thành chuỗi số và sau đó thêm 1 vào mỗi chỉ mục Original DataFrame:
4đầu ra Original DataFrame:
5Đặt lại chỉ mục cho phạm vi sốTrong Khung dữ liệu sinh viên của chúng tôi, giả sử chúng tôi muốn gán số Nhận dạng cho từng sinh viên bắt đầu từ 101. Chúng ta có thể sử dụng tham số 38 của DataFrame để thay đổi chỉ mục dưới dạng một dãy số bắt đầu bằng một số cụ thểĐầu tiên, chúng ta cần tạo dãy số và sau đó gán nó cho Original DataFrame:
00 để đặt lại chỉ số ban đầuVí dụ Trong ví dụ dưới đây, pd. Hàm RangeIndex() được sử dụng để tạo dãy số bắt đầu từ 101 cho đến hàng cuối cùng i. e. Original DataFrame:
01. Chỉ định phạm vi này cho Original DataFrame:
02 Original DataFrame:
0đầu ra 00Đặt lại chỉ mục và thay đổi tên cộtNhư chúng ta đã thảo luận, Original DataFrame:
2 thêm chỉ mục hiện tại dưới dạng một cột mới với tên 'chỉ mục' trong Khung dữ liệu. Nếu chúng ta muốn đặt tên cho một cột mới được thêm vào như vậy, thì chúng ta cần sử dụng hàm Original DataFrame:
04 với Original DataFrame:
2Ví dụ Hãy xem cách thực hiện chuỗi phương thức của hàm Original DataFrame:
2 và Original DataFrame:
04 để đổi tên cột 'chỉ mục' mới thành 'ID' 01đầu ra 02Đặt lại chỉ mục đa cấpKhi DataFrame của gấu trúc Python có nhiều tiêu đề cột hoặc chỉ mục hàng, thì được gọi là DataFrame đa cấp hoặc phân cấp. Chúng tôi có thể áp dụng Original DataFrame:
08 trên DataFrame đa chỉ mục như vậySơ đồ bên dưới hiển thị Khung dữ liệu phân cấp của dữ liệu Sinh viên với tiêu đề hai cột trong đó nhãn cột 'Tên' và 'Điểm' ở cấp 0 và 'Họ' và 'Tỷ lệ phần trăm' ở cấp 1. Tương tự, các chỉ mục hai hàng trong đó chỉ mục 'Tiêu chuẩn' ở cấp 0 và 'Lớp' ở cấp 1 của Khung dữ liệu Ví dụ Ví dụ dưới đây cho thấy cách tạo DataFrame như vậy 03Bây giờ chúng ta xem cách đặt lại chỉ mục của DataFrame đa cấp bằng cách sử dụng Original DataFrame:
08. Theo mặc định, nó đặt lại chỉ mục của tất cả các cấp và thêm phạm vi chỉ mục mới trong DataFrame 04đầu ra 05Đặt lại chỉ mục theo cấp độNhư chúng ta đã thấy, trong trường hợp chỉ mục đa cấp, theo mặc định DataFrame. reset_index() áp dụng cho chỉ mục của tất cả các cấp. Nếu chúng ta chỉ muốn đặt lại chỉ số của mức cụ thể, chúng ta có thể sử dụng tham số Original DataFrame:
4 của hàm Original DataFrame:
2Nó lấy một vị trí cấp độ hoặc tên cấp độ làm đầu vào để chỉ đặt lại chỉ mục cụ thể đó Ví dụ Trong ví dụ dưới đây, chúng tôi chỉ đặt lại chỉ mục của cấp độ 'Chuẩn' 06đầu ra 07Đặt lại chỉ mục và tạo cột mới ở cấp độNhư chúng ta đã quan sát ở phần trên, theo mặc định, Original DataFrame:
2 tất cả cột mới ở cấp độ đầu tiên, tôi. e. , mức 0. Nếu chúng ta muốn thêm cột chỉ số mới vào các cấp độ khác, chúng ta có thể sử dụng tham số Original DataFrame:
7Nó lấy tên cấp độ hoặc vị trí cấp độ làm đầu vào nếu các cột có nhiều cấp độ, do đó, nó xác định cấp độ mà các nhãn được chèn vào Ví dụ Trong ví dụ dưới đây, nó chỉ đặt lại chỉ mục của cấp độ 'Chuẩn' và thêm nó làm cột mới ở cấp độ 1 08đầu ra 09Đặt lại chỉ mục và đặt tên cho cấp độ khácNhư chúng ta thấy ở phần trên, trong DataFrame đa cấp, chúng ta đã thêm chỉ mục ‘Standard’ ở cấp 1. Trong trường hợp cần đổi tên tầng khác, chúng ta cần sử dụng tham số Original DataFrame:
8 của DataFrameChúng tôi có thể chỉ định bất kỳ nhãn cột hiện có nào mà theo đó cột mới sẽ được chỉ định. Nếu chúng ta chỉ định nhãn mới, thì nó sẽ tạo một Ví dụ Trong ví dụ bên dưới, chúng tôi tạo một cột mới từ chỉ mục 'Chuẩn' ở cấp 1 và gán nhãn cột mới 'New_Header' ở cấp 0 của cột mới này Kết quả của việc áp dụng phương thức sau DF head() cho DataFrame DF trong python là gì?DataFrame - hàm head()
. Hàm này trả về n hàng đầu tiên cho đối tượng dựa trên vị trí. Nó rất hữu ích để kiểm tra nhanh xem đối tượng của bạn có đúng loại dữ liệu trong đó không. Số hàng để chọn. get the first n rows. This function returns the first n rows for the object based on position. It is useful for quickly testing if your object has the right type of data in it. Number of rows to select.
Hình dạng DF được sử dụng để làm gì?Hình dạng của DataFrame là một bộ kích thước mảng cho biết số lượng hàng và cột của DataFrame nhất định .
DF['Col'] unique() trả về cái gì?Khung dữ liệu(). Phương thức unique() được sử dụng khi chúng ta xử lý một cột duy nhất của DataFrame và trả về tất cả các phần tử duy nhất của một cột . Phương thức này trả về một DataFrame chứa các phần tử duy nhất của một cột, cùng với các nhãn chỉ mục tương ứng của chúng. |