Hướng dẫn dùng counting panda python
Văn phòng: Số 27-3RD, Sunrise D, The Manor Central Park, đường Nguyễn Xiển, phường Đại Kim, quận Hoàng Mai, TP. Hà Nội. Show
TEK4.VN giữ bản quyền nội dung trên website này. Cấm sao chép dưới mọi hình thức nếu không có sự chấp thuận bằng văn bản. (và
Để tránh
: Mục lục bài viết:
Các Pandas DataFrame là một cấu trúc có chứa dữ liệu hai chiều và tương ứng của nó nhãn . DataFrames được sử dụng rộng rãi trong khoa học dữ liệu , máy học , máy tính khoa học và nhiều lĩnh vực sử dụng nhiều dữ liệu khác. DataFrames tương tự như bảng SQL hoặc bảng tính mà bạn làm việc trong Excel hoặc Calc. Trong nhiều trường hợp, DataFrame nhanh hơn, dễ sử dụng hơn và mạnh hơn bảng hoặc bảng tính vì chúng là một phần không thể thiếu của hệ sinh thái Python và NumPy . Trong hướng dẫn này, bạn sẽ học:
Đã đến lúc bắt đầu với Pandas DataFrames! Giới thiệu Pandas DataFramePandas DataFrames là cấu trúc dữ liệu chứa:
Bạn có thể bắt đầu làm việc với DataFrames bằng cách nhập Pandas : >>>
Bây giờ bạn đã nhập Pandas, bạn có thể làm việc với DataFrames. Hãy tưởng tượng bạn đang sử dụng Pandas để phân tích dữ liệu về các ứng viên cho vị trí phát triển ứng dụng web bằng Python . Giả sử bạn quan tâm đến tên, thành phố, tuổi và điểm của ứng viên trong bài kiểm tra lập trình Python hoặc
Trong bảng này, dòng đầu tiên chứa các nhãn cột ( Bây giờ bạn có mọi thứ bạn cần để tạo Pandas DataFrame. Có một số cách để tạo Pandas DataFrame. Trong hầu hết các trường hợp, bạn sẽ sử dụng hàm Đối với ví dụ này, giả sử bạn đang sử dụng từ điển để chuyển dữ liệu: >>>
Cuối cùng, Bây giờ bạn đã sẵn sàng để tạo Pandas DataFrame: >>>
Đó là nó!
Hình này cho thấy các nhãn và dữ liệu từ Các nhãn hàng được viền màu xanh lam, trong khi các nhãn cột được viền màu đỏ và các giá trị dữ liệu được viền màu tím. Pandas DataFrames đôi khi có thể rất lớn, khiến việc xem xét tất cả các hàng cùng một lúc là không thực tế. Bạn có thể sử dụng >>>
Đó là cách bạn có thể hiển thị chỉ phần đầu hoặc phần cuối của Pandas DataFrame. Tham số Lưu ý: Có thể hữu ích khi coi Pandas DataFrame như một từ điển gồm các cột, hoặc Chuỗi Pandas, với nhiều tính năng bổ sung. Bạn có thể truy cập một cột trong Pandas DataFrame giống như cách bạn lấy giá trị từ từ điển: >>>
Đây là cách thuận tiện nhất để lấy một cột từ Pandas DataFrame. Nếu tên của cột là một chuỗi là mã định danh Python hợp lệ , thì bạn có thể sử dụng ký hiệu dấu chấm để truy cập nó. Nghĩa là, bạn có thể truy cập cột giống như cách bạn lấy thuộc tính của một cá thể lớp : >>>
Đó là cách bạn có được một cột cụ thể. Bạn đã trích xuất cột tương ứng với nhãn Điều quan trọng cần lưu ý là bạn đã trích xuất cả dữ liệu và nhãn hàng tương ứng: Mỗi cột của Pandas DataFrame là một ví dụ của >>>
Trong trường hợp này, Bạn cũng có thể truy cập vào toàn bộ một hàng với các accessor >>>
Lần này, bạn đã trích xuất hàng tương ứng với nhãn Hàng được trả về cũng là một ví dụ của Tạo dữ liệu gấu trúcNhư đã đề cập, có một số cách để tạo Pandas DataFrame. Trong phần này, bạn sẽ học cách làm điều này bằng cách sử dụng hàm
Ngoài ra còn có các phương pháp khác mà bạn có thể tìm hiểu trong tài liệu chính thức . Bạn có thể bắt đầu bằng cách nhập Pandas cùng với NumPy , mà bạn sẽ sử dụng trong các ví dụ sau: >>>
Đó là nó. Bây giờ bạn đã sẵn sàng để tạo một số DataFrames. Tạo dữ liệu gấu trúc bằng từ điểnNhư bạn đã thấy, bạn có thể tạo Pandas DataFrame bằng từ điển Python: >>>
Các khóa của từ điển là nhãn cột của DataFrame và giá trị từ điển là giá trị dữ liệu trong các cột DataFrame tương
ứng. Các giá trị có thể được chứa trong một tuple , danh sách , mảng NumPy một chiều , đối tượng Pandas Có thể kiểm soát thứ tự của các cột bằng >>>
Như bạn thấy, bạn
đã chỉ định các nhãn hàng Tạo dữ liệu gấu trúc với danh sáchMột cách khác để tạo Pandas DataFrame là sử dụng danh sách các từ điển: >>>
Một lần nữa, khóa từ điển là nhãn cột và giá trị từ điển là giá trị dữ liệu trong DataFrame. Bạn cũng có thể sử dụng danh sách lồng nhau hoặc danh sách các danh sách làm giá trị dữ liệu. Nếu bạn làm vậy, thì nên chỉ định rõ ràng các nhãn của cột, hàng hoặc cả hai khi bạn tạo DataFrame: >>>
Đó là cách bạn có thể sử dụng danh sách lồng nhau để tạo Pandas DataFrame. Bạn cũng có thể sử dụng danh sách các bộ giá trị theo cách tương tự. Để làm như vậy, chỉ cần thay thế các danh sách lồng nhau trong ví dụ trên bằng các bộ giá trị. Tạo dữ liệu gấu trúc với Mảng NumPyBạn có thể truyền mảng NumPy hai chiều cho hàm >>>
Mặc dù ví dụ này trông gần giống với cách triển khai danh sách lồng nhau ở trên, nhưng nó có một ưu điểm: Bạn có thể chỉ định tham số tùy chọn Khi >>>
Như bạn có thể thấy, khi bạn thay đổi mục đầu tiên Lưu ý: Việc không sao chép các giá trị dữ liệu có thể giúp bạn tiết kiệm đáng kể thời gian và sức mạnh xử lý khi làm việc với các tập dữ liệu lớn. Nếu hành vi này không phải là những gì bạn muốn, thì bạn nên chỉ định Tạo dữ liệu gấu trúc từ tệpBạn có thể lưu và tải dữ liệu và nhãn từ Pandas DataFrame đến và từ một số loại tệp, bao gồm CSV, Excel, SQL, JSON, v.v. Đây là một tính năng rất mạnh mẽ. Bạn có thể lưu DataFrame ứng viên công việc của mình vào tệp CSV với >>>
Câu lệnh trên sẽ tạo ra một tệp CSV được gọi
Giờ bạn đã có tệp CSV chứa dữ liệu, bạn có thể tải tệp đó bằng >>>
Đó là cách bạn lấy Pandas DataFrame từ một tệp. Trong trường hợp này, Truy xuất nhãn và dữ liệuBây giờ bạn đã tạo DataFrame của mình, bạn có thể bắt đầu truy xuất thông tin từ nó. Với Pandas, bạn có thể thực hiện các hành động sau:
Pandas DataFrame Labels as SequencesBạn có thể lấy nhãn hàng của DataFrame với >>>
Bây giờ bạn có nhãn hàng và cột là các loại chuỗi đặc biệt. Như bạn có thể làm với bất kỳ chuỗi Python nào khác, bạn có thể nhận được một mục duy nhất: >>>
Ngoài việc trích xuất một mục cụ thể, bạn có thể áp dụng các thao tác trình tự khác, bao gồm cả việc lặp qua các nhãn của hàng hoặc cột. Tuy nhiên, điều này hiếm khi cần thiết vì Pandas cung cấp các cách khác để lặp qua DataFrames mà bạn sẽ thấy trong phần sau . Bạn cũng có thể sử dụng phương pháp này để sửa đổi các nhãn: >>>
Trong ví dụ này, bạn sử dụng Hãy nhớ rằng nếu bạn cố gắng sửa đổi một mục cụ thể của Dữ liệu dưới dạng Mảng NumPyĐôi khi bạn có thể muốn trích xuất dữ liệu từ Pandas DataFrame mà không có nhãn của nó. Để nhận mảng NumPy với dữ liệu chưa được gắn nhãn, bạn có thể sử
dụng >>>
Cả hai Tài liệu Pandas đề xuất sử dụng
Tuy nhiên, nó Loại dữ liệuCác loại các giá trị dữ liệu , hay còn gọi là kiểu dữ liệu hoặc dtypes , rất quan trọng vì họ xác định dung lượng bộ nhớ sử dụng DataFrame của bạn, cũng như tốc độ tính toán của nó và mức độ chính xác. Gấu trúc phụ thuộc rất nhiều vào kiểu dữ liệu NumPy . Tuy nhiên, Pandas 1.0 đã giới thiệu một số loại bổ sung:
Bạn có thể lấy các kiểu dữ liệu cho từng cột của Pandas DataFrame bằng >>>
Như bạn có thể thấy, Nếu bạn muốn sửa đổi
kiểu dữ liệu của một hoặc nhiều cột, thì bạn có thể sử dụng >>>
Tham số bắt buộc quan trọng nhất và duy nhất của Như bạn có thể thấy, các kiểu dữ liệu cho các cột Dữ liệu gấu trúcCác thuộc tính >>>
Các Bạn thậm chí có thể kiểm tra dung lượng bộ nhớ được sử
dụng bởi mỗi cột với >>>
Như bạn có thể thấy, Trong ví dụ trên, hai cột cuối cùng Truy cập và sửa đổi dữ liệuBạn đã học cách lấy một hàng hoặc cột cụ thể của Pandas DataFrame làm >>>
Trong ví dụ đầu tiên, bạn truy cập cột Nhận dữ liệu với người truy cậpNgoài trình truy cập >>>
Tổng cộng Pandas có bốn người truy cập:
Trong số này, >>>
Cũng giống như bạn có thể làm với NumPy, bạn có thể cung cấp các lát cùng với danh sách hoặc mảng thay vì chỉ số để có nhiều hàng hoặc cột: >>>
Trong ví dụ này, bạn sử dụng:
Cả hai câu lệnh đều trả về một Pandas DataFrame với giao của năm hàng và hai cột mong muốn. Điều này dẫn đến sự khác biệt rất quan trọng giữa Lý do bạn chỉ nhận được các chỉ số Bạn có thể bỏ qua các hàng và cột >>>
Trong ví dụ này, bạn chỉ định các chỉ số hàng mong muốn với lát cắt Thay vì sử dụng cấu trúc cắt, bạn cũng có thể sử dụng lớp Python được tích hợp sẵn >>> Bạn có thể thấy một trong những cách tiếp cận này thuận tiện hơn những cách khác tùy thuộc vào tình huống của bạn. Có thể sử dụng >>>
Ở đây, bạn đã sử dụng Thiết lập dữ liệu với trình truy cậpBạn có thể sử dụng trình truy cập để sửa đổi các phần của Pandas DataFrame bằng cách chuyển một chuỗi Python, mảng NumPy hoặc giá trị đơn lẻ: >>>
Câu lệnh Ví dụ sau cho thấy rằng bạn có thể sử
dụng các chỉ số phủ định >>>
Trong ví dụ này, bạn đã truy cập và sửa đổi cột cuối cùng ( Chèn và Xóa dữ liệuPandas cung cấp một số kỹ thuật tiện lợi để chèn và xóa hàng hoặc cột. Bạn có thể chọn trong số họ dựa trên tình hình và nhu cầu của bạn. Chèn và xóa hàngHãy tưởng tượng bạn muốn thêm một người mới vào danh sách ứng viên tuyển dụng của mình. Bạn có thể bắt đầu bằng cách tạo một >>>
Đối tượng mới có các nhãn tương ứng với các nhãn cột từ Bạn có thể thêm >>>
Tại đây, Bạn đã thêm một hàng mới với một lệnh gọi đến >>>
Tại đây, Chèn và Xóa các CộtCách đơn giản nhất để chèn một cột trong Pandas DataFrame là làm theo cùng một quy trình mà bạn sử dụng khi thêm một mục vào từ điển . Đây là cách bạn có thể thêm một cột chứa điểm của ứng viên của bạn trong một bài kiểm tra JavaScript : >>>
Bây giờ DataFrame ban đầu có thêm một cột Bạn không cần phải cung cấp một chuỗi giá trị đầy đủ. Bạn có thể thêm một cột mới với một giá trị duy nhất: >>>
DataFrame Nếu bạn đã sử dụng từ điển trước đây, thì cách chèn cột
này có thể quen thuộc với bạn. Tuy nhiên, nó không cho phép bạn chỉ định vị trí của cột mới. Nếu vị trí của cột mới là quan trọng, thì bạn có thể sử dụng >>>
Bạn vừa chèn một cột khác có điểm của bài kiểm tra Django . Tham số Bạn có thể xóa một hoặc nhiều cột khỏi Pandas DataFrame giống như cách bạn làm với từ điển Python thông thường, bằng cách sử dụng >>>
Bây giờ bạn có Bạn cũng có thể xóa một hoặc nhiều cột >>>
Bạn đã xóa cột Theo mặc định, Áp dụng các phép toán số họcBạn có thể áp dụng các phép toán số học cơ bản như cộng, trừ, nhân và chia cho Pandas >>>
Bạn có thể sử dụng kỹ thuật này để chèn một cột mới vào Pandas DataFrame. Ví dụ: hãy thử tính >>>
Bây giờ DataFrame của bạn có một cột với Áp dụng các hàm NumPy và SciPyHầu hết các quy trình NumPy và SciPy có thể được áp dụng cho Pandas Thay vì chuyển một mảng NumPy sang >>>
Hiện Nhưng đó không phải là tất cả! Bạn có thể sử dụng mảng NumPy được trả về >>>
Kết quả tương tự như trong ví dụ trước, nhưng ở đây bạn đã sử dụng hàm NumPy hiện có thay vì viết mã của riêng bạn. Sắp xếp dữ liệu gấu trúcBạn có thể sắp xếp một Pandas DataFrame với >>>
Ví dụ này sắp xếp DataFrame của bạn theo các giá trị trong cột Nếu bạn muốn sắp xếp theo nhiều cột, thì chỉ cần chuyển danh sách làm đối số cho >>>
Trong trường hợp này, DataFrame được sắp xếp theo cột Tham số tùy chọn Nếu bạn đã từng cố gắng sắp xếp các giá trị trong Excel , thì bạn có thể thấy cách tiếp cận Pandas hiệu quả và tiện lợi hơn nhiều. Khi bạn có một lượng lớn dữ liệu, Pandas có thể vượt trội hơn đáng kể so với Excel. Để biết thêm thông tin về cách sắp xếp trong Gấu trúc, hãy xem Sắp xếp theo gấu trúc: Hướng dẫn sắp xếp dữ liệu bằng Python của bạn . Lọc dữ liệuLọc dữ liệu là một tính năng mạnh mẽ khác của Pandas. Nó hoạt động tương tự như lập chỉ mục với mảng Boolean trong NumPy . Nếu bạn áp dụng một số hoạt động logic trên một >>>
Trong
trường hợp này, Bây giờ bạn có Chuỗi >>>
Như bạn có thể thấy, Bạn có thể tạo các biểu thức rất mạnh mẽ và phức tạp bằng cách kết hợp các phép toán logic với các toán tử sau:
Ví dụ: bạn có thể nhận được DataFrame với
các ứng viên có >>>
Biểu thức Bạn cũng có thể áp dụng các quy trình logic NumPy thay vì các toán tử. Đối với một số thao tác yêu
cầu lọc dữ liệu, sẽ thuận tiện hơn khi sử dụng >>>
Trong ví dụ này, điều kiện là Xác định thống kê dữ liệuPandas cung cấp nhiều phương pháp thống kê cho DataFrames. Bạn có thể nhận thống kê cơ bản cho các cột số của Pandas DataFrame với >>>
Tại đây, Nếu bạn muốn nhận thống kê cụ thể cho
một số hoặc tất cả các cột của mình, thì bạn có thể gọi các phương thức như >>>
Khi được áp dụng cho Pandas DataFrame, các phương pháp này trả về Chuỗi với kết quả cho mỗi cột. Khi được áp dụng cho một Để tìm hiểu thêm về tính toán thống kê với Gấu trúc, hãy xem Thống kê mô tả với Python và NumPy, SciPy và Pandas: Tương quan với Python . Xử lý dữ liệu bị thiếuDữ liệu bị thiếu là rất phổ biến trong khoa học dữ liệu và học máy. Nhưng đừng bao giờ sợ hãi! Pandas có các tính năng rất mạnh để làm việc với dữ liệu bị thiếu. Trên thực tế, tài liệu của nó có toàn bộ phần dành riêng để làm việc với dữ liệu bị thiếu . Gấu trúc thường đại diện cho dữ liệu bị thiếu bằng giá trị NaN (không phải số) . Trong
Python, bạn có thể nhận NaN với Dưới đây là ví dụ về Pandas DataFrame bị thiếu giá trị: >>>
Biến Tính toán với dữ liệu bị thiếuNhiều phương thức Pandas bỏ qua >>>
Trong ví dụ đầu tiên, Tuy nhiên,
nếu bạn hướng dẫn Làm đầy dữ liệu bị thiếuPandas có một số tùy chọn để điền hoặc thay thế các giá trị bị thiếu bằng các giá trị khác. Một trong những phương pháp thuận tiện nhất là
Đây là cách bạn có thể áp dụng các tùy chọn được đề cập ở trên: >>>
Trong ví dụ đầu tiên, hãy Một lựa chọn phổ biến khác là áp dụng phép nội suy và thay thế các giá trị bị thiếu bằng các giá trị được nội suy. Bạn có thể làm điều này với >>>
Như bạn có thể thấy, hãy Bạn cũng có thể sử dụng tham số tùy chọn
Cài đặt mặc định cho Xóa hàng và cột có dữ liệu bị thiếuTrong một số trường hợp nhất định, bạn có thể muốn xóa các hàng hoặc thậm chí các cột
có giá trị bị thiếu. Bạn có thể làm điều này với >>>
Trong trường hợp này, Lặp lại trên một dữ liệu gấu trúcNhư bạn đã học trước đó, các nhãn hàng và cột của DataFrame có thể được truy xuất dưới dạng chuỗi
với
Với >>>
Đó là cách bạn sử dụng Với >>>
Đó là cách bạn sử dụng Tương
tự, >>>
Bạn có thể chỉ định tên của tuple đã đặt tên với tham số Làm việc với chuỗi thời gianGấu trúc vượt trội trong việc xử lý chuỗi thời gian . Mặc dù chức năng này một phần dựa trên lịch ngày và thời gian của NumPy , nhưng Pandas cung cấp tính linh hoạt hơn nhiều. Tạo DataFrames với nhãn chuỗi thời gianTrong phần này, bạn sẽ tạo Pandas DataFrame bằng cách sử dụng dữ liệu nhiệt độ hàng giờ của một ngày. Bạn có thể bắt đầu bằng cách tạo một danh sách (hoặc bộ, mảng NumPy hoặc kiểu dữ liệu khác) với các giá trị dữ liệu, sẽ là nhiệt độ hàng giờ được tính bằng độ C : >>>
Bây giờ bạn có biến Bước tiếp theo là tạo một chuỗi ngày và giờ. Pandas cung cấp một chức năng rất tiện lợi >>>
Bây giờ bạn đã có các giá trị nhiệt độ và ngày giờ tương ứng, bạn có thể tạo DataFrame. Trong nhiều trường hợp, thật tiện lợi khi sử dụng các giá trị ngày-giờ làm nhãn hàng: >>>
Đó là nó! Bạn đã tạo DataFrame với dữ liệu chuỗi thời gian và chỉ số hàng ngày-giờ. Lập chỉ mục và cắt látKhi bạn đã có Pandas DataFrame với dữ liệu chuỗi thời gian, bạn có thể áp dụng phương pháp cắt để chỉ lấy một phần thông tin một cách thuận tiện: >>>
Ví dụ này cho thấy cách trích xuất nhiệt độ từ 05:00 đến 14:00 (5 giờ sáng và 2 giờ chiều). Mặc dù bạn đã cung cấp các chuỗi, nhưng Pandas biết rằng các nhãn hàng của bạn là các giá trị ngày-giờ và diễn giải các chuỗi dưới dạng ngày và giờ. Lấy mẫu lại và cánBạn vừa thấy cách kết hợp các nhãn hàng ngày-giờ và sử dụng phương pháp cắt để lấy thông tin bạn cần từ dữ liệu chuỗi thời gian. Điều này chỉ là khởi đầu. Nó trở nên tốt hơn! Nếu bạn muốn chia một ngày thành bốn khoảng thời gian sáu giờ và nhận được nhiệt độ trung bình cho mỗi khoảng thời gian, thì bạn chỉ cần thực hiện một tuyên bố. Pandas cung cấp phương pháp >>>
Bây giờ bạn có một Pandas DataFrame mới với bốn hàng. Mỗi hàng tương ứng với một khoảng thời gian sáu
giờ. Ví dụ: giá trị Thay vào đó Bạn cũng có thể cần thực hiện một số phân tích cửa sổ luân phiên . Điều này liên quan đến việc tính toán thống kê cho một số hàng liền kề được chỉ định, tạo nên cửa sổ dữ liệu của bạn. Bạn có thể "cuộn" cửa sổ bằng cách chọn một tập hợp các hàng liền kề khác nhau để thực hiện các phép tính của mình. Cửa sổ đầu tiên của bạn bắt đầu với hàng đầu tiên trong DataFrame của bạn và bao gồm nhiều hàng liền kề như bạn chỉ định. Sau đó, bạn di chuyển cửa sổ của mình xuống một hàng, bỏ hàng đầu tiên và thêm hàng đến ngay sau hàng cuối cùng và tính toán lại cùng một thống kê. Bạn lặp lại quá trình này cho đến khi bạn đến hàng cuối cùng của DataFrame. Pandas cung cấp phương pháp >>>
Bây giờ bạn có DataFrame với nhiệt độ trung bình được tính toán cho một số cửa sổ ba giờ. Tham số Trong ví
dụ trên, giá trị thứ ba ( Lập kế hoạch với dữ liệu gấu trúcPandas cho phép bạn trực quan hóa dữ liệu hoặc tạo các lô dựa trên DataFrames . Nó sử dụng Matplotlib ở chế độ nền, vì vậy việc khai thác khả năng âm mưu của Pandas rất giống với làm việc với Matplotlib . Nếu bạn muốn hiển thị các ô, thì trước tiên bạn cần nhập >>>
Bây giờ bạn có thể sử dụng >>>
Bây giờ Bạn cũng có thể áp dụng Bạn có thể lưu hình của mình bằng cách xâu chuỗi các phương pháp >>>
Câu lệnh này tạo cốt truyện và lưu nó dưới dạng tệp được gọi Bạn có thể lấy các loại ô khác bằng Pandas DataFrame. Ví dụ: bạn có thể hình dung dữ liệu ứng viên công việc của mình từ trước đó dưới dạng biểu đồ với >>>
Trong ví dụ này, bạn trích xuất dữ liệu điểm và tổng điểm của bài kiểm tra Python và trực quan hóa nó bằng biểu đồ. Cốt truyện kết quả trông như thế này: Đây chỉ là cái nhìn cơ bản. Bạn có thể điều chỉnh chi tiết với các thông số tùy chọn bao gồm Đọc thêmPandas DataFrames là các đối tượng rất toàn diện hỗ trợ nhiều thao tác không được đề cập trong hướng dẫn này. Một số trong số này bao gồm:
Các quan chức Pandas hướng dẫn tóm tắt một số các tùy chọn có sẵn độc đáo. Nếu bạn muốn tìm hiểu thêm về Pandas và DataFrames , thì bạn có thể xem các hướng dẫn sau:
Bạn đã biết rằng Pandas DataFrames xử lý dữ liệu hai chiều. Nếu bạn cần làm việc với dữ liệu được gắn nhãn trong nhiều hơn hai chiều, bạn có thể xem xarray , một thư viện Python mạnh mẽ khác dành cho khoa học dữ liệu với các tính năng rất giống với Pandas. Nếu bạn làm việc với dữ liệu lớn và muốn có trải nghiệm giống như DataFrame, thì bạn có thể cho Dask một cơ hội và sử dụng API DataFrame của nó . Một Dask DataFrame chứa nhiều Pandas DataFrame và thực hiện tính toán một cách lười biếng . Phần kết luậnBây giờ bạn đã biết Pandas DataFrame là gì, một số tính năng của nó và cách bạn có thể sử dụng nó để làm việc với dữ liệu một cách hiệu quả. Pandas DataFrames là cấu trúc dữ liệu mạnh mẽ, thân thiện với người dùng mà bạn có thể sử dụng để hiểu sâu hơn về tập dữ liệu của mình! Trong hướng dẫn này, bạn đã học được:
Bạn đã học đủ để bao quát các nguyên tắc cơ bản của DataFrames. Nếu bạn muốn tìm hiểu sâu hơn về cách làm việc với dữ liệu bằng Python , hãy xem toàn bộ các hướng dẫn về Gấu trúc . Nếu bạn có thắc mắc hoặc ý kiến đóng góp, thì hãy để chúng ở phần bình luận bên dưới. Copied !!! |