Nếu bạn bắt đầu tìm hiểu và làm việc với bảng định dạng dữ liệu trong Python, thì nhiều khả năng bạn sẽ bắt đầu với tên thư viện là Pandas, bởi vì Pandas là một thư viện giúp bạn làm việc với dữ liệu rất thuận tiện và hiệu quả. . Bài viết này sẽ giống như một bảng tóm tắt về các đoạn mã Pandas hay sử dụng trong việc xử lý dữ liệu với Python để bạn có thể tra cứu nhanh chóng bằng cách tìm kiếm, hãy bookmark lại bài viết để tiện tra cứu ngay khi . Nếu bạn đang tìm kiếm cách để có thể tự động hóa Excel từ Python, hãy tham khảo khóa học Lập trình tương tác Python Excel chìa khóa công việc tối ưu
Lưu ý trước khi bắt đầu
Như đã nói, bạn có thể đánh dấu lại bài viết này vào trình duyệt yêu thích của bạn, khi cần tìm mã đoạn nào đó, bạn có thể nhấn Ctrl + F hoặc ⌘ + F [trên máy Mac] Để sử dụng được đoạn đó
pd.read_html[url]
5 – Đối tượng DataFrame trong Pandaspd.read_html[url]
6 – Chuỗi đối tượng trong Pandas
Cách đọc dữ liệu trong Pandas Python
Các câu lệnh trong phần này giúp bạn có thể tải hoặc nhập dữ liệu từ nhiều nguồn và nhiều định dạng dữ liệu khác nhau
Cách đọc dữ liệu từ tệp CSV
pd.read_csv[filename]
Cách đọc dữ liệu từ một tệp TSV
pd.read_table[filename]
Cách đọc dữ liệu từ một tệp Excel
pd.read_excel[filename]
Cách đọc dữ liệu từ SQL cơ sở dữ liệu
pd.read_sql[query, connection_object]
Cách đọc dữ liệu từ nguồn JSON [tệp, chuỗi hoặc URL]
pd.read_json[json_string]
Cách đọc dữ liệu từ nguồn HTML [tệp, chuỗi hoặc URL]
pd.read_html[url]
Cách đọc dữ liệu từ Clipboard
pd.read_clipboard[]
Nội dung của Clipboard sẽ được chuyển tới
pd.read_html[url]
7
Cách đọc dữ liệu kiểu từ điển trong Python
pd.DataFrame[dict]
Cách xuất dữ liệu từ Pandas DataFrame
Trong phần này, chúng tôi sẽ tổng hợp một số cách xuất dữ liệu từ Pandas DataFrame ra một số nguồn thông tin
Cách xuất dữ liệu từ DataFrame ra tệp CSV
df.to_csv[filename]
Cách xuất dữ liệu từ DataFrame ra tệp Excel
pd.read_csv[filename]
0
Cách xuất dữ liệu từ DataFrame ra SQL
pd.read_csv[filename]
1
Cách xuất dữ liệu từ DataFrame ra JSON
pd.read_csv[filename]
2
Cách tạo data test
Những dòng mã trong phần này sẽ giúp bạn tạo dữ liệu kiểm tra với sự trợ giúp của thư viện Numpy
Cách tạo kiểm tra bảng dữ liệu với Numpy và Pandas
Đoạn mã này sẽ tạo ra một bảng bao gồm 23 dòng và 4 cột, được điền vào các giá trị ngẫu nhiên ngẫu nhiên từ Numpy
pd.read_csv[filename]
3
Cách tạo chuỗi từ một danh sách
pd.read_csv[filename]
4
Cách thêm chỉ mục là cột ngày tháng
pd.read_csv[filename]
5
Cách xem và kiểm tra dữ liệu
Những câu lệnh trong phần này sẽ giúp bạn kiểm tra DataFrame hoặc Series trong Panda theo một vị trí cụ thể
Cách xem n line đầu tiên của DataFrame
pd.read_csv[filename]
6
Cách xem dòng cuối cùng của DataFrame
pd.read_csv[filename]
7
Cách lấy số dòng cột của DataFrame
pd.read_csv[filename]
8
Cách lấy số dòng cột của DataFrame
pd.read_csv[filename]
8
Xem thông tin về Index, data type and dung lượng của DataFrame
pd.read_table[filename]
0
Table table total results for the column has data type is number
pd.read_table[filename]
1
Xem giá trị duy nhất và đếm số giá trị này, đếm cả trường hợp NA
Lưu ý Áp dụng cho các đối tượng Dòng____4_______2
Tổng giá trị duy nhất cuối cùng và tính cho tất cả các cột
pd.read_table[filename]
3
Trích xuất một phần dữ liệu trong Pandas DataFrame
Những câu lệnh trong phần này sẽ giúp bạn trích xuất dữ liệu từ DataFrame hoặc Series trong Pandas
Trả về một cột của DataFrame dưới dạng Chuỗi
Trả về các cột có nhãn là col như một Series_______4_______4
Trả về các cột trong danh sách dưới dạng DataFrame mới
pd.read_table[filename]
5
Chọn dữ liệu theo vị trí
pd.read_table[filename]
6
Select data by index
pd.read_table[filename]
7
Select data at first line
pd.read_table[filename]
8
Chọn dữ liệu ở dòng đầu tiên, ô thứ nhất của DataFrame
pd.read_table[filename]
9
Cách làm sạch dữ liệu trong Pandas DataFrame
Các đoạn mã trong phần này sẽ giúp bạn xử lý và làm sạch dữ liệu
Đổi tên các cột trong DataFrame theo thứ tự
pd.read_excel[filename]
0
Kiểm tra dữ liệu với giá trị null
pd.read_excel[filename]
1
Check tra data with other value null
pd.read_excel[filename]
2
Remove the whole lines with data null
pd.read_excel[filename]
3
Remove the whole column has data null
pd.read_excel[filename]
4
Bỏ qua các dòng có nhiều hơn giá trị null
pd.read_excel[filename]
5
Cách thay thế toàn bộ giá trị null bằng giá trị x
pd.read_excel[filename]
6
Cách thay thế toàn bộ giá trị null bằng giá trị khác
Thay giá trị null trong Sê-ri bởi giá trị trung bình của các giá trị trong Sê-ri [có nghĩa là có thể được thay thế bởi các hàm khác trong thống kê mô-đun của Python]
pd.read_excel[filename]
7
Cách chuyển đổi kiểu dữ liệu của sê-ri sang Float
pd.read_excel[filename]
8
Cách thay thế giá trị này bởi giá trị khác
Thay tất cả các giá trị bằng
pd.read_html[url]
8 bởi
pd.read_html[url]
9
pd.read_excel[filename]
9
Cách thay nhiều giá trị cùng lúc
pd.read_sql[query, connection_object]
0
Đổi tên hàng loạt cột bằng lambda
pd.read_sql[query, connection_object]
1
Cách đổi tên cột cụ thể trong DataFrame
pd.read_sql[query, connection_object]
2
Change index in DataFrame
pd.read_sql[query, connection_object]
3
Change the index row in DataFrame
pd.read_sql[query, connection_object]
4
Cách lọc, sắp xếp, nhóm dữ liệu trong Pandas DataFrame
Các câu lệnh trong phần này sẽ giúp bạn thực hiện các thao tác lọc, sắp xếp hoặc nhóm dữ liệu trong DataFrame một cách dễ dàng
Lọc dữ liệu theo điều kiện
Lọc ra các dòng mãn điều kiện
pd.read_clipboard[]
0 lớn hơn
pd.read_clipboard[]
1
pd.read_sql[query, connection_object]
5Lọc ra các dòng mãn điều kiện. has value column
pd.read_clipboard[]
0 in interval
pd.read_clipboard[]
3 to
pd.read_clipboard[]
4
pd.read_sql[query, connection_object]
6
Sắp xếp dữ liệu
Sắp xếp dữ liệu trong cột
pd.read_clipboard[]
5 theo chiều thuận [tăng dần]
pd.read_sql[query, connection_object]
7Sắp xếp dữ liệu trong cột
pd.read_clipboard[]
6 theo nghịch [giảm dần]
pd.read_sql[query, connection_object]
8Sắp xếp
pd.read_clipboard[]
5 theo thuận và
pd.read_clipboard[]
6 theo nghịch
pd.read_sql[query, connection_object]
9
Group data, pivot data with groupby
Pivot dữ liệu theo
pd.read_clipboard[]
5
pd.read_json[json_string]
0Pivot dữ liệu theo nhiều cột
pd.read_clipboard[]
5,
pd.read_clipboard[]
6
Pivot dữ liệu với pivot_table trong DataFrame
Tạo một Pivot Table, nhóm dữ liệu theo cột
pd.read_clipboard[]
5, tính trung bình của
pd.read_clipboard[]
6,
pd.DataFrame[dict]
4
pd.read_json[json_string]
1
Tính trung bình của tất cả các cột
pd.read_json[json_string]
2
Tính max mỗi dòng
Application function np. max[] for each data lines
pd.read_json[json_string]
3
Nối dữ liệu, gộp dữ liệu bằng Pandas DataFrame
Nối dữ liệu DataFrame theo chiều dọc
Nối các dòng của
pd.DataFrame[dict]
5 xuống dưới
pd.DataFrame[dict]
6 [Số lượng các cột trong 2 DataFrames này phải giống nhau]
pd.read_json[json_string]
4
Nối dữ liệu DataFrame theo chiều ngang
Nối các cột của
pd.DataFrame[dict]
5 sang phải các cột của
pd.DataFrame[dict]
6 [Số lượng các dòng trong 2 DataFrames này phải giống nhau]
pd.read_json[json_string]
5
Tham gia dữ liệu 2 DataFrames theo kiểu SQL
pd.read_json[json_string]
6Join 2 DataFrame
pd.DataFrame[dict]
5 và
pd.DataFrame[dict]
6 theo cột chung
pd.read_clipboard[]
5, kiểu Join là
df.to_csv[filename]
2. Ngoài ra còn hỗ trợ các kiểu tham gia.
df.to_csv[filename]
3,
df.to_csv[filename]
4,
df.to_csv[filename]
5
Dữ liệu thống kê bằng Pandas DataFrame
Data Statistics for Numbers Columns
pd.read_table[filename]
1
Tính nghĩa là cho tất cả các cột
pd.read_json[json_string]
8
Tính tương quan giữa các cột
pd.read_json[json_string]
9
Dem number null value for the column
pd.read_html[url]
0
Find the best value for each column
pd.read_html[url]
1
Find the small value for each column
pd.read_html[url]
2
Find the media value for each column
pd.read_html[url]
3
Tìm giá trị độ lệch chuẩn cho mỗi cột
pd.read_html[url]
4Hi vọng với bài viết này, Thành sẽ giúp bạn làm việc dễ dàng hơn với DataFrame trong Pandas. Đừng quên tham khảo khóa học Lập trình tương tác Python Excel chìa khoá tối ưu công việc