Pd.read_csv trong python

Nếu bạn bắt đầu tìm hiểu và làm việc với bảng định dạng dữ liệu trong Python, thì nhiều khả năng bạn sẽ bắt đầu với tên thư viện là Pandas, bởi vì Pandas là một thư viện giúp bạn làm việc với dữ liệu rất thuận tiện và hiệu quả. . Bài viết này sẽ giống như một bảng tóm tắt về các đoạn mã Pandas hay sử dụng trong việc xử lý dữ liệu với Python để bạn có thể tra cứu nhanh chóng bằng cách tìm kiếm, hãy bookmark lại bài viết để tiện tra cứu ngay khi . Nếu bạn đang tìm kiếm cách để có thể tự động hóa Excel từ Python, hãy tham khảo khóa học Lập trình tương tác Python Excel chìa khóa công việc tối ưu

Lưu ý trước khi bắt đầu

Như đã nói, bạn có thể đánh dấu lại bài viết này vào trình duyệt yêu thích của bạn, khi cần tìm mã đoạn nào đó, bạn có thể nhấn Ctrl + F hoặc ⌘ + F (trên máy Mac) Để sử dụng được đoạn đó
  • pd.read_html(url)
    5 – Đối tượng DataFrame trong Pandas
  • pd.read_html(url)
    6 – Chuỗi đối tượng trong Pandas

Cách đọc dữ liệu trong Pandas Python

Các câu lệnh trong phần này giúp bạn có thể tải hoặc nhập dữ liệu từ nhiều nguồn và nhiều định dạng dữ liệu khác nhau

Cách đọc dữ liệu từ tệp CSV

pd.read_csv(filename)

Cách đọc dữ liệu từ một tệp TSV

pd.read_table(filename)

Cách đọc dữ liệu từ một tệp Excel

pd.read_excel(filename)

Cách đọc dữ liệu từ SQL cơ sở dữ liệu

pd.read_sql(query, connection_object)

Cách đọc dữ liệu từ nguồn JSON (tệp, chuỗi hoặc URL)

pd.read_json(json_string)

Cách đọc dữ liệu từ nguồn HTML (tệp, chuỗi hoặc URL)

pd.read_html(url)

Cách đọc dữ liệu từ Clipboard

pd.read_clipboard()
Nội dung của Clipboard sẽ được chuyển tới
pd.read_html(url)
7

Cách đọc dữ liệu kiểu từ điển trong Python

pd.DataFrame(dict)

Cách xuất dữ liệu từ Pandas DataFrame

Trong phần này, chúng tôi sẽ tổng hợp một số cách xuất dữ liệu từ Pandas DataFrame ra một số nguồn thông tin

Cách xuất dữ liệu từ DataFrame ra tệp CSV

df.to_csv(filename)

Cách xuất dữ liệu từ DataFrame ra tệp Excel

pd.read_csv(filename)
0

Cách xuất dữ liệu từ DataFrame ra SQL

pd.read_csv(filename)
1

Cách xuất dữ liệu từ DataFrame ra JSON

pd.read_csv(filename)
2

Cách tạo data test

Những dòng mã trong phần này sẽ giúp bạn tạo dữ liệu kiểm tra với sự trợ giúp của thư viện Numpy

Cách tạo kiểm tra bảng dữ liệu với Numpy và Pandas

Đoạn mã này sẽ tạo ra một bảng bao gồm 23 dòng và 4 cột, được điền vào các giá trị ngẫu nhiên ngẫu nhiên từ Numpy
pd.read_csv(filename)
3

Cách tạo chuỗi từ một danh sách

pd.read_csv(filename)
4

Cách thêm chỉ mục là cột ngày tháng

pd.read_csv(filename)
5

Cách xem và kiểm tra dữ liệu

Những câu lệnh trong phần này sẽ giúp bạn kiểm tra DataFrame hoặc Series trong Panda theo một vị trí cụ thể

Cách xem n line đầu tiên của DataFrame

pd.read_csv(filename)
6

Cách xem dòng cuối cùng của DataFrame

pd.read_csv(filename)
7

Cách lấy số dòng cột của DataFrame

pd.read_csv(filename)
8

Cách lấy số dòng cột của DataFrame

pd.read_csv(filename)
8

Xem thông tin về Index, data type and dung lượng của DataFrame

pd.read_table(filename)
0

Table table total results for the column has data type is number

pd.read_table(filename)
1

Xem giá trị duy nhất và đếm số giá trị này, đếm cả trường hợp NA

Lưu ý Áp dụng cho các đối tượng Dòng____4_______2

Tổng giá trị duy nhất cuối cùng và tính cho tất cả các cột

pd.read_table(filename)
3

Trích xuất một phần dữ liệu trong Pandas DataFrame

Những câu lệnh trong phần này sẽ giúp bạn trích xuất dữ liệu từ DataFrame hoặc Series trong Pandas

Trả về một cột của DataFrame dưới dạng Chuỗi

Trả về các cột có nhãn là col như một Series_______4_______4

Trả về các cột trong danh sách dưới dạng DataFrame mới

pd.read_table(filename)
5

Chọn dữ liệu theo vị trí

pd.read_table(filename)
6

Select data by index

pd.read_table(filename)
7

Select data at first line

pd.read_table(filename)
8

Chọn dữ liệu ở dòng đầu tiên, ô thứ nhất của DataFrame

pd.read_table(filename)
9

Cách làm sạch dữ liệu trong Pandas DataFrame

Các đoạn mã trong phần này sẽ giúp bạn xử lý và làm sạch dữ liệu

Đổi tên các cột trong DataFrame theo thứ tự

pd.read_excel(filename)
0

Kiểm tra dữ liệu với giá trị null

pd.read_excel(filename)
1

Check tra data with other value null

pd.read_excel(filename)
2

Remove the whole lines with data null

pd.read_excel(filename)
3

Remove the whole column has data null

pd.read_excel(filename)
4

Bỏ qua các dòng có nhiều hơn giá trị null

pd.read_excel(filename)
5

Cách thay thế toàn bộ giá trị null bằng giá trị x

pd.read_excel(filename)
6

Cách thay thế toàn bộ giá trị null bằng giá trị khác

Thay giá trị null trong Sê-ri bởi giá trị trung bình của các giá trị trong Sê-ri (có nghĩa là có thể được thay thế bởi các hàm khác trong thống kê mô-đun của Python)
pd.read_excel(filename)
7

Cách chuyển đổi kiểu dữ liệu của sê-ri sang Float

pd.read_excel(filename)
8

Cách thay thế giá trị này bởi giá trị khác

Thay tất cả các giá trị bằng
pd.read_html(url)
8 bởi
pd.read_html(url)
9
pd.read_excel(filename)
9

Cách thay nhiều giá trị cùng lúc

pd.read_sql(query, connection_object)
0

Đổi tên hàng loạt cột bằng lambda

pd.read_sql(query, connection_object)
1

Cách đổi tên cột cụ thể trong DataFrame

pd.read_sql(query, connection_object)
2

Change index in DataFrame

pd.read_sql(query, connection_object)
3

Change the index row in DataFrame

pd.read_sql(query, connection_object)
4

Cách lọc, sắp xếp, nhóm dữ liệu trong Pandas DataFrame

Các câu lệnh trong phần này sẽ giúp bạn thực hiện các thao tác lọc, sắp xếp hoặc nhóm dữ liệu trong DataFrame một cách dễ dàng

Lọc dữ liệu theo điều kiện

Lọc ra các dòng mãn điều kiện
pd.read_clipboard()
0 lớn hơn
pd.read_clipboard()
1
pd.read_sql(query, connection_object)
5Lọc ra các dòng mãn điều kiện. has value column
pd.read_clipboard()
0 in interval
pd.read_clipboard()
3 to
pd.read_clipboard()
4
pd.read_sql(query, connection_object)
6

Sắp xếp dữ liệu

Sắp xếp dữ liệu trong cột
pd.read_clipboard()
5 theo chiều thuận (tăng dần)
pd.read_sql(query, connection_object)
7Sắp xếp dữ liệu trong cột
pd.read_clipboard()
6 theo nghịch (giảm dần)
pd.read_sql(query, connection_object)
8Sắp xếp
pd.read_clipboard()
5 theo thuận và
pd.read_clipboard()
6 theo nghịch
pd.read_sql(query, connection_object)
9

Group data, pivot data with groupby

Pivot dữ liệu theo
pd.read_clipboard()
5
pd.read_json(json_string)
0Pivot dữ liệu theo nhiều cột
pd.read_clipboard()
5,
pd.read_clipboard()
6

Pivot dữ liệu với pivot_table trong DataFrame

Tạo một Pivot Table, nhóm dữ liệu theo cột
pd.read_clipboard()
5, tính trung bình của
pd.read_clipboard()
6,
pd.DataFrame(dict)
4
pd.read_json(json_string)
1

Tính trung bình của tất cả các cột

pd.read_json(json_string)
2

Tính max mỗi dòng

Application function np. max() for each data lines
pd.read_json(json_string)
3

Nối dữ liệu, gộp dữ liệu bằng Pandas DataFrame

Nối dữ liệu DataFrame theo chiều dọc

Nối các dòng của
pd.DataFrame(dict)
5 xuống dưới
pd.DataFrame(dict)
6 (Số lượng các cột trong 2 DataFrames này phải giống nhau)
pd.read_json(json_string)
4

Nối dữ liệu DataFrame theo chiều ngang

Nối các cột của
pd.DataFrame(dict)
5 sang phải các cột của
pd.DataFrame(dict)
6 (Số lượng các dòng trong 2 DataFrames này phải giống nhau)
pd.read_json(json_string)
5

Tham gia dữ liệu 2 DataFrames theo kiểu SQL

pd.read_json(json_string)
6Join 2 DataFrame
pd.DataFrame(dict)
5 và
pd.DataFrame(dict)
6 theo cột chung
pd.read_clipboard()
5, kiểu Join là
df.to_csv(filename)
2. Ngoài ra còn hỗ trợ các kiểu tham gia.
df.to_csv(filename)
3,
df.to_csv(filename)
4,
df.to_csv(filename)
5

Dữ liệu thống kê bằng Pandas DataFrame

Data Statistics for Numbers Columns

pd.read_table(filename)
1

Tính nghĩa là cho tất cả các cột

pd.read_json(json_string)
8

Tính tương quan giữa các cột

pd.read_json(json_string)
9

Dem number null value for the column

pd.read_html(url)
0

Find the best value for each column

pd.read_html(url)
1

Find the small value for each column

pd.read_html(url)
2

Find the media value for each column

pd.read_html(url)
3

Tìm giá trị độ lệch chuẩn cho mỗi cột

pd.read_html(url)
4Hi vọng với bài viết này, Thành sẽ giúp bạn làm việc dễ dàng hơn với DataFrame trong Pandas. Đừng quên tham khảo khóa học Lập trình tương tác Python Excel chìa khoá tối ưu công việc