Khi làm việc với dữ liệu trong Pandas, chúng tôi thực hiện rất nhiều thao tác trên dữ liệu để lấy dữ liệu ở dạng mong muốn. Một trong những thao tác này có thể là chúng tôi muốn tạo các cột mới trong DataFrame dựa trên kết quả của một số thao tác trên các cột hiện có trong DataFrame. Hãy thảo luận về một số cách mà chúng ta có thể làm điều đó.
Đưa ra một Dataframe chứa dữ liệu về một sự kiện, chúng tôi muốn tạo một cột mới có tên là 'Discounted_Price', được tính sau khi áp dụng chiết khấu 10% cho Giá vé
ví dụ 1. Chúng ta có thể sử dụng DataFrame. apply[] để đạt được nhiệm vụ này.
Python3
# importing pandas as pd
import
pandas as pd
# Creating the DataFrame
df
_______5 pd.DataFrame[{
'Date'
:[
'10/2/2011'
import
0import
1import
0import
3import
0import
5import
6
import
7_______18:[
pandas as pd
0import
0pandas as pd
2import
0pandas as pd
4import
0pandas as pd
6import
6
import
7pandas as pd
9:[
# Creating the DataFrame
1import
0# Creating the DataFrame
3import
0# Creating the DataFrame
5import
0# Creating the DataFrame
7# Creating the DataFrame
8
# Creating the DataFrame
9
df
0df
1
đầu ra
khung dữ liệu mẫu
Bây giờ, chúng tôi sẽ tạo một cột mới có tên là 'Discounted_Price' sau khi áp dụng chiết khấu 10% cho cột 'Chi phí' hiện có
Python3
df
2
df
3df
4df
5_______5 df
7____48df
9=
0 =
1=
2
=
3______54=
5 =
6=
7=
=
9pd.DataFrame[{
0
pd.DataFrame[{
1
pd.DataFrame[{
2
df
0df
1
đầu ra
Khung dữ liệu với cột mới được tạo
ví dụ 2. Chúng ta có thể đạt được kết quả tương tự bằng cách trực tiếp thực hiện thao tác được yêu cầu trên phần tử cột mong muốn.
Python3
import
pandas as pd
# Creating the DataFrame
df
_______5 pd.DataFrame[{
'Date'
:[
'10/2/2011'
import
0import
1import
0import
3import
0import
5import
6
import
7_______18:[
pandas as pd
0import
0pandas as pd
2import
0pandas as pd
4import
0pandas as pd
6import
6
import
7pandas as pd
9:[
# Creating the DataFrame
1import
0# Creating the DataFrame
3import
0# Creating the DataFrame
5import
0# Creating the DataFrame
7# Creating the DataFrame
8
import
03
import
04
import
05
df
3df
4df
5 =
df
3pandas as pd
9df
5 =
2 df
9 _______56 =
5 df
3pandas as pd
9import
19
import
20
import
21
df
0df
1
đầu ra
Khung dữ liệu đầu ra
ví dụ 3. Sử dụng Khung dữ liệu. map[] chức năng để tạo cột mới từ cột hiện có bằng chức năng ánh xạ
Chúng tôi sẽ tạo một khung dữ liệu với một số dữ liệu mẫu
Python3
import
24=
import
26
import
27import
28import
29import
30import
0import
32import
0import
34import
0import
36import
0import
38import
0import
40import
0import
42import
0import
44import
6
import
27import
47import
29# Creating the DataFrame
1import
0import
51import
0import
53import
0import
55import
0import
57import
0import
59import
0# Creating the DataFrame
3import
0import
53df
5
import
65
import
66
df
=
import
69
import
70
import
71
đầu ra
khung dữ liệu mẫu
Bây giờ, chúng ta sẽ tạo một hàm ánh xạ [salary_stats] và sử dụng DataFrame. map[] để tạo một cột mới từ một cột hiện có
Python3
import
72 import
73
import
27import
75 import
76# Creating the DataFrame
1import
78
import
79import
80 import
81
import
27import
75 # Creating the DataFrame
1 import
85=
import
76import
88import
78
import
79import
80 import
92
import
27import
94 import
88 import
85=
import
76import
99import
78
import
79import
80 pandas as pd
03
import
27import
94 import
99 import
85=
import
76import
53import
78
import
79import
80 pandas as pd
14
import
27import
94 pandas as pd
17_______5 import
53import
78
import
79import
80 pandas as pd
23
df
3pandas as pd
25df
5=
df
3pandas as pd
29pandas as pd
30pandas as pd
31pandas as pd
32
import
71
đầu ra
Xuất khung dữ liệu với cột mới
Giải trình. Ở đây chúng tôi đã sử dụng DataFrame của gấu trúc. map[] để ánh xạ từng giá trị thành một chuỗi dựa trên logic ánh xạ đã xác định của chúng tôi. Chuỗi giá trị kết quả được gán cho một cột mới, “salary_stats”