Khung dữ liệu trong chức năng python

PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked0103Braund, Mr. Owen Harrismale22. 010A/5 211717. 2500NaNS1211Cumings, bà. John Bradley [Florence Briggs Th. nữ38. 010PC 1759971. 2833C85C2313Heikkinen, thưa cô. Lainanữ26. 000STON/O2. 31012827. 9250NaNS

map[] hoạt động như một phương thức Sê-ri
Chủ yếu được sử dụng để ánh xạ dữ liệu phân loại thành dữ liệu số

Trong [8]

# create new column
train['Sex_num'] = train.Sex.map[{'female':0, 'male':1}]

Trong [9]

# let's compared Sex and Sex_num columns
# here we can see we map male to 1 and female to 0
train.loc[0:4, ['Sex', 'Sex_num']]

Ra[9]

Giới tínhSex_num0nam11nữ02nữ03nữ04nam1

hàm apply[] dưới dạng phương thức Sê-ri
Áp dụng một hàm cho từng thành phần trong Sê-ri

Trong [10]

# say we want to calculate length of string in each string in "Name" column

# create new column
# we are applying Python's len function
train['Name_length'] = train.Name.apply[len]

Trong [12]

# the apply[] method applies the function to each element
train.loc[0:4, ['Name', 'Name_length']]

Ra[12]

TênName_length0Braund, Mr. Owen Harris231Cumings, bà. John Bradley [Florence Briggs Th. 512Heikkinen, thưa cô. Laina223Futrelle, bà. Jacques Heath [Lily May Peel]444Allen, Mr. William Henry24

Trong [16]

import numpy as np

# say we look at the "Fare" column and we want to round it up
# we will use numpy's ceil function to round up the numbers
train['Fare_ceil'] = train.Fare.apply[np.ceil]

Trong [17]

train.loc[0:4, ['Fare', 'Fare_ceil']]

Ra[17]

giá véFare_ceil07. 25008. 0171. 283372. 027. 92508. 0353. 100054. 048. 05009. 0

Trong 19]

# let's extract last name of each person

# we will use a str method
# now the series is a list of strings
# each cell has 2 strings in a list as you can see below
train.Name.str.split[','].head[]

Hết[19]

0                           [Braund,  Mr. Owen Harris]
1    [Cumings,  Mrs. John Bradley [Florence Briggs ...
2                            [Heikkinen,  Miss. Laina]
3      [Futrelle,  Mrs. Jacques Heath [Lily May Peel]]
4                          [Allen,  Mr. William Henry]
Name: Name, dtype: object

Trong [22]

url = '//bit.ly/kaggletrain'
train = pd.read_csv[url]
train.head[3]
0

Trong [23]

url = '//bit.ly/kaggletrain'
train = pd.read_csv[url]
train.head[3]
1

Hết[23]

url = '//bit.ly/kaggletrain'
train = pd.read_csv[url]
train.head[3]
2

Trong [25]

url = '//bit.ly/kaggletrain'
train = pd.read_csv[url]
train.head[3]
3

Hết[25]

url = '//bit.ly/kaggletrain'
train = pd.read_csv[url]
train.head[3]
2

Trong [27]

url = '//bit.ly/kaggletrain'
train = pd.read_csv[url]
train.head[3]
5

Hết[27]

url = '//bit.ly/kaggletrain'
train = pd.read_csv[url]
train.head[3]
6

hàm apply[] dưới dạng phương thức DataFrame
Áp dụng một chức năng trên một trong hai trục của DataFrame

Trong [30]

url = '//bit.ly/kaggletrain'
train = pd.read_csv[url]
train.head[3]
7

Ra[30]

countrybeer_servingsspirit_servingswine_servingstotal_litres_of_pure_alcoholcontinent0Afghanistan0. 00. 00. 00. 0Châu Á1Albania89. 0132. 054. 04. 9Châu Âu2Algeria25. 00. 014. 00. 7Châu Phi3Andorra245. 0138. 0312. 012. 4Châu Âu4Angola217. 057. 045. 05. 9Châu Phi

Chủ Đề