PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked0103Braund, Mr. Owen Harrismale22. 010A/5 211717. 2500NaNS1211Cumings, bà. John Bradley [Florence Briggs Th. nữ38. 010PC 1759971. 2833C85C2313Heikkinen, thưa cô. Lainanữ26. 000STON/O2. 31012827. 9250NaNS
map[] hoạt động như một phương thức Sê-ri
Chủ yếu được sử dụng để ánh xạ dữ liệu phân loại thành dữ liệu số
Trong [8]
# create new column train['Sex_num'] = train.Sex.map[{'female':0, 'male':1}]
Trong [9]
# let's compared Sex and Sex_num columns # here we can see we map male to 1 and female to 0 train.loc[0:4, ['Sex', 'Sex_num']]
Ra[9]
Giới tínhSex_num0nam11nữ02nữ03nữ04nam1
hàm apply[] dưới dạng phương thức Sê-ri
Áp dụng một hàm cho từng thành phần trong Sê-ri
Trong [10]
# say we want to calculate length of string in each string in "Name" column # create new column # we are applying Python's len function train['Name_length'] = train.Name.apply[len]
Trong [12]
# the apply[] method applies the function to each element train.loc[0:4, ['Name', 'Name_length']]
Ra[12]
TênName_length0Braund, Mr. Owen Harris231Cumings, bà. John Bradley [Florence Briggs Th. 512Heikkinen, thưa cô. Laina223Futrelle, bà. Jacques Heath [Lily May Peel]444Allen, Mr. William Henry24
Trong [16]
import numpy as np # say we look at the "Fare" column and we want to round it up # we will use numpy's ceil function to round up the numbers train['Fare_ceil'] = train.Fare.apply[np.ceil]
Trong [17]
train.loc[0:4, ['Fare', 'Fare_ceil']]
Ra[17]
giá véFare_ceil07. 25008. 0171. 283372. 027. 92508. 0353. 100054. 048. 05009. 0
Trong 19]
# let's extract last name of each person # we will use a str method # now the series is a list of strings # each cell has 2 strings in a list as you can see below train.Name.str.split[','].head[]
Hết[19]
0 [Braund, Mr. Owen Harris] 1 [Cumings, Mrs. John Bradley [Florence Briggs ... 2 [Heikkinen, Miss. Laina] 3 [Futrelle, Mrs. Jacques Heath [Lily May Peel]] 4 [Allen, Mr. William Henry] Name: Name, dtype: object
Trong [22]
url = '//bit.ly/kaggletrain' train = pd.read_csv[url] train.head[3]0
Trong [23]
url = '//bit.ly/kaggletrain' train = pd.read_csv[url] train.head[3]1
Hết[23]
url = '//bit.ly/kaggletrain' train = pd.read_csv[url] train.head[3]2
Trong [25]
url = '//bit.ly/kaggletrain' train = pd.read_csv[url] train.head[3]3
Hết[25]
url = '//bit.ly/kaggletrain' train = pd.read_csv[url] train.head[3]2
Trong [27]
url = '//bit.ly/kaggletrain' train = pd.read_csv[url] train.head[3]5
Hết[27]
url = '//bit.ly/kaggletrain' train = pd.read_csv[url] train.head[3]6
hàm apply[] dưới dạng phương thức DataFrame
Áp dụng một chức năng trên một trong hai trục của DataFrame
Trong [30]
url = '//bit.ly/kaggletrain' train = pd.read_csv[url] train.head[3]7
Ra[30]
countrybeer_servingsspirit_servingswine_servingstotal_litres_of_pure_alcoholcontinent0Afghanistan0. 00. 00. 00. 0Châu Á1Albania89. 0132. 054. 04. 9Châu Âu2Algeria25. 00. 014. 00. 7Châu Phi3Andorra245. 0138. 0312. 012. 4Châu Âu4Angola217. 057. 045. 05. 9Châu Phi