Mục tiêu công thức
Sau khi làm việc trên một bộ dữ liệu và thực hiện tất cả các tiền xử lý, chúng tôi cần lưu dữ liệu được xử lý trước vào một số định dạng như trong CSV, Excel hoặc các loại khác.
Mã nguồn Python này thực hiện như sau: 1. Tạo từ điển dữ liệu và chuyển đổi nó thành DataFrame 2. Lưu nó ở định dạng CSV
1. Creates data dictionary and converts it into dataframe
2. Saves it in CSV format
Vì vậy, đây là công thức về cách chúng ta có thể lưu Pandas DataFrame dưới dạng tệp CSV.
Hãy đến gần hơn với giấc mơ trở thành một nhà khoa học dữ liệu với hơn 70 dự án ML từ đầu đến cuối đã được giải quyếtEnd-to-End ML Projects
Bước 1 - Nhập thư viện
import pandas as pd
Chúng tôi chỉ nhập gấu trúc cần thiết.
Bước 2 - Thiết lập dữ liệu
Chúng tôi đã tạo ra một từ điển dữ liệu và truyền nó trong pd.dataFrame để tạo một dataFrame với các cột 'first_name', 'last_name', 'tuổi', 'comedy_score' và 'xếp hạng_score'.
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
Bước 3 - Lưu khung dữ liệu
Vì vậy, bây giờ chúng tôi phải lưu bộ dữ liệu mà chúng tôi đã tạo. Chúng tôi lưu nó ở nhiều định dạng, ở đây chúng tôi đang thực hiện nó trong CSV và Excel bằng cách sử dụng chức năng TO_CSV và TO_EXCEL tương ứng.
df.to_csv['raw_data.csv', index=False]
df.to_excel['raw_data.xls', index=False]
Vì vậy, đầu ra có hai tệp đã lưu một ở định dạng CSV và các tệp khác ở định dạng Excel.
first_name last_name age Comedy_Score Rating_Score 0 Sheldon Copper 42 9 25 1 Raj Koothrappali 38 7 25 2 Leonard Hofstadter 36 8 49 3 Howard Wolowitz 41 8 62 4 Amy Fowler 35 5 70
Bạn có thể sử dụng thư viện Pickle của Python để đổ dữ liệu vào một tệp.
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
Sau đó, bạn có thể tải nó trở lại trong một tập lệnh khác.
import pickle
with open['my_dataset.pickle', 'rb'] as data:
dataset = pickle.load[data]
Xem thảo luận
Cải thiện bài viết
Lưu bài viết
Xem thảo luận
Cải thiện bài viết
Lưu bài viết
Đọc
Bàn luận
Python3
import
pandas as pd
import
df.to_csv['raw_data.csv', index=False]
df.to_excel['raw_data.xls', index=False]
4
df.to_csv['raw_data.csv', index=False]
df.to_excel['raw_data.xls', index=False]
5
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t255
df.to_csv['raw_data.csv', index=False]
df.to_excel['raw_data.xls', index=False]
8
df.to_csv['raw_data.csv', index=False]
df.to_excel['raw_data.xls', index=False]
9import
0import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
4import
2______14import
4import
5Các
Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t253
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t255
Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t256
Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t257
Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t258
Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t259
import pandas as pd
0
import pandas as pd
1
import pandas as pd
2
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1
import pandas as pd
4Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t253
import pandas as pd
6
import pandas as pd
7
import pandas as pd
8
Output:
name degree score 0 aparna MBA 90 1 pankaj BCA 40 2 sudhir M.Tech 80 3 Geeku MBA 98
Xuất CSV sang thư mục làm việc
Ở đây, chúng tôi chỉ cần xuất một dataFrame sang tệp CSV bằng DF.TO_CSV [].
Python3
Output:
Lưu CSV mà không cần tiêu đề và chỉ mục. & NBSP;
Ở đây, chúng tôi đang lưu tệp không có tiêu đề và không có số chỉ mục.
Python3
import pandas as pd
9
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
0
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
1
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
3
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
4import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
3
import pandas as pd
6Output:
Lưu tệp CSV vào một vị trí được chỉ định
Chúng tôi cũng có thể, lưu tập tin của chúng tôi tại một số vị trí cụ thể.
Python3
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
8
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
9
import pandas as pd
6
Output:
Viết tệp dữ liệu vào tệp CSV bằng cách sử dụng phân tách tab
Chúng tôi cũng có thể lưu tệp của chúng tôi với một số riêng biệt cụ thể như chúng tôi muốn. I.e, \ \ t.
Python3
import
pandas as pd
import
df.to_csv['raw_data.csv', index=False]
df.to_excel['raw_data.xls', index=False]
4
df.to_csv['raw_data.csv', index=False]
df.to_excel['raw_data.xls', index=False]
5
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t255
df.to_csv['raw_data.csv', index=False]
df.to_excel['raw_data.xls', index=False]
8
df.to_csv['raw_data.csv', index=False]
df.to_excel['raw_data.xls', index=False]
9import
0import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
4import
2______14import
4import
5Các
Các
import pandas as pd
7
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
05import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
06
import pandas as pd
6
import pandas as pd
7
import pandas as pd
8
import pandas as pd
7
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
05import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
12
import pandas as pd
6
import pandas as pd
9
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
15import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
16import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
18
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
4import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score']]
print[df]
3import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
22import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
24
import pandas as pd
6import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
26import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
1 import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
28import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
15
import pandas as pd
6
import pandas as pd
7
import pickle
dataset = [1,2,3,4]
with open['my_dataset.pickle', 'wb'] as output:
pickle.dump[dataset, output]
32Output:
Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t25