Hướng dẫn how to save a dataset in python - cách lưu tập dữ liệu trong python
Mục tiêu công thứcSau khi làm việc trên một bộ dữ liệu và thực hiện tất cả các tiền xử lý, chúng tôi cần lưu dữ liệu được xử lý trước vào một số định dạng như trong CSV, Excel hoặc các loại khác. Show
Mã nguồn Python này thực hiện như sau: 1. Tạo từ điển dữ liệu và chuyển đổi nó thành DataFrame 2. Lưu nó ở định dạng CSV Vì vậy, đây là công thức về cách chúng ta có thể lưu Pandas DataFrame dưới dạng tệp CSV. Hãy đến gần hơn với giấc mơ trở thành một nhà khoa học dữ liệu với hơn 70 dự án ML từ đầu đến cuối đã được giải quyếtEnd-to-End ML Projects Bước 1 - Nhập thư viện
Chúng tôi chỉ nhập gấu trúc cần thiết. Bước 2 - Thiết lập dữ liệuChúng tôi đã tạo ra một từ điển dữ liệu và truyền nó trong pd.dataFrame để tạo một dataFrame với các cột 'first_name', 'last_name', 'tuổi', 'comedy_score' và 'xếp hạng_score'. Bước 3 - Lưu khung dữ liệuVì vậy, bây giờ chúng tôi phải lưu bộ dữ liệu mà chúng tôi đã tạo. Chúng tôi lưu nó ở nhiều định dạng, ở đây chúng tôi đang thực hiện nó trong CSV và Excel bằng cách sử dụng chức năng TO_CSV và TO_EXCEL tương ứng. first_name last_name age Comedy_Score Rating_Score 0 Sheldon Copper 42 9 25 1 Raj Koothrappali 38 7 25 2 Leonard Hofstadter 36 8 49 3 Howard Wolowitz 41 8 62 4 Amy Fowler 35 5 70
Bạn có thể sử dụng thư viện Pickle của Python để đổ dữ liệu vào một tệp.
Sau đó, bạn có thể tải nó trở lại trong một tập lệnh khác. Xem thảo luận Cải thiện bài viết Lưu bài viết Xem thảo luận Cải thiện bài viết Lưu bài viết Đọc Bàn luậnPython3
1 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t255
df.to_csv('raw_data.csv', index=False)
df.to_excel('raw_data.xls', index=False)
8
df.to_csv('raw_data.csv', index=False)
df.to_excel('raw_data.xls', index=False)
9import 0 4import 2______14import 4import 5Các Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t253 1 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t255 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t256 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t257 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t258 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t259
import pandas as pd
0
import pandas as pd
1
1
import pandas as pd
4Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t253
import pandas as pd
6
Output: name degree score 0 aparna MBA 90 1 pankaj BCA 40 2 sudhir M.Tech 80 3 Geeku MBA 98 Xuất CSV sang thư mục làm việcỞ đây, chúng tôi chỉ cần xuất một dataFrame sang tệp CSV bằng DF.TO_CSV (). Python3Output: Lưu CSV mà không cần tiêu đề và chỉ mục. & NBSP;Ở đây, chúng tôi đang lưu tệp không có tiêu đề và không có số chỉ mục. Python3
1
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score'])
print(df)
3
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score'])
print(df)
4 1
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score'])
print(df)
3
import pandas as pd
6Output: Lưu tệp CSV vào một vị trí được chỉ địnhChúng tôi cũng có thể, lưu tập tin của chúng tôi tại một số vị trí cụ thể. Python3
Output: Viết tệp dữ liệu vào tệp CSV bằng cách sử dụng phân tách tabChúng tôi cũng có thể lưu tệp của chúng tôi với một số riêng biệt cụ thể như chúng tôi muốn. I.e, \ \ t. Python3
1 Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t255
df.to_csv('raw_data.csv', index=False)
df.to_excel('raw_data.xls', index=False)
8
df.to_csv('raw_data.csv', index=False)
df.to_excel('raw_data.xls', index=False)
9import 0 4import 2______14import 4import 5Các Các
05 06
import pandas as pd
6
05 12
import pandas as pd
6
15 16 1 18
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score'])
print(df)
4 1
raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
'age': [42, 38, 36, 41, 35],
'Comedy_Score': [9, 7, 8, 8, 5],
'Rating_Score': [25, 25, 49, 62, 70]}
df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age',
'Comedy_Score', 'Rating_Score'])
print(df)
3 22 1 24
import pandas as pd
6 26 1 28 15
import pandas as pd
6
32Output: Original DataFrame: Name Age 0 Amit 20 1 Cody 21 2 Drew 25 Data from Users.csv: Name\tAge 0 Amit\t20 1 Cody\t21 2 Drew\t25 Chúng ta có thể lưu dữ liệu trong Python không?Mô -đun Pickle của Thư viện tiêu chuẩn cho phép bạn lưu và khôi phục và khôi phục các đối tượng dữ liệu Python một cách dễ dàng và hiệu quả. Dưa chua. Hàm Dump () lưu dữ liệu vào đĩa.. The pickle. dump() function saves data to disk.
Làm cách nào để lưu dữ liệu gấu trúc bằng python?Làm thế nào để lưu gấu trúc DataFrame dưới dạng tệp CSV ?.. Mục tiêu công thức.Sau khi làm việc trên một bộ dữ liệu và thực hiện tất cả các tiền xử lý, chúng tôi cần lưu dữ liệu được xử lý trước vào một số định dạng như trong CSV, Excel hoặc các loại khác..... Bước 1 - Nhập thư viện.Nhập GANDAS dưới dạng PD..... Bước 2 - Thiết lập dữ liệu..... Bước 3 - Lưu DataFrame .. Save () trong Python là gì?Lưu () hàm.Hàm Save () được sử dụng để lưu một mảng vào tệp nhị phân ở định dạng .npy numpy.used to save an array to a binary file in NumPy . npy format.
Làm cách nào để lưu tệp CSV trong Python?Python viết tệp CSV.. Đầu tiên, hãy mở tệp CSV để ghi (chế độ W) bằng cách sử dụng hàm Open () .. Thứ hai, tạo đối tượng người viết CSV bằng cách gọi hàm writer () của mô -đun CSV .. Thứ ba, ghi dữ liệu vào tệp CSV bằng cách gọi phương thức Writerow () hoặc Writerows () của đối tượng người viết CSV .. |