Hướng dẫn how to save a dataset in python - cách lưu tập dữ liệu trong python

Mục tiêu công thức

Sau khi làm việc trên một bộ dữ liệu và thực hiện tất cả các tiền xử lý, chúng tôi cần lưu dữ liệu được xử lý trước vào một số định dạng như trong CSV, Excel hoặc các loại khác.

Mã nguồn Python này thực hiện như sau: 1. Tạo từ điển dữ liệu và chuyển đổi nó thành DataFrame 2. Lưu nó ở định dạng CSV
1. Creates data dictionary and converts it into dataframe
2. Saves it in CSV format

Vì vậy, đây là công thức về cách chúng ta có thể lưu Pandas DataFrame dưới dạng tệp CSV.

Hãy đến gần hơn với giấc mơ trở thành một nhà khoa học dữ liệu với hơn 70 dự án ML từ đầu đến cuối đã được giải quyếtEnd-to-End ML Projects

Bước 1 - Nhập thư viện

import pandas as pd

Chúng tôi chỉ nhập gấu trúc cần thiết.

Bước 2 - Thiết lập dữ liệu

Chúng tôi đã tạo ra một từ điển dữ liệu và truyền nó trong pd.dataFrame để tạo một dataFrame với các cột 'first_name', 'last_name', 'tuổi', 'comedy_score' và 'xếp hạng_score'. raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df]

Bước 3 - Lưu khung dữ liệu

Vì vậy, bây giờ chúng tôi phải lưu bộ dữ liệu mà chúng tôi đã tạo. Chúng tôi lưu nó ở nhiều định dạng, ở đây chúng tôi đang thực hiện nó trong CSV và Excel bằng cách sử dụng chức năng TO_CSV và TO_EXCEL tương ứng. df.to_csv['raw_data.csv', index=False] df.to_excel['raw_data.xls', index=False] Vì vậy, đầu ra có hai tệp đã lưu một ở định dạng CSV và các tệp khác ở định dạng Excel.

  first_name     last_name  age  Comedy_Score  Rating_Score
0    Sheldon        Copper   42             9            25
1        Raj  Koothrappali   38             7            25
2    Leonard    Hofstadter   36             8            49
3     Howard      Wolowitz   41             8            62
4        Amy        Fowler   35             5            70

Bạn có thể sử dụng thư viện Pickle của Python để đổ dữ liệu vào một tệp.

import pickle

dataset = [1,2,3,4]

with open['my_dataset.pickle', 'wb'] as output:
    pickle.dump[dataset, output]

Sau đó, bạn có thể tải nó trở lại trong một tập lệnh khác.

import pickle

with open['my_dataset.pickle', 'rb'] as data:
    dataset = pickle.load[data]

Xem thảo luận

Cải thiện bài viết

Lưu bài viết

  • Đọc
  • Bàn luận
  • Xem thảo luận

    Cải thiện bài viết

    Lưu bài viết

    Đọc

    Bàn luận

    Python3

    import pandas as pd

    import df.to_csv['raw_data.csv', index=False] df.to_excel['raw_data.xls', index=False] 4

    df.to_csv['raw_data.csv', index=False] df.to_excel['raw_data.xls', index=False] 5

    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1
    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25
    5 df.to_csv['raw_data.csv', index=False] df.to_excel['raw_data.xls', index=False] 8 df.to_csv['raw_data.csv', index=False] df.to_excel['raw_data.xls', index=False] 9import0
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    4import2______14import4import5

    Các

    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25
    3
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1
    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25
    5
    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25
    6
    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25
    7
    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25
    8
    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25
    9 import pandas as pd 0 import pandas as pd 1

    import pandas as pd 2

    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1 import pandas as pd 4
    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25
    3 import pandas as pd 6

    import pandas as pd 7 import pandas as pd 8

    Output:

         name  degree  score
    0  aparna     MBA     90
    1  pankaj     BCA     40
    2  sudhir  M.Tech     80
    3   Geeku     MBA     98

    Xuất CSV sang thư mục làm việc

    Ở đây, chúng tôi chỉ cần xuất một dataFrame sang tệp CSV bằng DF.TO_CSV [].

    Python3

    Output:

    Lưu CSV mà không cần tiêu đề và chỉ mục. & NBSP;

    Ở đây, chúng tôi đang lưu tệp không có tiêu đề và không có số chỉ mục.

    Python3

    import pandas as pd 9 raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df] 0 raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df] 1

    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1 raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df] 3 raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df] 4
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1 raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df] 3 import pandas as pd 6

    Output:

    Lưu tệp CSV vào một vị trí được chỉ định

    Chúng tôi cũng có thể, lưu tập tin của chúng tôi tại một số vị trí cụ thể.

    Python3

    raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df] 8 raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df] 9 import pandas as pd 6

    Output:

    Viết tệp dữ liệu vào tệp CSV bằng cách sử dụng phân tách tab

    Chúng tôi cũng có thể lưu tệp của chúng tôi với một số riêng biệt cụ thể như chúng tôi muốn. I.e, \ \ t.

    Python3

    import pandas as pd

    import df.to_csv['raw_data.csv', index=False] df.to_excel['raw_data.xls', index=False] 4

    df.to_csv['raw_data.csv', index=False] df.to_excel['raw_data.xls', index=False] 5

    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1
    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25
    5 df.to_csv['raw_data.csv', index=False] df.to_excel['raw_data.xls', index=False] 8 df.to_csv['raw_data.csv', index=False] df.to_excel['raw_data.xls', index=False] 9import0
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    4import2______14import4import5

    Các

    Các

    import pandas as pd 7

    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    05
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    06 import pandas as pd 6

    import pandas as pd 7 import pandas as pd 8

    import pandas as pd 7

    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    05
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    12 import pandas as pd 6

    import pandas as pd 9

    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    15
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    16
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    18 raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df] 4
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1 raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'], 'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'], 'age': [42, 38, 36, 41, 35], 'Comedy_Score': [9, 7, 8, 8, 5], 'Rating_Score': [25, 25, 49, 62, 70]} df = pd.DataFrame[raw_data, columns = ['first_name', 'last_name', 'age', 'Comedy_Score', 'Rating_Score']] print[df] 3
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    22
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    24 import pandas as pd 6

    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    26
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    1
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    28
    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    15 import pandas as pd 6

    import pandas as pd 7

    import pickle
    
    dataset = [1,2,3,4]
    
    with open['my_dataset.pickle', 'wb'] as output:
        pickle.dump[dataset, output]
    
    32

    Output:

    Original DataFrame:
       Name  Age
    0  Amit   20
    1  Cody   21
    2  Drew   25
    Data from Users.csv:
      Name\tAge
    0  Amit\t20
    1  Cody\t21
    2  Drew\t25

    Chúng ta có thể lưu dữ liệu trong Python không?

    Mô -đun Pickle của Thư viện tiêu chuẩn cho phép bạn lưu và khôi phục và khôi phục các đối tượng dữ liệu Python một cách dễ dàng và hiệu quả. Dưa chua. Hàm Dump [] lưu dữ liệu vào đĩa.. The pickle. dump[] function saves data to disk.

    Làm cách nào để lưu dữ liệu gấu trúc bằng python?

    Làm thế nào để lưu gấu trúc DataFrame dưới dạng tệp CSV ?..
    Mục tiêu công thức.Sau khi làm việc trên một bộ dữ liệu và thực hiện tất cả các tiền xử lý, chúng tôi cần lưu dữ liệu được xử lý trước vào một số định dạng như trong CSV, Excel hoặc các loại khác.....
    Bước 1 - Nhập thư viện.Nhập GANDAS dưới dạng PD.....
    Bước 2 - Thiết lập dữ liệu.....
    Bước 3 - Lưu DataFrame ..

    Save [] trong Python là gì?

    Lưu [] hàm.Hàm Save [] được sử dụng để lưu một mảng vào tệp nhị phân ở định dạng .npy numpy.used to save an array to a binary file in NumPy . npy format.

    Làm cách nào để lưu tệp CSV trong Python?

    Python viết tệp CSV..
    Đầu tiên, hãy mở tệp CSV để ghi [chế độ W] bằng cách sử dụng hàm Open [] ..
    Thứ hai, tạo đối tượng người viết CSV bằng cách gọi hàm writer [] của mô -đun CSV ..
    Thứ ba, ghi dữ liệu vào tệp CSV bằng cách gọi phương thức Writerow [] hoặc Writerows [] của đối tượng người viết CSV ..

    Bài Viết Liên Quan

    Chủ Đề