Ghi vào csv python

Một csv là viết tắt của [các giá trị được phân tách bằng dấu phẩy] được định nghĩa là một định dạng tệp đơn giản sử dụng cấu trúc cụ thể để sắp xếp dữ liệu dạng bảng. Nó lưu trữ dữ liệu dưới dạng bảng như bảng tính hoặc cơ sở dữ liệu bằng văn bản thuần túy và có định dạng chung để trao đổi dữ liệu. Tệp csv được mở bằng excel và hàng dữ liệu và cột định dạng định dạng


Các hàm của module CSV trong Python

Công việc mô-đun CSV được sử dụng để xử lý các tệp CSV để đọc và nhận dữ liệu từ các cột được chỉ định. Có nhiều loại hàm CSV khác nhau, chẳng hạn như sau

  • csv. field_size_limit - Nó trả về kích thước tối đa của trường hiện tại được cho phép bởi trình phân tích cú pháp
  • csv. get_dialect - Trả về phương ngữ liên kết đến tên
  • csv. list_dialects - Trả về tên của tất cả các phương ngữ đã đăng ký
  • csv. reader - Đọc dữ liệu từ tệp csv
  • csv. register_dialect - Nó liên kết phương ngữ với một tên. Tên phải là một chuỗi hoặc một đối tượng Unicode
  • csv. nhà văn - Ghi dữ liệu vào tệp csv
  • csv. unregister_dialect - Nó xóa phương ngữ được liên kết với tên từ đăng ký phương ngữ. Nếu tên không phải là tên phương ngữ đã đăng ký, thì lỗi sẽ được đưa ra
  • csv. QUOTE_ALL - Nó hướng đối tượng người viết trích dẫn tất cả các trường. csv. QUOTE_MINIMAL - Nó hướng đối tượng người viết chỉ trích dẫn những trường có chứa các ký tự đặc biệt như dấu ngoặc kép, dấu phân cách, v. v
  • csv. QUOTE_NONNUMERIC - Nó hướng đối tượng người viết trích dẫn tất cả các trường không phải là số
  • csv. QUOTE_NONE - Nó hướng đối tượng nhà văn không bao giờ trích dẫn các trường

Đọc tệp CSV trong Python

Trong Python, mô-đun csv. reader[] được sử dụng để đọc tệp csv. Nó đọc từng hàng của tệp và tạo danh sách tất cả các cột

Tệp CSV là một loại tệp văn bản thuần túy sử dụng cấu trúc cụ thể để sắp xếp bảng định dạng dữ liệu. CSV là một định dạng biến phổ biến để trao đổi dữ liệu vì sự nhỏ gọn, đơn giản và tính thuật ngữ. Nhiều dịch vụ trực tuyến cho phép người dùng xuất dữ liệu dạng bảng từ trang web thành tệp CSV. Các tệp của CSV sẽ mở bằng Excel và gần như tất cả các cơ sở dữ liệu đều có công cụ cho phép nhập từ tệp CSV. Định dạng chuẩn được xác định bởi dữ liệu hàng và cột. Hơn nữa, mỗi hàng được kết thúc bởi một dòng mới để bắt đầu hàng tiếp theo. Cũng trong hàng, mỗi cột được phân tách bằng dấu phẩy

Trong bài viết này, bạn sẽ tìm hiểu về

  • Tệp CSV là gì?

  • CSV mẫu

  • Mô-đun CSV trong Python

  • Các hàm trong CSV mô-đun

  • Đọc từ tệp CSV

  • Read under a dictionary

  • Ghi vào tệp CSV

  • Đọc tệp CSV với Pandas

  • Ghi vào tệp CSV bằng Pandas

CSV mẫu

Dữ liệu ở dạng bảng còn được gọi là CSV [Các giá trị được phân tách bằng dấu phẩy]- nghĩa là "giá trị được phân tách bằng dấu phẩy". Đây là một định dạng văn bản dành cho việc trình bày bảng biểu dữ liệu. Mỗi dòng của tệp là một dòng của bảng. Giá trị của các cột riêng lẻ được phân tách bằng ký hiệu phân cách - dấu phẩy [,], dấu chấm phẩy [;] hoặc ký hiệu khác. CSV có thể dễ dàng đọc và xử lý bằng Python

Sau bảng chọn

Data Table

Ngôn ngữ lập trình

Design by

Xuất hiện

Extension extension

con trăn

Hướng dẫn van Rossum

1991

py

Java

James Gosling

1995

java

C++

Bjarne Stroustrup

1983

cpp

Bạn có thể biểu diễn bảng này trong csv như dưới đây

Data CSV

Ngôn ngữ lập trình,Thiết kế bởi,Xuất hiện,Định dạng mở rộng

Trăn, Guido van Rossum, 1991,. py

Java, James Gosling, 1995,. java

C++, Bjarne Stroustrup, 1983,. cpp

 

Như bạn có thể thấy mỗi hàng là một dòng mới và mỗi cột được phân tách bằng dấu phẩy. Đây là một ví dụ cho thấy cách bố trí tệp CSV

Mô-đun CSV trong Python

Python cung cấp một CSV mô-đun để xử lý các tệp CSV. Để đọc/ghi dữ liệu, bạn cần duyệt qua các hàng của CSV. Bạn cần sử dụng phương pháp phân tách để lấy dữ liệu từ các cột được chỉ định

Các hàm trong CSV mô-đun

Trong tài liệu mô-đun CSV tài liệu, bạn có thể tìm thấy các hàm sau

  • csv. field_size_limit - trả lại kích thước trường tối đa

  • csv. get_dialect - lấy dữ liệu được liên kết với tên

  • csv. list_dialects - hiển thị tất cả các dữ liệu đã đăng ký

  • csv. reader - read data from file csv

  • csv. register_dialect - link data with name

  • csv. nhà văn - ghi dữ liệu vào tệp csv

  • csv. unregister_dialect - xóa dữ liệu liên quan đến tên đăng ký

  • csv. QUOTE_ALL - Trích dẫn mọi thứ, không phân biệt kiểu

  • csv. QUOTE_MINIMAL – Trích dẫn các trường chứa ký tự đặc biệt

  • csv. QUOTE_NONNUMERIC - Trích dẫn tất cả các trường không có giá trị số

  • csv. QUOTE_NONE - Không trích dẫn bất cứ điều gì ở đầu ra

Trong bài viết này, chúng tôi sẽ chỉ tập trung vào các chức năng đọc và ghi cho phép bạn chỉnh sửa, thay đổi và thao tác dữ liệu trong tệp CSV

Cách đọc tệp CSV

Để đọc dữ liệu từ tệp CSV, bạn phải sử dụng hàm đọc để tạo đối tượng đọc

Hàm đọc được viết để lấy từng hàng của tệp và tạo danh sách tất cả các cột. Sau đó, bạn phải chọn cột bạn muốn trích xuất dữ liệu

Điều này nghe có vẻ phức tạp hơn nhiều so với thực tế vốn có của nó. Hãy xem ví dụ sau để thấy rằng làm việc với tệp csv không quá khó

#import necessary modules
import csv
with open['X:\data.csv','rt']as f:
  data = csv.reader[f]
  for row in data:
        print[row]

Khi bạn thực hiện chương trình trên, đầu tiên sẽ là

['Programming language; Designed by; Appeared; Extension']
['Python; Guido van Rossum; 1991; .py']
['Java; James Gosling; 1995; .java']
['C++; Bjarne Stroustrup;1983;.cpp']

Cách đọc CSV dưới dạng từ điển

Bạn cũng có thể sử dụng DictReader để đọc tệp CSV. Các kết quả được xem như một từ điển trong đó hàng tiêu đề là từ khóa và các hàng khác là giá trị

Vui lòng xem xét các mã sau đây

#import necessary modules
import csv

reader = csv.DictReader[open["file2.csv"]]
for raw in reader:
    print[raw]

Kết quả của this code is

OrderedDict[[['Programming language', 'Python'], ['Designed by', 'Guido van Rossum'], [' Appeared', ' 1991'], [' Extension', ' .py']]]
OrderedDict[[['Programming language', 'Java'], ['Designed by', 'James Gosling'], [' Appeared', ' 1995'], [' Extension', ' .java']]]
OrderedDict[[['Programming language', 'C++'], ['Designed by', ' Bjarne Stroustrup'], [' Appeared', ' 1985'], [' Extension', ' .cpp']]]

Sử dụng cách này để đọc dữ liệu từ tệp CSV dễ dàng hơn nhiều so với phương pháp trước đó. Tuy nhiên, đây không phải là cách tốt nhất để đọc dữ liệu

Cách viết tệp CSV

Khi bạn có một bộ dữ liệu mà bạn muốn lưu trữ trong tệp CSV, bạn phải sử dụng hàm writer[]. Để lặp lại dữ liệu qua các hàng [dòng], bạn phải sử dụng hàm writerow[]

Please view ví dụ sau. We write data into a file "writeData. csv" trong dấu phân cách đó là dấu nháy đơn

#import necessary modules
import csv

with open['X:\writeData.csv', mode='w'] as file:
    writer = csv.writer[file, delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL]

    #way to write to csv file
    writer.writerow[['Programming language', 'Designed by', 'Appeared', 'Extension']]
    writer.writerow[['Python', 'Guido van Rossum', '1991', '.py']]
    writer.writerow[['Java', 'James Gosling', '1995', '.java']]
    writer.writerow[['C++', 'Bjarne Stroustrup', '1985', '.cpp']]

Kết quả trong tệp csv là

Programming language, Designed by, Appeared, Extension 
Python, Guido van Rossum, 1991, .py
Java, James Gosling, 1995, .java
C++, Bjarne Stroustrup,1983,.cpp

Đọc tệp CSV với Pandas

Pandas là thư viện mã nguồn mở cho phép bạn xử lý dữ liệu trong Python. Pandas cung cấp một cách dễ dàng để tạo, thao tác và xóa dữ liệu

Chủ Đề