Làm cách nào để đọc tệp csv vào khung dữ liệu trong python?
Đôi khi, bạn có thể cần đọc hoặc nhập nhiều tệp CSV từ một thư mục hoặc từ danh sách tệp và chuyển đổi chúng thành DataFrame của gấu trúc. Bạn có thể làm điều này bằng cách đọc từng tệp CSV vào DataFrame và nối thêm hoặc nối các DataFrame để tạo một DataFrame duy nhất có dữ liệu từ tất cả các tệp Show Ở đây, tôi sẽ sử dụng read_csv() để đọc tệp CSV và hàm concat() để nối các DataFrame lại với nhau để tạo một DataFrame lớn 1. Đọc nhiều tệp CSV từ danh sáchKhi bạn muốn đọc nhiều tệp CSV tồn tại trong các thư mục khác nhau, trước tiên hãy tạo danh sách các chuỗi có đường dẫn tuyệt đối và sử dụng danh sách đó như được hiển thị bên dưới để tải tất cả các tệp CSV và tạo một Khung dữ liệu gấu trúc lớn
Lưu ý rằng theo mặc định, phương thức concat() thực hiện nghĩa hoạt động nối thêm, nó nối thêm từng DataFrame vào cuối một DataFrame khác và tạo một DataFrame duy nhất. Tương tự với SQL union 2. Đọc nhiều tệp CSV từ một thư mụcThật không may, read_csv() không hỗ trợ đọc nhiều tệp CSV từ một thư mục vào DataFrame, có thể trong các phiên bản pandas trong tương lai, nó có thể hỗ trợ nó, cho đến lúc đó chúng tôi phải sử dụng giải pháp thay thế để đọc nhiều tệp CSV từ một thư mục và hợp nhất chúng vào DataFrame
Một cách tiếp cận khác sử dụng hàm map()
Trong trường hợp bạn muốn sử dụng các tham số tùy chọn của hàm read_csv(), hãy sử dụng nó bằng cách xác định hàm
3. Sử dụng khung dữ liệu DaskDask Dataframes triển khai một tập hợp con của API khung dữ liệu Pandas. Nếu tất cả dữ liệu phù hợp với bộ nhớ, bạn có thể chuyển đổi DataFrame thành Pandas DataFrame Thư viện Dask có thể được sử dụng để đọc khung dữ liệu từ nhiều tệp. Trước khi bạn sử dụng thư viện Dask, trước tiên bạn cần cài đặt nó bằng lệnh pip hoặc bất kỳ phương pháp nào khác
Phần kết luậnTrong bài viết này, bạn đã học được nhiều cách đọc tệp CSV từ một thư mục và tạo một DataFrame lớn. Vì hàm read_csv() không hỗ trợ đọc nên bạn phải sử dụng cách tải từng CSV vào một DataFrame riêng biệt và kết hợp chúng bằng hàm concat() Đây là một giải pháp thay thế cho thư viện pandas bằng mô-đun csv tích hợp của Python
sẽ in Tạo khung dữ liệu bằng tệp CSV Cải thiện bài viết Lưu bài viết Thích bài viết
Cải thiện bài viết Lưu bài viết Tệp CSV là “các giá trị được phân tách bằng dấu phẩy”, các giá trị này được phân tách bằng dấu phẩy, tệp này có thể được xem như một tệp excel. Trong Python, Pandas là thư viện quan trọng nhất đối với khoa học dữ liệu. Chúng tôi cần xử lý các tập dữ liệu khổng lồ trong khi phân tích dữ liệu, thường có thể nhận được ở định dạng tệp CSV. Có thể tạo khung dữ liệu gấu trúc bằng tệp CSV theo nhiều cách Python3________số 8_______
đầu ra Phương pháp #2. Sử dụng phương thức read_table(). read_table() là một chức năng gấu trúc quan trọng khác để đọc các tệp csv và tạo khung dữ liệu từ nó Python3________số 8_______
đầu ra Phương pháp #3. Sử dụng mô-đun csv. Người ta có thể nhập trực tiếp các tệp csv bằng mô-đun csv và sau đó tạo khung dữ liệu bằng tệp csv đó Python3________số 8_______
đầu ra. ['TM195', '18', 'Male', '14', 'Single', '3', '4', '29562', '112']
Ghi chú cá nhân của tôi arrow_drop_up Tiết kiệm Vui lòng Đăng nhập để nhận xét.Tệp csv có thể được chuyển đổi thành DataFrame Python không?Hàm pandas read_csv() nhập tệp CSV sang định dạng DataFrame . tiêu đề. điều này cho phép bạn chỉ định hàng nào sẽ được sử dụng làm tên cột cho khung dữ liệu của bạn. Dự kiến một giá trị int hoặc danh sách các giá trị int. Giá trị mặc định là header=0 , có nghĩa là hàng đầu tiên của tệp CSV sẽ được coi là tên cột.
Chúng tôi có thể nhập tệp CSV trong khung dữ liệu không?Sử dụng hàm read_csv() từ gói pandas, bạn có thể nhập dữ liệu dạng bảng từ tệp CSV vào khung dữ liệu pandas bằng cách chỉ định giá trị tham số cho tên tệp (e. g. pd. read_csv("tên tệp. csv") ). Hãy nhớ rằng bạn đã đặt bí danh cho gấu trúc ( pd ), vì vậy bạn sẽ sử dụng pd để gọi các hàm của gấu trúc. |