Hướng dẫn how do you find duplicates in a text file using python? - làm cách nào để bạn tìm thấy các bản sao trong tệp văn bản bằng python?
Tôi có một tệp văn bản với khoảng 1.200 hàng. Một số trong số họ là bản sao. Làm thế nào tôi có thể tìm thấy các dòng trùng lặp trong tệp (nhưng không lo lắng về trường hợp) và sau đó in văn bản của dòng trên màn hình, để tôi có thể tắt và tìm thấy nó? Tôi không muốn xóa chúng hoặc bất cứ điều gì, chỉ cần tìm thấy những dòng nào có thể là.
JWW 93,8K87 Huy hiệu vàng387 Huy hiệu bạc844 Huy hiệu đồng87 gold badges387 silver badges844 bronze badges hỏi ngày 17 tháng 10 năm 2012 lúc 15:26Oct 17, 2012 at 15:26
4 Điều này khá dễ dàng với một bộ:
Đã trả lời ngày 17 tháng 10 năm 2012 lúc 15:28Oct 17, 2012 at 15:28
Mgilsonmgilsonmgilson 290K62 Huy hiệu vàng610 Huy hiệu bạc677 Huy hiệu đồng62 gold badges610 silver badges677 bronze badges 9 Vì chỉ có 1200 dòng, vì vậy bạn cũng có thể sử dụng
Nếu
đầu ra là:
Đã trả lời ngày 17 tháng 10 năm 2012 lúc 15:34Oct 17, 2012 at 15:34
Ashwini Chaudharyashwini ChaudharyAshwini Chaudhary 238K56 Huy hiệu vàng451 Huy hiệu bạc499 Huy hiệu Đồng56 gold badges451 silver badges499 bronze badges 0 Tìm kiếm các bản sao không nhạy cảm trường hợpĐiều này sẽ không cung cấp cho bạn số dòng, nhưng nó sẽ cung cấp cho bạn một danh sách các dòng trùng lặp mà sau đó bạn có thể điều tra thêm. Ví dụ:
Ví dụ Tệp dữ liệu
Đường ống được liệt kê ở trên sẽ mang lại chính xác:
Tìm số dòngSau đó, bạn có thể grep cho các số dòng liên quan như vậy:
Đã trả lời ngày 17 tháng 10 năm 2012 lúc 15:36Oct 17, 2012 at 15:36
Todd A. Jacobstodd A. JacobsTodd A. Jacobs 78.8K14 Huy hiệu vàng141 Huy hiệu bạc195 Huy hiệu Đồng14 gold badges141 silver badges195 bronze badges Dưới đây là một chương trình ngắn trong Python để xác định số lượng các dòng trùng lặp trong một tệp văn bản. Output:Nếu bạn thích bài đăng trên blog này, vui lòng chia sẻ nó với bạn bè của bạn! |