Đây là tài liệu Python chính thức về đọc và ghi từ tệp. Nhưng trước khi đọc nó, hãy đi sâu vào những điều tối thiểu mà tôi muốn bạn biết
Hãy đi thẳng vào một ví dụ mã. Giả sử bạn có một tệp có tên ví dụ. txt trong thư mục hiện tại. Nếu không, chỉ cần tạo một cái, sau đó tô nó bằng những dòng này và lưu nó
hello world
and now
I say
goodbye
Đây là một đoạn mã Python ngắn để mở tệp đó và in nội dung của nó ra màn hình – lưu ý rằng mã Python này phải được chạy trong cùng thư mục chứa tệp
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
1 trong đómyfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
Điều đó có vẻ quá phức tạp?
myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
Đây là cách đọc tệp đó, từng dòng một, sử dụng vòng lặp for
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
[Ghi chú. Nếu bạn đã nhận được FileNotFoundError – điều đó hầu như được mong đợi. Hãy đọc tiếp. ]
Vẫn có vẻ quá phức tạp? . Không chỉ vậy, chúng tôi còn phải đóng tệp theo cách thủ công
Bây giờ chúng ta hãy thực hiện từng bước này
Để mở một tệp, chúng tôi chỉ cần sử dụng phương thức
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
2 và chuyển vào, làm đối số đầu tiên, tên tệpmyfile = open["example.txt"]
Điều đó có vẻ dễ dàng, vì vậy hãy chuyển sang một số lỗi phổ biến
Cách lộn xộn khi mở tệp
Đây có thể là lỗi phổ biến nhất mà bạn sẽ gặp phải khi cố mở một tệp
FileNotFoundError: [Errno 2] No such file or directory: 'SOME_FILENAME'
Trên thực tế, tôi đã thấy các sinh viên lãng phí hàng chục giờ để cố vượt qua thông báo lỗi này, bởi vì họ không dừng lại để đọc nó. Vì vậy, đọc nó.
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
3 có nghĩa là gì?Hãy thử đặt dấu cách nơi viết hoa xảy ra
File Not Found Error
Bạn sẽ gặp lỗi này vì bạn đã cố mở một tệp đơn giản là không tồn tại. Đôi khi, đó là một lỗi đánh máy đơn giản, cố gắng
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
2 một tệp có tên myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
5 nhưng lại vô tình viết sai chính tả thành myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
6Nhưng thường xuyên hơn, đó là vì bạn biết một tệp tồn tại dưới một tên tệp nhất định, chẳng hạn như
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
5 – nhưng làm thế nào để mã Python của bạn biết tệp đó ở đâu? Đó là một câu hỏi khá phức tạp. Nhưng bước đầu tiên để không lãng phí thời gian của bạn là nếu bạn thấy lỗi này, hãy dừng mọi việc bạn đang làm. Đừng điều chỉnh vòng lặp for phức tạp của bạn. Đừng cố cài đặt thư viện Python mới. Đừng khởi động lại máy tính của bạn, sau đó chạy lại tập lệnh để xem lỗi có tự khắc phục được không
Lỗi
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
3 xảy ra do bạn không biết tệp thực sự nằm ở đâu trên máy tính của mình. Hoặc, ngay cả khi bạn làm như vậy, bạn cũng không biết cách nói cho chương trình Python của mình biết nó đang ở đâu. Đừng cố sửa các phần khác trong mã của bạn không liên quan đến việc chỉ định tên tệp hoặc đường dẫnCách sửa lỗi FileNotFoundError
Đây là một sửa chữa chắc chắn. đảm bảo tệp thực sự tồn tại
Hãy bắt đầu lại từ đầu bằng cách mắc lỗi. Trong vỏ hệ thống của bạn [tôi. e. Terminal], thay đổi thư mục Desktop của bạn
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
6Bây giờ, hãy chạy ipython
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
7Và bây giờ bạn đang ở trong trình thông dịch Python tương tác, hãy thử mở một tên tệp mà bạn biết là không tồn tại trên Màn hình của mình, rồi tận hưởng thông báo lỗi
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
8myfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
0Bây giờ hãy tạo thủ công tệp trên Bàn làm việc của bạn, sử dụng Sublime Text 3 hoặc bất cứ thứ gì bạn muốn. Thêm một số văn bản vào nó, sau đó lưu nó
myfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
1Hãy tự mình xem và thấy rằng tệp này thực sự tồn tại trong thư mục Máy tính để bàn của bạn
OK, bây giờ hãy quay lại trình bao Python tương tác của bạn [tôi. e. ipython], cái mà bạn đã mở sau khi chuyển sang thư mục Desktop [i. e.
myfile = open["example.txt"]
0]. Chạy lại lệnh myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
2 đó, lệnh dẫn đến FileNotFoundErrormyfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
8Hy vọng rằng, bạn không nên nhận được một lỗi
Nhưng đối tượng mà biến
myfile = open["example.txt"]
2 trỏ tới là gì? myfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
3Và đó là gì? . e.
myfile = open["example.txt"]
5Sử dụng tính năng tự động hoàn thành Tab [i. e. gõ vào
myfile = open["example.txt"]
6] để có danh sách các phương thức và thuộc tính hiện có cho đối tượng myfile = open["example.txt"]
2myfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
4Chà, chúng ta có thể làm được nhiều việc hơn với các tệp thay vì chỉ
myfile = open["example.txt"]
8 từ chúng. Nhưng bây giờ hãy tập trung vào việc đọcGiả sử biến
myfile = open["example.txt"]
2 trỏ đến một số loại đối tượng tệp, đây là cách bạn đọc từ nómyfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
5Có gì trong biến
FileNotFoundError: [Errno 2] No such file or directory: 'SOME_FILENAME'
0 đó? myfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
6Nó chỉ là một chuỗi. Điều đó có nghĩa là tất nhiên chúng ta có thể in nó ra
myfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
7Hoặc đếm số ký tự
myfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
8Hoặc in ra bằng chữ in hoa toàn bộ
myfile = open["example.txt"]
txt = myfile.read[]
print[txt]
myfile.close[]
9Và đó là tất cả những gì cần đọc từ một tệp đã được mở
Bây giờ vào những sai lầm
Làm thế nào để lộn xộn khi đọc từ một tập tin
Đây là một lỗi rất, rất phổ biến
myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
0Đầu ra lỗi
myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
1Hãy lưu ý cẩn thận rằng đây không phải là FileNotFoundError. Đó là AttributeError – phải thừa nhận là không rõ lắm – nhưng hãy đọc phần tiếp theo
myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
2Thông báo lỗi đến điểm. đối tượng
myfile = open["example.txt"]
5 – tôi. e. một chuỗi ký tự, e. g. một cái gì đó như FileNotFoundError: [Errno 2] No such file or directory: 'SOME_FILENAME'
3 không có thuộc tính FileNotFoundError: [Errno 2] No such file or directory: 'SOME_FILENAME'
4Xem lại mã bị lỗi
myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
0Nếu
FileNotFoundError: [Errno 2] No such file or directory: 'SOME_FILENAME'
5 trỏ đến "ví dụ. txt", thì FileNotFoundError: [Errno 2] No such file or directory: 'SOME_FILENAME'
5 chỉ đơn giản là một đối tượng myfile = open["example.txt"]
5Nói cách khác, tên tệp không phải là đối tượng tệp. Đây là một ví dụ rõ ràng hơn về mã lỗi
myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
4Và để đánh bại quan điểm về cái đầu
myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
5Tại sao đây là một sai lầm phổ biến như vậy? . Giao diện đồ họa làm xáo trộn quy trình – và vì lý do chính đáng. Ai quan tâm chuyện gì đang xảy ra miễn là tệp của tôi mở ra khi tôi nhấp đúp vào tệp
Thật không may, chúng tôi phải quan tâm khi cố gắng đọc tệp theo chương trình. Mở một tệp là một hoạt động rời rạc từ việc đọc nó
- Bạn mở một tệp bằng cách chuyển tên tệp của nó – e. g.
1 – vào hàmmyfile = open["example.txt"] for line in myfile: print[line] myfile.close[]
2. Hàmmyfile = open["example.txt"] for line in myfile: print[line] myfile.close[]
2 trả về một đối tượng tệpmyfile = open["example.txt"] for line in myfile: print[line] myfile.close[]
- Để thực sự đọc nội dung của một tệp, bạn gọi phương thức read[] của đối tượng tệp đó
Một lần nữa, đây là mã, theo kiểu dài dòng hơn một chút
myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
6Đối tượng tệp cũng có phương thức
File Not Found Error
1, phương thức này chính thức dọn sạch sau khi tệp được mở và cho phép các chương trình khác truy cập tệp đó một cách an toàn. Một lần nữa, đó là một chi tiết cấp thấp mà bạn không bao giờ nghĩ đến trong điện toán hàng ngày. Trên thực tế, đó là điều mà bạn có thể sẽ quên trong ngữ cảnh lập trình, vì việc không đóng tệp sẽ không tự động phá vỡ bất kỳ thứ gì [ít nhất là cho đến khi chúng ta bắt đầu thực hiện các loại thao tác tệp phức tạp hơn nhiều…]. Thông thường, ngay sau khi tập lệnh kết thúc, mọi tệp chưa được đóng sẽ tự động bị đóngTuy nhiên, tôi thích đóng tệp một cách rõ ràng - không chỉ để đảm bảo an toàn - mà còn giúp củng cố khái niệm về đối tượng tệp đó
Một trong những lợi thế của việc đi sâu vào các chi tiết cấp thấp hơn của việc mở và đọc từ các tệp là giờ đây chúng tôi có khả năng đọc các tệp theo từng dòng, thay vì một đoạn lớn. Một lần nữa, để đọc các tệp dưới dạng một khối nội dung khổng lồ, hãy sử dụng phương pháp
myfile = open["example.txt"]
8myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
7Có vẻ như bây giờ nó không còn là vấn đề lớn nữa, nhưng đó là bởi vì
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
1 có thể chỉ chứa một vài dòng. Nhưng khi chúng tôi xử lý các tệp lớn – như cả 3. 3 triệu hồ sơ của tất cả những người đã quyên góp hơn 200 đô la cho một U. S. ủy ban chiến dịch tranh cử tổng thống năm 2012 hoặc tất cả những người đã từng đến thăm Nhà Trắng – việc mở và đọc tất cả tệp cùng một lúc sẽ chậm hơn đáng kể. Và nó thậm chí có thể làm hỏng máy tính của bạnNếu bạn thắc mắc tại sao phần mềm bảng tính, chẳng hạn như Excel, có giới hạn số hàng [khoảng 1.000.000], thì đó là vì hầu hết người dùng muốn thao tác trên một tệp dữ liệu cùng một lúc. Tuy nhiên, nhiều tệp dữ liệu thú vị quá lớn đối với điều đó. Chúng ta sẽ gặp những tình huống đó sau trong quý
Hiện tại, đây là cách đọc từng dòng thường trông như thế nào
myfile = open["example.txt"]
for line in myfile:
print[line]
myfile.close[]
Bởi vì mỗi dòng trong một tệp văn bản có một ký tự xuống dòng [được biểu thị là
File Not Found Error
4 nhưng thường là "không nhìn thấy"], nên việc gọi hàm print[] sẽ tạo đầu ra có khoảng cách kép, bởi vì print[] thêm một dòng mới vào nội dung mà nó xuất ra [i. e. nghĩ lại chương trình File Not Found Error
5 ban đầu của bạn]Để loại bỏ hiệu ứng đó, gọi là phương thức ________ 96, thuộc về _______ 65 đối tượng và loại bỏ các ký tự khoảng trắng ở bên trái và bên phải của chuỗi văn bản
myfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
9Và tất nhiên, bạn có thể làm cho mọi thứ trở nên ồn ào với chức năng ol'
File Not Found Error
8 tốtmyfile = open["example.txt"]
print[myfile.read[]]
myfile.close[]
9Đó là nó cho bây giờ. Chúng tôi chưa đề cập đến cách ghi vào một tệp [đây là một thao tác nguy hiểm hơn nhiều] – tôi để dành phần đó cho một bài học riêng. Nhưng cũng đủ biết rằng khi xử lý tệp với tư cách là một lập trình viên, chúng ta phải rõ ràng và cụ thể hơn rất nhiều trong các bước