Chúng tôi sử dụng cookie để cải thiện chất lượng và khả năng sử dụng của trang web HSE. Thông tin thêm về việc sử dụng cookie có sẵn tại đây và các quy định về xử lý dữ liệu cá nhân có thể được tìm thấy tại đây. Bằng cách tiếp tục sử dụng trang web, bạn xác nhận rằng bạn đã được trang web HSE thông báo về việc sử dụng cookie và đồng ý với các quy tắc xử lý dữ liệu cá nhân của chúng tôi. Bạn có thể tắt cookie trong cài đặt trình duyệt của mình
✖Chúng tôi sử dụng cookie để cải thiện chất lượng và khả năng sử dụng của trang web HSE. Thông tin thêm về việc sử dụng cookie có sẵn tại đây và các quy định về xử lý dữ liệu cá nhân có thể được tìm thấy tại đây. Bằng cách tiếp tục sử dụng trang web, bạn xác nhận rằng bạn đã được trang web HSE thông báo về việc sử dụng cookie và đồng ý với các quy tắc xử lý dữ liệu cá nhân của chúng tôi. Bạn có thể tắt cookie trong cài đặt trình duyệt của mình
✖Chương 08 xử lý tệp dữ liệu từ praveenjigajinni
Học viên sẽ được giới thiệu về tệp văn bản trong bài học này. Trọng tâm sẽ là đọc tệp văn bản và cách dữ liệu từ tệp văn bản có thể được sử dụng trong một chương trình. Người học sẽ được hướng dẫn qua các phương pháp chính được sử dụng để đọc tệp văn bản trong Python, trước khi họ hoàn thành hai thử thách về tệp văn bản
Mục tiêu học tập
- Xác định mục đích của tệp dữ liệu ngoài
- Đọc dữ liệu từ tệp văn bản bên ngoài
Python – ngôn ngữ lập trình đòi hỏi khắt khe nhất năm 2018 theo kết quả khảo sát của StackOverflow. Trong tất cả các lý do bao gồm Khoa học dữ liệu, Học máy, kiểu cú pháp tay ngắn và nhiều lý do khác, tính năng đáng chú ý nhất là Xử lý tệp. Tất cả những thao tác ghi vào tệp và đọc tệp có thể dễ dàng thực hiện thông qua Python. Đủ tò mò làm thế nào nó được thực hiện?
Giới thiệu về Python
Python là một ngôn ngữ lập trình hướng đối tượng cấp cao. Nó được phát triển vào năm 1991 bởi Guido Van Rossum. Cú pháp của nó tương tự như ngôn ngữ tiếng Anh và đó là lý do tại sao nó nâng cao khả năng đọc mã. Nó sử dụng thụt đầu dòng để xác định phạm vi của vòng lặp cấu trúc if-else, lớp, v.v.
Python có thể được sử dụng để tạo các ứng dụng phía máy chủ
Python có thể giúp thực hiện tự động hóa tác vụ bằng cách sử dụng tập lệnh
Python được sử dụng để tạo các ứng dụng độc lập
Python được sử dụng trong Dữ liệu lớn, khoa học dữ liệu, Học máy………
Trên thực tế, danh sách có thể tiếp tục. Điều này xác định sức mạnh của Python như một ngôn ngữ lập trình. Do đó, điều rất quan trọng là học cách ghi vào một tệp bằng python và sau đó đọc từ cùng một tệp
Tầm quan trọng của việc xử lý tệp trong Python
Câu hỏi này chắc hẳn đã khiến bạn đau đầu phải không? .
Chà, hãy lấy một ví dụ, giả sử bạn muốn tập lệnh python của mình tìm nạp dữ liệu từ internet và sau đó xử lý dữ liệu đó. Bây giờ nếu dữ liệu nhỏ thì quá trình xử lý này có thể được thực hiện mỗi khi bạn chạy tập lệnh nhưng trong trường hợp quá trình xử lý lặp đi lặp lại dữ liệu khổng lồ thì không thể thực hiện được, do đó dữ liệu đã xử lý cần được lưu trữ. Đây là nơi lưu trữ dữ liệu hoặc ghi vào tệp. Một điều cần lưu ý khi ghi dữ liệu vào tệp là tính nhất quán và tính toàn vẹn của tệp phải được duy trì
Khi bạn đã lưu trữ dữ liệu của mình trên một tệp, điều quan trọng nhất bây giờ là truy xuất vì trong máy tính, dữ liệu được lưu dưới dạng bit 1 và 0 và nếu quá trình truy xuất không được thực hiện đúng cách thì nó sẽ trở nên hoàn toàn vô dụng và dữ liệu được cho là bị hỏng
Do đó viết cũng như đọc cũng là khía cạnh quan trọng của Xử lý tệp trong python
Làm cách nào để ghi vào tệp bằng Python?
Hãy lấy một ví dụ để hiểu các bước tiêu chuẩn được sử dụng trong Xử lý tệp trong Python
- Mở tệp để ghi
- Thêm và ghi vào một tập tin
- Đóng một tập tin
Xử lý tập tin. Khai mạc
Xem xét một cuốn sách bạn muốn viết. Trước tiên, bạn cần mở cuốn sách đó để bạn có thể viết vào đó. Phải không?
Ở đây cũng vậy, trước tiên, bạn cần mở tệp để bạn có thể ghi vào đó. Vì vậy, để mở một tệp trong python, chúng tôi sử dụng cú pháp sau
object = open[file_name, mode]
Hàm open trả về phiên bản của tệp mà bạn đã mở để làm việc. Phải mất 2 đối số chủ yếu, file_name và chế độ. Có bốn chế độ khác nhau mà bạn có thể mở tệp để
“r” = Nếu bạn muốn đọc từ một tệp
“w” = Nếu bạn muốn ghi vào một tệp xóa hoàn toàn dữ liệu trước đó
“a” = Nếu bạn muốn thêm vào tệp đã viết trước đó
“x” = Nếu bạn chỉ muốn tạo một tệp
Các chế độ được sử dụng bổ sung để chỉ định loại tệp là
“t” = Tệp văn bản, Giá trị mặc định
“b” = tệp nhị phân. ví dụ. Hình ảnh
Ví dụ
fp = open[“my_file.png”, “rb”]
Điều này sẽ mở một tệp có tên my_file. png ở định dạng nhị phân
Viết trong tệp bằng Python
Để ghi vào một tệp trước tiên, bạn phải mở nó ở chế độ ghi và sau đó bạn có thể ghi vào nó. Tuy nhiên, điều quan trọng cần lưu ý là tất cả dữ liệu đã ghi trước đó sẽ bị ghi đè
Đối với ví dụ này, hãy đặt tên tệp là edureka. txt và viết vào đó bằng python
fp = open[“edureka.txt”, “wt”] for _ in range[10]: fp.write[“Edureka is a platform for developing market based skills”] fp.close[]
Như bạn có thể thấy, để ghi vào một tệp, trước tiên tôi phải mở một tệp có tên là edureka. txt và lưu phiên bản của nó trong biến fp. Bây giờ tôi đã chạy vòng lặp 10 lần để viết “Edureka là một nền tảng để phát triển các kỹ năng dựa trên thị trường” trong tệp đó 10 lần. Bây giờ để thực hành lập trình tốt, bạn phải đóng tất cả các tệp mà bạn đã mở
Một điều cần lưu ý ở đây là để ghi văn bản vào một tập tin, bạn phải mở nó ở chế độ văn bản [“t”]. Nếu bạn đang làm việc với tệp nhị phân, hãy sử dụng “b” khi mở tệp
Bây giờ chúng ta hãy ghi vào tệp nhị phân, điều đầu tiên cần nhớ khi ghi vào tệp nhị phân là dữ liệu phải được chuyển đổi thành định dạng nhị phân trước khi ghi. Hơn nữa, dữ liệu nhị phân không thể đọc được do con người không thể đọc nó bằng cách mở tệp
fp = open[“binaryFile”, “wb”] Data = [1,2,3] fp.write[bytearray[Data]] fp.close[]
Ở đây bạn có thể thấy tôi đã mở tệp nhị phân đầu tiên để ghi dữ liệu của mình vào đó. Hãy xem xét tôi có một mảng thông tin để ghi vào một tệp [trong trường hợp này là Dữ liệu], sau đó trước tiên tôi chuyển đổi thành dữ liệu nhị phân bằng cách sử dụng hàm bytearray[] để dữ liệu được chuyển đổi thành định dạng nhị phân. Sau đó, cuối cùng, tôi đã đóng tập tin
Thêm vào một tập tin
Bây giờ, hầu hết các lần bạn sẽ ghi vào một tệp mà không hủy nội dung trước đó. Để ghi vào một tệp trong khi giữ nguyên nội dung trước đó được gọi là nối thêm vào tệp
Đối với ví dụ này, hãy thêm vào cùng một tệp mà chúng tôi đã tạo. Hãy thêm vào edureka. txt
fp = open[“edureka,txt”, “at”] for _ in range[5]: fp.write[“I am appending something to it!”] fp.close[]
Bây giờ trong ví dụ trên, bạn có thể thấy rằng tôi đã mở một tệp có tên là edureka. txt bằng chế độ chắp thêm. Điều này nói với python rằng không ghi đè dữ liệu mà bắt đầu ghi từ dòng cuối cùng. Vì vậy, những gì nó sẽ làm bây giờ là sau dòng kết thúc, nó sẽ thêm “Tôi đang thêm một cái gì đó vào nó. " 5 lần. Và sau đó chúng tôi đã đóng tập tin đó
Đóng một tập tin
Chà, tôi đã chỉ ra cách đóng một tệp. Chỉ cần sử dụng file_reference. close[] trong python để đóng tệp đã mở
Ví dụ
fp = open[“edureka,txt”, “at”] # Do some work! fp.close[]
Bây giờ, tại sao tôi lại quá căng thẳng khi đóng một tập tin?
Vì vậy, có nhiều lý do
- Nếu một tệp được mở để thực hiện bất kỳ thao tác nào thì nó sẽ bị khóa để mở bởi bất kỳ tài nguyên nào khác cho đến khi quá trình tự đóng nó
- Hệ điều hành kiểm tra số lượng tệp được mở bởi một chương trình và do đó, việc đóng tệp sau khi sử dụng cho phép bạn duy trì giới hạn đó
- Quản lý tài nguyên hiệu quả
- Thực hành lập trình tốt
Đến đây, chúng ta đã kết thúc bài viết Xử lý tệp trong Python này. Tôi hy vọng bạn đã hiểu về Mở, Đọc/ Viết và Cuối cùng là Đóng một tệp trong Python
Để có kiến thức chuyên sâu về Python cùng với các ứng dụng khác nhau của nó, bạn có thể đăng ký tại đây để được đào tạo trực tuyến trực tiếp với sự hỗ trợ 24/7 và quyền truy cập trọn đời
Có một câu hỏi cho chúng tôi?