Kết quả học tập của việc xử lý tệp dữ liệu trong python

Chúng tôi sử dụng cookie để cải thiện chất lượng và khả năng sử dụng của trang web HSE. Thông tin thêm về việc sử dụng cookie có sẵn tại đây và các quy định về xử lý dữ liệu cá nhân có thể được tìm thấy tại đây. Bằng cách tiếp tục sử dụng trang web, bạn xác nhận rằng bạn đã được trang web HSE thông báo về việc sử dụng cookie và đồng ý với các quy tắc xử lý dữ liệu cá nhân của chúng tôi. Bạn có thể tắt cookie trong cài đặt trình duyệt của mình

Chúng tôi sử dụng cookie để cải thiện chất lượng và khả năng sử dụng của trang web HSE. Thông tin thêm về việc sử dụng cookie có sẵn tại đây và các quy định về xử lý dữ liệu cá nhân có thể được tìm thấy tại đây. Bằng cách tiếp tục sử dụng trang web, bạn xác nhận rằng bạn đã được trang web HSE thông báo về việc sử dụng cookie và đồng ý với các quy tắc xử lý dữ liệu cá nhân của chúng tôi. Bạn có thể tắt cookie trong cài đặt trình duyệt của mình

Chương 08 xử lý tệp dữ liệu từ praveenjigajinni

Học viên sẽ được giới thiệu về tệp văn bản trong bài học này. Trọng tâm sẽ là đọc tệp văn bản và cách dữ liệu từ tệp văn bản có thể được sử dụng trong một chương trình. Người học sẽ được hướng dẫn qua các phương pháp chính được sử dụng để đọc tệp văn bản trong Python, trước khi họ hoàn thành hai thử thách về tệp văn bản

Mục tiêu học tập

  • Xác định mục đích của tệp dữ liệu ngoài
  • Đọc dữ liệu từ tệp văn bản bên ngoài

Python – ngôn ngữ lập trình đòi hỏi khắt khe nhất năm 2018 theo kết quả khảo sát của StackOverflow. Trong tất cả các lý do bao gồm Khoa học dữ liệu, Học máy, kiểu cú pháp tay ngắn và nhiều lý do khác, tính năng đáng chú ý nhất là Xử lý tệp. Tất cả những thao tác ghi vào tệp và đọc tệp có thể dễ dàng thực hiện thông qua Python. Đủ tò mò làm thế nào nó được thực hiện?

Giới thiệu về Python

Python là một ngôn ngữ lập trình hướng đối tượng cấp cao. Nó được phát triển vào năm 1991 bởi Guido Van Rossum. Cú pháp của nó tương tự như ngôn ngữ tiếng Anh và đó là lý do tại sao nó nâng cao khả năng đọc mã. Nó sử dụng thụt đầu dòng để xác định phạm vi của vòng lặp cấu trúc if-else, lớp, v.v.  

Python có thể được sử dụng để tạo các ứng dụng phía máy chủ

  • Python có thể giúp thực hiện tự động hóa tác vụ bằng cách sử dụng tập lệnh

  • Python được sử dụng để tạo các ứng dụng độc lập

  • Python được sử dụng trong Dữ liệu lớn, khoa học dữ liệu, Học máy………

Trên thực tế, danh sách có thể tiếp tục. Điều này xác định sức mạnh của Python như một ngôn ngữ lập trình. Do đó, điều rất quan trọng là học cách ghi vào một tệp bằng python và sau đó đọc từ cùng một tệp

Tầm quan trọng của việc xử lý tệp trong Python

Câu hỏi này chắc hẳn đã khiến bạn đau đầu phải không? .  

Chà, hãy lấy một ví dụ, giả sử bạn muốn tập lệnh python của mình tìm nạp dữ liệu từ internet và sau đó xử lý dữ liệu đó. Bây giờ nếu dữ liệu nhỏ thì quá trình xử lý này có thể được thực hiện mỗi khi bạn chạy tập lệnh nhưng trong trường hợp quá trình xử lý lặp đi lặp lại dữ liệu khổng lồ thì không thể thực hiện được, do đó dữ liệu đã xử lý cần được lưu trữ. Đây là nơi lưu trữ dữ liệu hoặc ghi vào tệp. Một điều cần lưu ý khi ghi dữ liệu vào tệp là tính nhất quán và tính toàn vẹn của tệp phải được duy trì

Khi bạn đã lưu trữ dữ liệu của mình trên một tệp, điều quan trọng nhất bây giờ là truy xuất vì trong máy tính, dữ liệu được lưu dưới dạng bit 1 và 0 và nếu quá trình truy xuất không được thực hiện đúng cách thì nó sẽ trở nên hoàn toàn vô dụng và dữ liệu được cho là bị hỏng

Do đó viết cũng như đọc cũng là khía cạnh quan trọng của Xử lý tệp trong python

Làm cách nào để ghi vào tệp bằng Python?

Hãy lấy một ví dụ để hiểu các bước tiêu chuẩn được sử dụng trong Xử lý tệp trong Python

  • Mở tệp để ghi
  • Thêm và ghi vào một tập tin
  • Đóng một tập tin

Xử lý tập tin. Khai mạc

Xem xét một cuốn sách bạn muốn viết. Trước tiên, bạn cần mở cuốn sách đó để bạn có thể viết vào đó. Phải không?

Ở đây cũng vậy, trước tiên, bạn cần mở tệp để bạn có thể ghi vào đó. Vì vậy, để mở một tệp trong python, chúng tôi sử dụng cú pháp sau

object = open[file_name, mode]

Hàm open trả về phiên bản của tệp mà bạn đã mở để làm việc. Phải mất 2 đối số chủ yếu, file_name và chế độ. Có bốn chế độ khác nhau mà bạn có thể mở tệp để

  1. “r”  = Nếu bạn muốn đọc từ một tệp

  2. “w” = Nếu bạn muốn ghi vào một tệp xóa hoàn toàn dữ liệu trước đó

  3. “a” = Nếu bạn muốn thêm vào tệp đã viết trước đó

  4. “x” = Nếu bạn chỉ muốn tạo một tệp

Các chế độ được sử dụng bổ sung để chỉ định loại tệp là

  1. “t” = Tệp văn bản, Giá trị mặc định

  2. “b” = tệp nhị phân. ví dụ. Hình ảnh

Ví dụ

fp = open[“my_file.png”, “rb”]

Điều này sẽ mở một tệp có tên my_file. png ở định dạng nhị phân

Viết trong tệp bằng Python

Để ghi vào một tệp trước tiên, bạn phải mở nó ở chế độ ghi và sau đó bạn có thể ghi vào nó. Tuy nhiên, điều quan trọng cần lưu ý là tất cả dữ liệu đã ghi trước đó sẽ bị ghi đè

Đối với ví dụ này, hãy đặt tên tệp là edureka. txt và viết vào đó bằng python

fp = open[“edureka.txt”, “wt”]
for _ in range[10]:
	fp.write[“Edureka is a platform for developing market based skills”]
fp.close[]

Như bạn có thể thấy, để ghi vào một tệp, trước tiên tôi phải mở một tệp có tên là edureka. txt và lưu phiên bản của nó trong biến fp. Bây giờ tôi đã chạy vòng lặp 10 lần để viết “Edureka là một nền tảng để phát triển các kỹ năng dựa trên thị trường” trong tệp đó 10 lần. Bây giờ để thực hành lập trình tốt, bạn phải đóng tất cả các tệp mà bạn đã mở

Một điều cần lưu ý ở đây là để ghi văn bản vào một tập tin, bạn phải mở nó ở chế độ văn bản [“t”]. Nếu bạn đang làm việc với tệp nhị phân, hãy sử dụng “b” khi mở tệp

Bây giờ chúng ta hãy ghi vào tệp nhị phân, điều đầu tiên cần nhớ khi ghi vào tệp nhị phân là dữ liệu phải được chuyển đổi thành định dạng nhị phân trước khi ghi. Hơn nữa, dữ liệu nhị phân không thể đọc được do con người không thể đọc nó bằng cách mở tệp

fp = open[“binaryFile”, “wb”]
Data = [1,2,3]
fp.write[bytearray[Data]]
fp.close[]

Ở đây bạn có thể thấy tôi đã mở tệp nhị phân đầu tiên để ghi dữ liệu của mình vào đó. Hãy xem xét tôi có một mảng thông tin để ghi vào một tệp [trong trường hợp này là Dữ liệu], sau đó trước tiên tôi chuyển đổi thành dữ liệu nhị phân bằng cách sử dụng hàm bytearray[] để dữ liệu được chuyển đổi thành định dạng nhị phân. Sau đó, cuối cùng, tôi đã đóng tập tin

Thêm vào một tập tin

Bây giờ, hầu hết các lần bạn sẽ ghi vào một tệp mà không hủy nội dung trước đó. Để ghi vào một tệp trong khi giữ nguyên nội dung trước đó được gọi là nối thêm vào tệp

Đối với ví dụ này, hãy thêm vào cùng một tệp mà chúng tôi đã tạo. Hãy thêm vào edureka. txt

fp = open[“edureka,txt”, “at”]
for _ in range[5]:
	fp.write[“I am appending something to it!”]
fp.close[]

Bây giờ trong ví dụ trên, bạn có thể thấy rằng tôi đã mở một tệp có tên là edureka. txt bằng chế độ chắp thêm. Điều này nói với python rằng không ghi đè dữ liệu mà bắt đầu ghi từ dòng cuối cùng. Vì vậy, những gì nó sẽ làm bây giờ là sau dòng kết thúc, nó sẽ thêm “Tôi đang thêm một cái gì đó vào nó. " 5 lần. Và sau đó chúng tôi đã đóng tập tin đó

Đóng một tập tin

Chà, tôi đã chỉ ra cách đóng một tệp. Chỉ cần sử dụng file_reference. close[] trong python để đóng tệp đã mở

Ví dụ

fp = open[“edureka,txt”, “at”]
# Do some work!
fp.close[]

Bây giờ, tại sao tôi lại quá căng thẳng khi đóng một tập tin?

Vì vậy, có nhiều lý do

  • Nếu một tệp được mở để thực hiện bất kỳ thao tác nào thì nó sẽ bị khóa để mở bởi bất kỳ tài nguyên nào khác cho đến khi quá trình tự đóng nó
  • Hệ điều hành kiểm tra số lượng tệp được mở bởi một chương trình và do đó, việc đóng tệp sau khi sử dụng cho phép bạn duy trì giới hạn đó
  • Quản lý tài nguyên hiệu quả
  • Thực hành lập trình tốt

Đến đây, chúng ta đã kết thúc bài viết Xử lý tệp trong Python này. Tôi hy vọng bạn đã hiểu về Mở, Đọc/ Viết và Cuối cùng là Đóng một tệp trong Python

Để có kiến ​​thức chuyên sâu về Python cùng với các ứng dụng khác nhau của nó, bạn có thể đăng ký tại đây để được đào tạo trực tuyến trực tiếp với sự hỗ trợ 24/7 và quyền truy cập trọn đời

Có một câu hỏi cho chúng tôi?

Mục đích của việc xử lý tệp trong Python là gì?

Xử lý tệp là một phần không thể thiếu trong lập trình. Việc xử lý tệp trong Python được đơn giản hóa bằng các phương thức tích hợp sẵn, bao gồm tạo, mở và đóng tệp . Trong khi các tệp đang mở, Python cũng cho phép thực hiện các thao tác tệp khác nhau, chẳng hạn như đọc, ghi và nối thêm thông tin.

Tầm quan trọng của các tệp trong Python là gì?

Tầm quan trọng của tệp trong Python . Đầu ra của chương trình phải tồn tại ngay cả sau khi chương trình kết thúc. Các tệp được sử dụng để lưu kết quả đầu ra của chương trình. provide a means for storage and serve as a storage unit in a computer system. The output of the program must persist even after the program ends. Files are used to save the output of the program.

Các bước xử lý tệp trong Python là gì?

Xử lý tệp bằng Python .
Chỉ đọc ['r']. Chế độ này mở các tệp văn bản chỉ để đọc. .
Đọc và Viết ['r+']. Phương pháp này mở tệp cho cả đọc và ghi. .
Chỉ viết ['w']. Chế độ này chỉ mở tệp để ghi. .
Viết và Đọc ['w+']. Chế độ này mở tệp cho cả đọc và ghi

Các loại xử lý tệp khác nhau trong Python là gì?

Có hai loại tệp có thể được xử lý trong python, tệp văn bản thông thường và tệp nhị phân [được viết bằng ngôn ngữ nhị phân, 0s, . tệp văn bản. Trong loại tệp này, mỗi dòng văn bản được kết thúc bằng một ký tự đặc biệt gọi là EOL [End of Line], theo mặc định là ký tự dòng mới ['\n'] trong python.

Chủ Đề