Deepanshu thành lập ListenData với một mục tiêu đơn giản - Làm cho các phân tích trở nên dễ hiểu và dễ theo dõi. Ông có hơn 10 năm kinh nghiệm trong lĩnh vực khoa học dữ liệu. Trong nhiệm kỳ của mình, ông đã làm việc với các khách hàng toàn cầu trong nhiều lĩnh vực khác nhau như Ngân hàng, Bảo hiểm, Cổ phần tư nhân, Viễn thông và Nhân sự
Vì vậy, hãy bắt đầu với một ví dụ đơn giản, trong đó bạn có dữ liệu sau được lưu trữ trong tệp CSV [trong đó tên tệp là 'products_sold']
sản phẩmnhãn hiệugiá bánMáy tính A1200Máy tính bảngB350Máy inC120Màn hìnhD400Bàn phímE80Các bước để nhập tệp CSV vào Python bằng Pandas
Bước 1. Nắm bắt đường dẫn tệp
Đầu tiên, nắm bắt đường dẫn đầy đủ nơi tệp CSV của bạn được lưu trữ
Ví dụ: giả sử tệp CSV được lưu trữ theo đường dẫn sau
C. \Users\Ron\Desktop\ products_sold. csv
Bạn sẽ cần sửa đổi mã Python bên dưới để phản ánh đường dẫn lưu trữ tệp CSV trên máy tính của bạn. Đừng quên bao gồm
- Tên tệp [như được đánh dấu màu xanh lá cây]. Bạn có thể chọn một tên tệp khác, nhưng đảm bảo rằng tên tệp được chỉ định trong mã khớp với tên tệp thực
- Phần mở rộng tệp [như được đánh dấu màu xanh lam]. Phần mở rộng tệp phải là '. csv’ khi nhập tệp CSV
Bước 2. Áp dụng mã Python
Nhập/sao chép mã sau vào Python, đồng thời thực hiện các thay đổi cần thiết cho đường dẫn của bạn
Đây là mã cho ví dụ của chúng tôi
import pandas as pd df = pd.read_csv[r'C:\Users\Ron\Desktop\products_sold.csv'] print[df]
Lưu ý rằng bạn nên đặt 'r' trước chuỗi đường dẫn để xử lý bất kỳ ký tự đặc biệt nào trong đường dẫn, chẳng hạn như '\'. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + “. csv”
Bước 3. Chạy mã
Cuối cùng, hãy chạy mã Python và bạn sẽ nhận được
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
Bước tùy chọn. Chọn tập hợp con của các cột
Bây giờ nếu bạn muốn chọn một tập hợp con các cột từ tệp CSV thì sao?
Ví dụ: nếu bạn chỉ muốn chọn sản phẩm và cột giá thì sao?. Nếu đúng như vậy, bạn có thể chỉ định các tên cột đó như được chụp bên dưới
import pandas as pd data = pd.read_csv[r'C:\Users\Ron\Desktop\products_sold.csv'] df = pd.DataFrame[data, columns=['product', 'price']] print[df]
Bạn cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp CSV. Nếu không, bạn sẽ nhận được các giá trị NaN
Khi bạn đã sẵn sàng, hãy chạy mã [sau khi điều chỉnh đường dẫn tệp] và bạn sẽ chỉ nhận được các cột sản phẩm và giá
product price
0 Computer 1200
1 Tablet 350
2 Printer 120
3 Monitor 400
4 Keyboard 80
Tài nguyên bổ sung
Bạn vừa xem cách nhập tệp CSV vào Python bằng Pandas. Đôi khi, bạn có thể cần nhập tệp Excel vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp Excel vào Python
Khi bạn đã nhập tệp của mình vào Python, bạn có thể bắt đầu tính toán một số thống kê bằng Pandas. Ngoài ra, bạn có thể dễ dàng xuất Khung dữ liệu Pandas thành CSV
Để tìm hiểu thêm về cách sử dụng Pandas để nhập tệp CSV, vui lòng truy cập Tài liệu Pandas
Mô-đun python là một tệp bao gồm mã Python với một tập hợp các định nghĩa hàm, lớp và biến. Mô-đun làm cho mã có thể tái sử dụng và dễ hiểu. Chương trình cần sử dụng mô-đun nên nhập mô-đun cụ thể đó. Trong bài viết này, chúng ta sẽ thảo luận về cách nhập mô-đun Python với đường dẫn đầy đủ của nó
Có nhiều phương pháp khác nhau có thể được sử dụng để nhập mô-đun bằng cách sử dụng đường dẫn đầy đủ của mô-đun
- sử dụng sys. con đường. chức năng nối thêm []
- Sử dụng gói importlib
- Sử dụng lớp SourceFileLoader
Xem xét cách sắp xếp tệp sau đây và hãy xem cách sử dụng các phương pháp được liệt kê ở trên để nhập gfg. mô-đun py trong chính. py
python |--main.py |articles |--gfg.py
Dưới đây là mã cho gfg. py
Python3
sys.path.append["module_path"]6
sys.path.append["module_path"]7
sys.path.append["module_path"]8
sys.path.append["module_path"]9
sys.path.append["module_path"]9
sys.path.append["module_path"]1
sys.path.append["module_path"]9
sys.path.append["module_path"]3
sys.path.append["module_path"]4
sys.path.append["module_path"]5
sys.path.append["module_path"]6
sys.path.append["module_path"]7
sys.path.append["module_path"]8
sys.path.append["module_path"]9
sys.path.append["module_path"]5
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
41sys.path.append["module_path"]3
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
43sys.path.append["module_path"]9
sys.path.append["module_path"]6____57
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
47sys.path.append["module_path"]9
sử dụng sys. con đường. chức năng nối thêm []
Đây là cách dễ nhất để nhập mô-đun Python bằng cách thêm đường dẫn mô-đun vào biến đường dẫn. Biến đường dẫn chứa các thư mục Trình thông dịch Python tìm kiếm các mô-đun đã được nhập trong tệp nguồn
cú pháp
sys.path.append["module_path"]
Ví dụ
Python3
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
49 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
40 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
41
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
42 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
43 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
44sys.path.append["module_path"]9
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
46 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
40 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
48 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
49 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
48 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
40 product price
0 Computer 1200
1 Tablet 350
2 Printer 120
3 Monitor 400
4 Keyboard 80
52
product price
0 Computer 1200
1 Tablet 350
2 Printer 120
3 Monitor 400
4 Keyboard 80
53 product price
0 Computer 1200
1 Tablet 350
2 Printer 120
3 Monitor 400
4 Keyboard 80
54 product price
0 Computer 1200
1 Tablet 350
2 Printer 120
3 Monitor 400
4 Keyboard 80
55đầu ra
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
4Sử dụng gói importlib
Gói importlib cung cấp việc triển khai câu lệnh nhập trong mã nguồn Python có thể di chuyển tới bất kỳ trình thông dịch Python nào. Điều này cho phép người dùng tạo các đối tượng tùy chỉnh giúp họ sử dụng quy trình nhập theo nhu cầu của họ. nhập khẩu. util là một trong những mô-đun có trong gói này có thể được sử dụng để nhập mô-đun từ đường dẫn đã cho
cú pháp
mô-đun = nhập khẩu. sử dụng. spec_from_file_location[“module_name”, “module_path”]
Ví dụ
Python3
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
40 product price
0 Computer 1200
1 Tablet 350
2 Printer 120
3 Monitor 400
4 Keyboard 80
57
product price
0 Computer 1200
1 Tablet 350
2 Printer 120
3 Monitor 400
4 Keyboard 80
58 product price
0 Computer 1200
1 Tablet 350
2 Printer 120
3 Monitor 400
4 Keyboard 80
59 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
40 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
41 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
42 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
43 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
44 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
45 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
46sys.path.append["module_path"]9
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
48 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
49 product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
42 sys.path.append["module_path"]61
sys.path.append["module_path"]62
sys.path.append["module_path"]63
sys.path.append["module_path"]64
sys.path.append["module_path"]65
sys.path.append["module_path"]66
đầu ra
product brand price
0 Computer A 1200
1 Tablet B 350
2 Printer C 120
3 Monitor D 400
4 Keyboard E 80
4Sử dụng lớp SourceFileLoader
Lớp SourceFileLoader là một lớp cơ sở trừu tượng được sử dụng để triển khai tải tệp nguồn với sự trợ giúp của hàm load_module[] thực sự nhập mô-đun