Rất nhiều biểu thức và câu lệnh Python tạo thành một hàm. Một mô-đun được tạo bằng cách thêm nhiều chức năng và cuối cùng, nhiều mô-đun sẽ tạo thành một thư viện
- NumPy
Đây là thư viện Python quan trọng nhất để thực hiện các phép toán. Nó giúp thực hiện các phép tính đại số, giải các bài toán thống kê và tạo mảng nhiều chiều
Một số hàm NumPy quan trọng
NumPy. thêm [], NumPy. phép trừ [], NumPy. nhân [], NumPy. chia[] và NumPy. mod[]
Một số hàm NumPy hữu ích
NumPy. nan[], NumPy. argmax[], NumPy. polyfit[], NumPy. ngẫu nhiên. lựa chọn[], NumPy. không gian trống []
- gấu trúc
Đây là thư viện phổ biến nhất được sử dụng để thao tác dữ liệu trong python. Điều này được xây dựng trên NumPy. Nó được sử dụng để xử lý dữ liệu bị thiếu, hợp nhất các bộ dữ liệu, định hình lại bộ dữ liệu và thực hiện thêm các cột trong khung dữ liệu. Điều này cũng có chức năng chuỗi thời gian được sử dụng để dự báo
Một số chức năng quan trọng là
pivot[], merge[], crosstab[], factorize[], isna[], andto_numeric[], v.v.
- học scikit
Đây là thư viện quan trọng nhất dùng cho Machine Learning. Điều này được xây dựng trên NumPy, SciPy và Matplotlib. Tất cả các thuật toán học máy là một phần của gói này
Một số mô-đun nó có là
- một cụm chứa các thuật toán phân cụm. Một số chức năng là Cụm. Kmeans[], Cụm. Tuyên truyền ái lực[]
- hiệp phương sai được sử dụng để ước tính hiệp phương sai
- phân tách được sử dụng để phân hủy ma trận và chứa các thuật toán như Phân tích thành phần chính [PCA]
- ensemble chứa các phương thức ensemble
- linear_model được sử dụng cho hồi quy tuyến tính và logistic chứa các hàm như sklearn. linear_model. LinearRegression[], sklearn. linear_model. Bộ phân loại SGD[]
- Matplotlib
Đây là trực quan hóa và phân tích dữ liệu. Được sử dụng để thiết kế biểu đồ thanh, biểu đồ hình tròn, biểu đồ phân tán, biểu đồ, v.v.
Một số chức năng là
pyplot[], image[], contour[], axis[], colors[], lines[], và markers[], v.v.
Seaborn, có các chức năng nâng cao dựa trên Matplotlib, NumPy, Pandas được các nhà khoa học dữ liệu sử dụng để hiểu phân phối dữ liệu và các mối quan hệ trong khi xây dựng các giải pháp máy học
- ĐẹpSúp
Điều này được sử dụng phổ biến nhất để quét web để lấy dữ liệu từ các trang web HTML
Một số chức năng là
get[], find[], get_text[], strip[], và split[], v.v.
- máy ảnh
Điều này được xây dựng dựa trên tenorflow và được sử dụng cho Deep learning sử dụng mạng thần kinh. Nó được sử dụng để đào tạo các mô hình và mô hình thử nghiệm trên các bộ dữ liệu lớn. Nó cũng cung cấp các bộ dữ liệu được đào tạo trước như MNIST, ResNet, v.v.
Một số chức năng quan trọng
Relu[], sigmoid[], softmax[], softplus[], và tanh[], v.v.
- Pytorch
Nó cũng là một thư viện máy học được xây dựng trên Torch và cạnh tranh với TensorFlow. Nó được giới thiệu vào năm 2017 và trở nên phổ biến. Nó chứa các hàm tích chập cho các mạng thần kinh như Conv1d[], conv3d[], các hàm tổng hợp như avg_pool1d[], max_pool2d[], các hàm kích hoạt như relu_[], sigmoid[], softplus[] và tanh[], v.v.
- NLTK [Bộ công cụ ngôn ngữ tự nhiên]
Đây là thư viện được sử dụng để xử lý ngôn ngữ tự nhiên. Nó được sử dụng để mã thông báo, Xuất phát, Bổ đề, Mô hình hóa chủ đề, Phân tích tình cảm. Các phần của Gắn thẻ bài phát biểu, Phân loại văn bản, v.v.
Nó có nhiều gói phụ và mô-đun phụ
gói con
nltk. trò chuyện, nltk. phân loại, nltk. cụm, nltk. văn bản, nltk. tình cảm, nltk. mã hóa, nltk. dịch và nltk. twitter vv
nltk. ngữ pháp, nltk. xác suất, nltk. tgrep và nltk. dụng cụ
Danh sách Thư viện trên không đầy đủ và cũng có nhiều thư viện khác được sử dụng. Tuy nhiên, những cái được đề cập ở trên được sử dụng rộng rãi nhất trong ngành để mã hóa bằng Python
Ngoài các Thư viện được đề cập ở trên, có một số chức năng Python quan trọng mà bạn nên biết về
- Lambda. Đây là một chức năng ẩn danh mà người dùng có thể tự xác định và có thể được sử dụng trong một chương trình. Nó khá mạnh và có thể được định nghĩa trong một chức năng khác
- Giảm. Chức năng này được sử dụng để kết hợp các yếu tố dựa trên một chức năng khác
- Lọc. Hàm này được sử dụng để lọc tập hợp các phần tử dựa trên một hàm hoặc biểu thức khác
~ Kapil Mahajan, Trưởng nhóm Khoa học Dữ liệu
Python liên tục được xếp hạng là ngôn ngữ lập trình số 1 trên thế giới. Là một trong những ngôn ngữ linh hoạt nhất, các nền tảng phổ biến như YouTube, Google và Facebook được xây dựng bằng Python. Nếu bạn muốn bước vào thế giới của ngôn ngữ này, hãy xem các khóa học về khoa học dữ liệu của chúng tôi có các mô-đun dạy Python