Cách dễ nhất để cài đặt pandas là cài đặt nó như một phần của bản phân phối Anaconda, một bản phân phối đa nền tảng để phân tích dữ liệu và tính toán khoa học. Đây là phương pháp cài đặt được đề xuất cho hầu hết người dùng
Hướng dẫn cài đặt từ nguồn, PyPI, ActivePython, các bản phân phối Linux khác nhau hoặc phiên bản phát triển cũng được cung cấp
Kế hoạch bỏ Python 2. 7
Nhóm lõi Python có kế hoạch ngừng hỗ trợ Python 2. 7 vào ngày 1 tháng 1 năm 2020. Theo đó, tất cả các bản phát hành gấu trúc đến hết ngày 31 tháng 12 năm 2018 sẽ hỗ trợ Python 2
Bản phát hành cuối cùng trước ngày 31 tháng 12 năm 2018 sẽ là bản phát hành cuối cùng hỗ trợ Python 2. Gói đã phát hành sẽ tiếp tục khả dụng trên PyPI và thông qua conda
Bắt đầu từ ngày 1 tháng 1 năm 2019, tất cả các bản phát hành sẽ chỉ là Python 3
Nếu có những người quan tâm đến việc tiếp tục hỗ trợ cho Python 2. 7 ngày 31 tháng 12 năm 2018 vừa qua [có thể là sửa lỗi hoặc cấp vốn], vui lòng liên hệ với những người bảo trì trên trình theo dõi vấn đề
Để biết thêm thông tin, hãy xem câu lệnh Python 3 và hướng dẫn Chuyển sang Python 3
Hỗ trợ phiên bản Python
Chính thức Python 2. 7, 3. 5 và 3. 6
Cài đặt gấu trúc
Cài đặt với Anaconda
Cài đặt gấu trúc và phần còn lại của ngăn xếp NumPy và SciPy có thể hơi khó khăn đối với người dùng thiếu kinh nghiệm
Cách đơn giản nhất để cài đặt không chỉ pandas, mà cả Python và các gói phổ biến nhất tạo nên ngăn xếp SciPy [IPython, NumPy, Matplotlib,…] là với Anaconda, một bản phân phối Python đa nền tảng [Linux, Mac OS X, Windows]
Sau khi chạy trình cài đặt, người dùng sẽ có quyền truy cập vào pandas và phần còn lại của ngăn xếp SciPy mà không cần cài đặt bất kỳ thứ gì khác và không cần đợi bất kỳ phần mềm nào được biên dịch
Hướng dẫn cài đặt cho Anaconda có thể được tìm thấy ở đây
Có thể tìm thấy danh sách đầy đủ các gói có sẵn như một phần của bản phân phối Anaconda tại đây
Một ưu điểm khác khi cài đặt Anaconda là bạn không cần quyền quản trị để cài đặt nó. Anaconda có thể cài đặt trong thư mục chính của người dùng, điều này khiến việc xóa Anaconda trở nên đơn giản nếu bạn quyết định [chỉ cần xóa thư mục đó]
Cài đặt với Miniconda
Phần trước đã phác thảo cách cài đặt gấu trúc như một phần của bản phân phối Anaconda. Tuy nhiên, cách tiếp cận này có nghĩa là bạn sẽ cài đặt hơn một trăm gói và liên quan đến việc tải xuống trình cài đặt có kích thước vài trăm MB
Nếu bạn muốn có nhiều quyền kiểm soát hơn đối với gói nào hoặc có băng thông internet hạn chế, thì cài đặt gấu trúc với Miniconda có thể là một giải pháp tốt hơn
Conda là trình quản lý gói mà bản phân phối Anaconda được xây dựng dựa trên. Nó là một trình quản lý gói đa nền tảng và ngôn ngữ bất khả tri [nó có thể đóng vai trò tương tự như sự kết hợp giữa pip và virtualenv]
Miniconda cho phép bạn tạo một bản cài đặt Python khép kín tối thiểu, sau đó sử dụng lệnh Conda để cài đặt các gói bổ sung
Trước tiên, bạn cần cài đặt Conda, sau đó tải xuống và chạy Miniconda sẽ làm việc này cho bạn. Bộ cài đặt có thể được tìm thấy ở đây
Bước tiếp theo là tạo một môi trường conda mới. Môi trường conda giống như một virtualenv cho phép bạn chỉ định một phiên bản cụ thể của Python và bộ thư viện. Chạy các lệnh sau từ cửa sổ đầu cuối
conda create -n name_of_my_env python
Điều này sẽ tạo ra một môi trường tối thiểu chỉ cài đặt Python trong đó. Để đặt bản thân của bạn vào trong môi trường này, hãy chạy
source activate name_of_my_env
Trên Windows, lệnh là
activate name_of_my_env
Bước cuối cùng cần thiết là cài đặt pandas. Điều này có thể được thực hiện với lệnh sau
conda install pandas
Để cài đặt một phiên bản gấu trúc cụ thể
conda install pandas=0.20.3
Để cài đặt các gói khác, ví dụ IPython
conda install ipython
Để cài đặt bản phân phối Anaconda đầy đủ
conda install anaconda
Nếu bạn cần các gói có sẵn cho pip nhưng không phải conda, thì hãy cài đặt pip, sau đó sử dụng pip để cài đặt các gói đó
conda install pip pip install django
Cài đặt từ PyPI
gấu trúc có thể được cài đặt qua pip từ PyPI
________số 8_______
Cài đặt với ActivePython
Hướng dẫn cài đặt cho ActivePython có thể được tìm thấy ở đây. Phiên bản 2. 7 và 3. 5 bao gồm gấu trúc
Cài đặt bằng trình quản lý gói của bản phân phối Linux của bạn
Các lệnh trong bảng này sẽ cài đặt pandas cho Python 3 từ bản phân phối của bạn. Để cài đặt pandas cho Python 2, bạn có thể cần sử dụng gói
source activate name_of_my_env1Trạng thái phân phối Tải xuống / Liên kết kho lưu trữ Phương pháp cài đặt Debianstablekho lưu trữ Debian chính thức
source activate name_of_my_env2Debian & Ubuntuunstable [các gói mới nhất]
source activate name_of_my_env2Kho lưu trữ chính thức Ubuntutable của Ubuntu
source activate name_of_my_env2Kho lưu trữ OpenSusestableOpenSuse
source activate name_of_my_env5Kho lưu trữ Fedora chính thức của Fedorastable
source activate name_of_my_env6Centos/RHELstableEPEL kho lưu trữ_______1_______7
Tuy nhiên, các gói trong trình quản lý gói linux thường chậm hơn một vài phiên bản, vì vậy, để có được phiên bản pandas mới nhất, bạn nên cài đặt bằng phương pháp
source activate name_of_my_env8 hoặc
source activate name_of_my_env9 được mô tả ở trên
Cài đặt từ nguồn
Xem hướng dẫn đầy đủ về cách xây dựng từ cây nguồn git. Hơn nữa, hãy xem bạn có muốn tạo môi trường phát triển gấu trúc không
Chạy bộ thử nghiệm
pandas được trang bị một bộ đầy đủ các bài kiểm tra đơn vị, chiếm khoảng 97% cơ sở mã tại thời điểm viết bài này. Để chạy nó trên máy của bạn nhằm xác minh rằng mọi thứ đang hoạt động [và bạn đã cài đặt tất cả các phụ thuộc, mềm và cứng], hãy đảm bảo rằng bạn đã cài đặt pytest và chạy
>>> import pandas as pd >>> pd.test[] running: pytest --skip-slow --skip-network C:\Users\TP\Anaconda3\envs\py36\lib\site-packages\pandas ============================= test session starts ============================= platform win32 -- Python 3.6.2, pytest-3.2.1, py-1.4.34, pluggy-0.4.0 rootdir: C:\Users\TP\Documents\Python\pandasdev\pandas, inifile: setup.cfg collected 12145 items / 3 skipped ..................................................................S...... ........S................................................................ ......................................................................... ==================== 12130 passed, 12 skipped in 368.339 seconds =====================
phụ thuộc
- công cụ thiết lập. 24. 2. 0 hoặc cao hơn
- NumPy. 1. 9. 0 hoặc cao hơn
- python-dateutil. 2. 5. 0 hoặc cao hơn
- pytz
Phụ thuộc được đề xuất
- numexpr. để tăng tốc các hoạt động số nhất định.
activate name_of_my_env
0 sử dụng nhiều lõi cũng như phân đoạn và bộ nhớ đệm thông minh để đạt được tốc độ lớn. Nếu đã cài đặt, phải là Phiên bản 2. 4. 6 hoặc cao hơn - thắt cổ chai. để tăng tốc một số loại đánh giá
activate name_of_my_env
1.activate name_of_my_env
2 sử dụng các thói quen cython chuyên dụng để đạt được tốc độ lớn. Nếu được cài đặt, phải là Phiên bản 1. 0. 0 hoặc cao hơn
Ghi chú
Bạn được khuyến khích cài đặt các thư viện này vì chúng giúp cải thiện tốc độ, đặc biệt là khi làm việc với các tập dữ liệu lớn
Phụ thuộc tùy chọn
Cython. Chỉ cần thiết để xây dựng phiên bản phát triển. Phiên bản 0. 24 hoặc cao hơn
khoa học viễn tưởng. chức năng thống kê linh tinh, Phiên bản 0. 14. 0 hoặc cao hơn
dàn âm thanh. gấu trúc thích xử lý cho> 2 độ mờ, cần thiết để chuyển đổi Bảng điều khiển thành đối tượng xarray. Phiên bản 0. 7. 0 hoặc cao hơn được khuyến nghị
PyTables. cần thiết cho lưu trữ dựa trên HDF5. Phiên bản 3. 0. 0 hoặc cao hơn yêu cầu, Phiên bản 3. 2. 1 hoặc cao hơn rất khuyến khích
định dạng lông vũ. cần thiết để lưu trữ dựa trên lông vũ, phiên bản 0. 3. 1 hoặc cao hơn
Sàn gỗ Apache, hoặc pyarrow [>= 0. 4. 1] hoặc fastparquet [>= 0. 0. 6] để lưu trữ trên sàn gỗ. Snappy và brotli có sẵn để hỗ trợ nén
Thuật giả kim SQL. để được hỗ trợ cơ sở dữ liệu SQL. Phiên bản 0. 8. 1 hoặc cao hơn đề nghị. Bên cạnh SQLAlchemy, bạn cũng cần một trình điều khiển dành riêng cho cơ sở dữ liệu. Bạn có thể tìm thấy tổng quan về các trình điều khiển được hỗ trợ cho từng phương ngữ SQL trong tài liệu SQLAlchemy. Một số trình điều khiển phổ biến là
- psycopg2. cho PostgreSQL
- pymysql. cho MySQL
- SQLite. đối với SQLite, theo mặc định, điều này được bao gồm trong thư viện chuẩn của Python
matplotlib. để vẽ đồ thị, Phiên bản 1. 4. 3 hoặc cao hơn
Đối với Excel I/O
- xlrd/xlwt. Đọc Excel [xlrd] và viết [xlwt]
- openpyxl. openpyxl phiên bản 2. 4. 0 để viết. tệp xlsx [xlrd >= 0. 9. 0]
- XlsxWriter. Trình soạn thảo Excel thay thế
Jinja2. Công cụ mẫu để định dạng HTML có điều kiện
s3fs. cần thiết để truy cập Amazon S3 [s3fs >= 0. 0. 7]
khối. để nén msgpack bằng cách sử dụng
activate name_of_my_env
3Một trong số qtpy [yêu cầu PyQt hoặc PySide], PyQt5, PyQt4, pygtk, xsel hoặc xclip. cần thiết để sử dụng. Hầu hết các trình quản lý gói trên các bản phân phối Linux sẽ có ngay
activate name_of_my_env
5 và/hoặcactivate name_of_my_env
6 để cài đặtcho Google BigQuery I/O
Backport. lzma. Chỉ dành cho Python 2, để ghi và/hoặc đọc từ Khung dữ liệu được nén xz trong CSV;
Cần có một trong các tổ hợp thư viện sau đây để sử dụng chức năng cấp cao nhất
Đã thay đổi trong phiên bản 0. 23. 0
Ghi chú
Nếu sử dụng BeautifulSoup4, phiên bản tối thiểu là 4. 2. 1 là bắt buộc
- BeautifulSoup4 và html5lib [Mọi phiên bản gần đây của html5lib đều được. ]
- BeautifulSoup4 và lxml
- BeautifulSoup4 và html5lib và lxml
- Chỉ lxml, mặc dù hãy xem lý do tại sao bạn có thể không nên thực hiện phương pháp này
Cảnh báo
- nếu bạn cài đặt BeautifulSoup4, bạn phải cài đặt lxml hoặc html5lib hoặc cả hai. sẽ không hoạt động khi chỉ cài đặt BeautifulSoup4
- Bạn rất được khuyến khích đọc. Nó giải thích các vấn đề xung quanh việc cài đặt và sử dụng ba thư viện trên
Ghi chú
nếu bạn đang sử dụng hệ thống có
activate name_of_my_env
9 thì bạn có thể làmsource activate name_of_my_env
0để có được các phụ thuộc cần thiết để cài đặt lxml. Điều này sẽ ngăn chặn những cơn đau đầu tiếp theo
Ghi chú
Không có các phụ thuộc tùy chọn, nhiều tính năng hữu ích sẽ không hoạt động. Do đó, chúng tôi khuyên bạn nên cài đặt những. Một bản phân phối đóng gói như Anaconda, ActivePython [phiên bản 2. 7 hoặc 3. 5], hoặc Enthought Canopy có thể đáng xem xét