Hướng dẫn eda python cheat sheet
IntroductionThe secret behind creating powerful predictive models is to understand the data really well. Thereby, it is suggested to maneuver the essential steps of data exploration to build a healthy model. Show
Here is a cheat sheet to help you with various codes and steps while performing exploratory data analysis in Python. We have also released a pdf version of the sheet this time so that you can easily copy / paste these codes. You can easily copy / paste these code and keep them handy by downloading the PDF version of this infographic here: Data Exploration in Python.pdf If you like what you just read & want to continue your analytics learning, subscribe to our emails, follow us on twitter or like our facebook page.Python Cheat Sheet là gì ?Python Cheat Sheet là một bản tổng hợp đầy đủ những kiến thức nền tảng và quan trọng nhất khi tự học Python cho người mới bắt đầu. Được biên soạn bởi Arianne Colton và Sean Chen, bản Cheat sheet này sẽ hướng dẫn bạn đi qua toàn bộ những khái niệm cơ bản của ngôn ngữ lập trình Python, giúp tiết kiệm thời gian và công sức. Tài liệu tự học Python cho người mới bắt đầuDownload Cheat sheet bản PDF Tại đây. (Tham khảo cách bắt đầu học Python như thế nào để ứng dụng trong phân tích dữ liệu Tại đây) (Tham khảo bài viết 8 kỹ năng cần có để trở thành Data Analyst) (Tham khảo bài viết về Tư duy phân tích & ứng dụng dữ liệu để trả lời câu hỏi) Đọc thêm các bài viết chia sẻ kiến thức về phân tích dữ liệu: https://datapot.vn/blog/Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos Update tài nguyên từ Microsoft, DA-100 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/
4.800.000 ₫ – 5.200.000 ₫
Pandas is a python library used in data manipulation ( create, delete, and update the data). It is one of the most commonly used libraries for data analysis in python. Pandas offer data structures and operations for manipulating numerical and time-series data.
Install and importPandas is an easy package to install. Open up your terminal program (for Mac users) or command line (for PC users) and install it using either of the following commands:
OR
Alternatively, if you’re currently viewing this article in a Jupyter notebook you can run this cell: How to install pandasThe To import pandas we usually import it with a shorter name since it’s used so much: importing pandas into jupyer and ‘pd’ stands alias name for pandas.For this excersis taken dataset of Loan Prediction and can download the dataset from : https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/#ProblemStatement
Viewing your data:a) The first thing to do when opening a new dataset is print out a few rows to keep as a
visual reference. We accomplish this with b) c) But we could also pass a number as well:
But we can also pass a number as well:
Gives the size of the data frame in the format (row, column). Displays shape of Train & Test Dataset
prints the column header and the data type stored in each column. It also gives the number of non-null values and the memory the data takes. Displays data types & missing values of each feature
Pandas
Pandas
Pandas
a) shows all the non-repeating values of a particular column. b) Pandas
To get all the
column headers of a Pandas DataFrame as a list,
Pandas
In Pandas missing data is represented by two value:
In order to check missing values in Pandas DataFrame, we use a function That’s It!Thanks for reading! Found this article useful? Follow me (Anuganti Suresh) on Medium and check out my most popular articles! Please 👏 this article to share it! References:Clap if you liked the article! |