Hướng dẫn python simple payroll calculation - python tính toán bảng lương đơn giản

Nội phân chính

  • Mã hóa một dòng phù hợp nhất
  • Hồi quy tuyến tính đơn giản là gì?
  • Hồi quy tuyến tính đơn giản sử dụng python
  • Tính toán đường hồi quy
  • Tính toán mức độ hồi quy phù hợp như thế nào
  • Vẽ đường hồi quy
  • Làm thế nào để bạn vẽ một hồi quy tuyến tính trong Python?
  • Cốt truyện hồi quy trong Python là gì?
  • Làm thế nào để bạn đại diện cho một hồi quy tuyến tính đơn giản?

Mã hóa một dòng phù hợp nhất

Hồi quy tuyến tính đơn giản là gì?y = mx + b, then you have already learned about simple linear regression!

Hồi quy tuyến tính đơn giản là gì?

Hồi quy tuyến tính đơn giản sử dụng pythony and x.The independent variable, or the variable used to predict the dependent variable is denoted as x. The dependent variable, or the outcome/output, is denoted as y.

Tính toán đường hồi quyline of best fit, or the regression line. You may have heard about drawing the line of best fit through a scatter plot of data. For example, let's say we have a scatter plot showing how years of experience affect salaries. Imagine drawing a line to predict the trend.

Tính toán mức độ hồi quy phù hợp như thế nào𝜷0), or where the regression line will start on the y-axis. The beta coefficient (𝜷1) is the slope and describes the relationship between the independent variable and the dependent variable. The coefficient can be positive or negative and is the degree of change in the dependent variable for every 1-unit of change in the independent variable.

Vẽ đường hồi quyy = 2 + 0.5x. For every 1-unit increase in the independent variable (x), there will be a 0.50 increase in the dependent variable (y).

Hồi quy tuyến tính đơn giản sử dụng python

Tính toán đường hồi quy

Tính toán mức độ hồi quy phù hợp như thế nào

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

Vẽ đường hồi quyy) and the independent variable will be the years of experience (x).

data = pd.read_csv('Salary_Data.csv')
x = data['YearsExperience']
y = data['Salary']

Làm thế nào để bạn vẽ một hồi quy tuyến tính trong Python?

print(data.head())

YearsExperience Salary
0 1.1 39343.0
1 1.3 46205.0
2 1.5 37731.0
3 2.0 43525.0
4 2.2 39891.0

Cốt truyện hồi quy trong Python là gì?

Tính toán đường hồi quy

Tính toán mức độ hồi quy phù hợp như thế nào

Vẽ đường hồi quy𝜷1 of the data we will use the following formula:

Làm thế nào để bạn vẽ một hồi quy tuyến tính trong Python?𝜷0, we can use the following formula:

Cốt truyện hồi quy trong Python là gì?

def linear_regression(x, y):     
N = len(x)
x_mean = x.mean()
y_mean = y.mean()

B1_num = ((x - x_mean) * (y - y_mean)).sum()
B1_den = ((x - x_mean)**2).sum()
B1 = B1_num / B1_den

B0 = y_mean - (B1*x_mean)

reg_line = 'y = {} + {}β'.format(B0, round(B1, 3))

return (B0, B1, reg_line)

Làm thế nào để bạn đại diện cho một hồi quy tuyến tính đơn giản?N variable. We can then calculate the mean for both X and Y by simply using the

data = pd.read_csv('Salary_Data.csv')
x = data['YearsExperience']
y = data['Salary']
3 function.

N = len(x)
x_mean = x.mean()
y_mean = y.mean()

Hồi quy tuyến tính đơn giản là một khái niệm mà bạn có thể quen thuộc với trường trung học cơ sở hoặc trung học. Nếu bạn đã từng nghe nói về một độ dốc và chặn, hoặc y = mx + b, thì bạn đã tìm hiểu về hồi quy tuyến tính đơn giản!𝜷1. To shorten the length of these lines of code, we can calculate the numerator and denominator of the slope formula first then divide the numerator by the denominator and assign it to a variable named 𝜷1. We can just follow the slope formula given above.

B1_num = ((x - x_mean) * (y - y_mean)).sum()
B1_den = ((x - x_mean)**2).sum()
B1 = B1_num / B1_den

Hồi quy tuyến tính đơn giản là một phương pháp thống kê mà chúng ta có thể sử dụng để tìm mối quan hệ giữa hai biến và đưa ra dự đoán. Hai biến được sử dụng thường được ký hiệu là y và x. Biến độc lập hoặc biến được sử dụng để dự đoán biến phụ thuộc được ký hiệu là x. Biến phụ thuộc, hoặc kết quả/đầu ra, được ký hiệu là y.𝜷1, we can use the formula for the intercept 𝜷0.

B0 = y_mean - (B1 * x_mean)

Một mô hình hồi quy tuyến tính đơn giản sẽ tạo ra một dòng phù hợp nhất hoặc dòng hồi quy. Bạn có thể đã nghe nói về việc vẽ dòng phù hợp nhất thông qua một biểu đồ phân tán dữ liệu. Ví dụ, giả sử chúng ta có một âm mưu phân tán cho thấy nhiều năm kinh nghiệm ảnh hưởng đến mức lương như thế nào. Hãy tưởng tượng vẽ một dòng để dự đoán xu hướng.

Tính toán mức độ hồi quy phù hợp như thế nào

Vẽ đường hồi quyR,and the coefficient of determination, otherwise known as (R squared).

Hệ số xác định (R²) - Tỷ lệ phần trăm phương sai được giải thích bởi biến độc lập (x) với các giá trị từ 0 đến 1. Nó không thể âm vì nó là giá trị vuông. Ví dụ: nếu R² = 0,81, thì điều này cho bạn biết rằng X giải thích 81% phương sai trong y. Hay còn gọi là lòng tốt của người Viking.— The percentage of variance explained by the independent variable (x) with values between 0 and 1. It cannot be negative because it is a square value. For example, if = 0.81, then this tells you that x explains 81% of the variance in y. Otherwise known as the “goodness of fit”.

Hệ số tương quan (R) - Mức độ mối quan hệ hoặc mối tương quan giữa hai biến (x và y trong trường hợp này). R có thể nằm trong khoảng từ -1 đến 1 với các giá trị bằng 1 nghĩa là một mối tương quan và giá trị tích cực hoàn hảo bằng -1 có nghĩa là một mối tương quan âm hoàn hảo. — The degree of relationship or correlation between two variables (x and y in this case). R can range from -1 to 1 with values equal to 1 meaning a perfect positive correlation and values equal to -1 meaning a perfect negative correlation.

Dưới đây là công thức cho hệ số tương quan Pearson,:

Hệ số tương quan Pearson (R)

Chúng tôi sẽ phải chuyển đổi công thức này thành mã Python. Khi chúng tôi tính toán hệ số tương quan Pearson, chúng tôi chỉ có thể vuông nó để có được hệ số xác định.

Chúng ta sẽ cần lưu trữ số lượng quan sát (hàng trong dữ liệu) trong biến N một lần nữa. Tiếp theo, chúng tôi sẽ chia công thức thành hai phần: tử số và mẫu số. Sau đó chúng ta có thể trả về hệ số tương quan.N again. Next, we will split the formula into two parts: the numerator and the denominator. We can then return the correlation coefficient.

def corr_coef(x, y):
N = len(x)

num = (N * (x*y).sum()) - (x.sum() * y.sum())
den = np.sqrt((N * (x**2).sum() - x.sum()**2) * (N * (y**2).sum() - y.sum()**2))
R = num / den
return R

Áp dụng các chức năng này vào dữ liệu của chúng tôi, chúng tôi có thể in kết quả:

B0, B1, reg_line = linear_regression(x, y)
print('Regression Line: ', reg_line)
R = corr_coef(x, y)
print('Correlation Coef.: ', R)
print('"Goodness of Fit": ', R**2)
Output:Regression Line: y = 25792.20019866869 + 9449.962β
Correlation Coef.: 0.97824161848876
"Goodness of Fit": 0.9569566641435087

Vẽ đường hồi quy

Phần này là hoàn toàn tùy chọn và chỉ là để giải trí.

Sử dụng matplotlib, giờ đây chúng tôi có thể vẽ đường hồi quy kết quả của mình với dữ liệu của chúng tôi.

plt.figure(figsize=(12,5))
plt.scatter(x, y, s=300, linewidths=1, edgecolor='black')
text = '''X Mean: {} Years
Y Mean: ${}
R: {}
R^2: {}
y = {} + {}X'''.format(round(x.mean(), 2),
round(y.mean(), 2),
round(R, 4),
round(R**2, 4),
round(B0, 3),
round(B1, 3))
plt.text(x=1, y=100000, s=text, fontsize=12, bbox={'facecolor': 'grey', 'alpha': 0.2, 'pad': 10})
plt.title('How Experience Affects Salary')
plt.xlabel('Years of Experience', fontsize=15)
plt.ylabel('Salary', fontsize=15)
plt.plot(x, B0 + B1*x, c = 'r', linewidth=5, alpha=.5, solid_capstyle='round')
plt.scatter(x=x.mean(), y=y.mean(), marker='*', s=10**2.5, c='r') # average point

Bây giờ chúng ta có thể sử dụng các tính toán của chúng ta về dòng hồi quy để đưa ra dự đoán với dữ liệu mới mà chúng ta bắt gặp. Để tạo chức năng

data = pd.read_csv('Salary_Data.csv')
x = data['YearsExperience']
y = data['Salary']
5, chúng tôi chỉ theo công thức cho đường hồi quy tuyến tính đơn giản và cắm các giá trị mà chúng tôi đã tính toán cũng như giá trị X mới. Hàm này sẽ trả về dự đoán y.X value. This function will return the prediction y.

data = pd.read_csv('Salary_Data.csv')
x = data['YearsExperience']
y = data['Salary']
0

Tôi hy vọng điều này đã giúp bạn tìm hiểu hoặc xem xét quá trình hồi quy tuyến tính đơn giản. Hồi quy tuyến tính nhiều và hồi quy đa thức sẽ là chủ đề tôi sẽ tiếp xúc trong các bài viết sau.

Làm thế nào để bạn vẽ một hồi quy tuyến tính trong Python?

Làm thế nào để vẽ một đường hồi quy tuyến tính trên một âm mưu phân tán trong Python..

x = np. Mảng ([1, 3, 5, 7]) tạo dữ liệu. y = np. Mảng ([6, 3, 9, 5]).

plt. Lô đất (x, y, 'o') Tạo cốt truyện phân tán ..

m, b = np. polyfit (x, y, 1) m = độ dốc, b = đánh chặn ..

plt. Biểu đồ (x, m*x + b) Thêm dòng phù hợp nhất ..

Cốt truyện hồi quy trong Python là gì?

Các sơ đồ hồi quy trong Thư viện Python của Seaborn chủ yếu nhằm thêm một hướng dẫn trực quan giúp nhấn mạnh các mẫu trong bộ dữ liệu trong quá trình phân tích dữ liệu khám phá. Như tên cho thấy các sơ đồ hồi quy, tạo ra một dòng hồi quy giữa 2 tham số và giúp hình dung các mối quan hệ tuyến tính của chúng.creates a regression line between 2 parameters and helps to visualize their linear relationships.

Làm thế nào để bạn đại diện cho một hồi quy tuyến tính đơn giản?

Công thức cho hồi quy tuyến tính đơn giản là:..

y là giá trị dự đoán của biến phụ thuộc (y) cho bất kỳ giá trị nhất định nào của biến độc lập (x) ..

B0 là chặn, giá trị dự đoán của y khi x là 0 ..

B1 là hệ số hồi quy - chúng tôi mong đợi bạn sẽ thay đổi bao nhiêu khi x tăng ..