Hướng dẫn r, python sql - r, python sql

Chuyển đến nội dung chính

Trình duyệt này không còn được hỗ trợ nữa.

Hãy nâng cấp lên Microsoft Edge để tận dụng các tính năng mới nhất, bản cập nhật bảo mật và hỗ trợ kỹ thuật.

R Hướng dẫn về học máy SQL

  • Bài viết
  • 18/04/2022
  • 2 Phú

Trong bài viết nào

Áp dụng cho: SQL Server 2016 (13.x) và sau đó là phiên bản Azure SQL được quản lý

Hướng dẫn r, python sql - r, python sql
SQL Server 2016 (13.x) and later Azure SQL Managed Instance

R hướng dẫn

Hướng dẫnSự mô tả
Dự đoán cho thuê trượt tuyết với cây quyết địnhSử dụng R và mô hình cây quyết định để dự đoán số lượng cho thuê trượt tuyết trong tương lai. Sử dụng máy tính xách tay trong Azure Data Studio để chuẩn bị dữ liệu và đào tạo mô hình và T-SQL để triển khai mô hình.
Phân loại khách hàng bằng cách sử dụng phân cụm K-MeansSử dụng R để phát triển và triển khai mô hình phân cụm K-MEAN để phân loại khách hàng. Sử dụng máy tính xách tay trong Azure Data Studio để chuẩn bị dữ liệu và đào tạo mô hình và T-SQL để triển khai mô hình.
Phân tích trong cơ sở dữ liệu R cho các nhà khoa học dữ liệuĐối với các nhà phát triển R mới về học máy SQL, hướng dẫn này giải thích cách thực hiện các nhiệm vụ khoa học dữ liệu phổ biến trong SQL. Tải và trực quan hóa dữ liệu, đào tạo và lưu một mô hình trong cơ sở dữ liệu và sử dụng mô hình để phân tích dự đoán.
Phân tích trong cơ sở dữ liệu R cho các nhà phát triển SQLXây dựng và triển khai một giải pháp R hoàn chỉnh, chỉ sử dụng các công cụ SQL. Tập trung vào việc chuyển một giải pháp vào sản xuất. Bạn sẽ tìm hiểu cách bọc mã R trong quy trình được lưu trữ, lưu mô hình R trong cơ sở dữ liệu và thực hiện các cuộc gọi được tham số hóa cho mô hình R để dự đoán.

Hướng dẫnSự mô tả
Dự đoán cho thuê trượt tuyết với cây quyết địnhSử dụng R và mô hình cây quyết định để dự đoán số lượng cho thuê trượt tuyết trong tương lai. Sử dụng máy tính xách tay trong Azure Data Studio để chuẩn bị dữ liệu và đào tạo mô hình và T-SQL để triển khai mô hình.
Phân loại khách hàng bằng cách sử dụng phân cụm K-MeansSử dụng R để phát triển và triển khai mô hình phân cụm K-MEAN để phân loại khách hàng. Sử dụng máy tính xách tay trong Azure Data Studio để chuẩn bị dữ liệu và đào tạo mô hình và T-SQL để triển khai mô hình.

Phân tích trong cơ sở dữ liệu R cho các nhà khoa học dữ liệu

Đối với các nhà phát triển R mới về học máy SQL, hướng dẫn này giải thích cách thực hiện các nhiệm vụ khoa học dữ liệu phổ biến trong SQL. Tải và trực quan hóa dữ liệu, đào tạo và lưu một mô hình trong cơ sở dữ liệu và sử dụng mô hình để phân tích dự đoán.

Phân tích trong cơ sở dữ liệu R cho các nhà phát triển SQLSự mô tả
Dự đoán cho thuê trượt tuyết với cây quyết địnhSử dụng R và mô hình cây quyết định để dự đoán số lượng cho thuê trượt tuyết trong tương lai. Sử dụng máy tính xách tay trong Azure Data Studio để chuẩn bị dữ liệu và đào tạo mô hình và T-SQL để triển khai mô hình.
Phân loại khách hàng bằng cách sử dụng phân cụm K-MeansSử dụng R để phát triển và triển khai mô hình phân cụm K-MEAN để phân loại khách hàng. Sử dụng máy tính xách tay trong Azure Data Studio để chuẩn bị dữ liệu và đào tạo mô hình và T-SQL để triển khai mô hình.
Phân tích trong cơ sở dữ liệu R cho các nhà khoa học dữ liệuĐối với các nhà phát triển R mới về học máy SQL, hướng dẫn này giải thích cách thực hiện các nhiệm vụ khoa học dữ liệu phổ biến trong SQL. Tải và trực quan hóa dữ liệu, đào tạo và lưu một mô hình trong cơ sở dữ liệu và sử dụng mô hình để phân tích dự đoán.

Bước tiếp theo

  • Phân tích trong cơ sở dữ liệu R cho các nhà phát triển SQL

Phản HồI

Gửi và xem ý kiến ​​ph

Điều kiện tiên quyết

Phần hai của hướng dẫn này giả định rằng bạn đã hoàn thành phần một và các điều kiện tiên quyết của nó.

Khám phá và chuẩn bị dữ liệu

Hướng dẫn Python: Chuẩn bị dữ liệu để đào tạo mô hình hồi quy tuyến tính với học máy SQL

  • Bài viết
  • 15/06/2022
  • 3 Phú

Trong bài viết nào

Áp dụng cho: SQL Server 2017 (14.x) và sau đó là phiên bản Azure SQL được quản lý SQL Server 2017 (14.x) and later Azure SQL Managed Instance

Trong phần hai của loạt hướng dẫn gồm bốn phần này, bạn sẽ chuẩn bị dữ liệu từ cơ sở dữ liệu bằng Python. Sau đó trong loạt bài này, bạn sẽ sử dụng dữ liệu này để đào tạo và triển khai mô hình hồi quy tuyến tính trong Python với các dịch vụ học tập máy SQL Server hoặc trên các cụm dữ liệu lớn SQL Server 2019.

Trong phần hai của loạt hướng dẫn gồm bốn phần này, bạn sẽ chuẩn bị dữ liệu từ cơ sở dữ liệu bằng Python. Sau đó trong loạt bài này, bạn sẽ sử dụng dữ liệu này để đào tạo và triển khai mô hình hồi quy tuyến tính trong Python với các dịch vụ học tập máy SQL Server.

Trong phần hai của loạt hướng dẫn gồm bốn phần này, bạn sẽ chuẩn bị dữ liệu từ cơ sở dữ liệu bằng Python. Sau đó trong loạt bài này, bạn sẽ sử dụng dữ liệu này để đào tạo và triển khai mô hình hồi quy tuyến tính bằng Python với các dịch vụ học máy thể hiện được quản lý của Azure SQL.

Trong bài viết này, bạn sẽ học cách:

  • Tải dữ liệu từ cơ sở dữ liệu vào khung dữ liệu gấu trúcpandas data frame
  • Chuẩn bị dữ liệu trong Python bằng cách xóa một số cột

Để đào tạo mô hình học máy sử dụng dữ liệu từ cơ sở dữ liệu TutorialDB, hãy làm theo Phần ba của chuỗi hướng dẫn này:

Phản HồI

Gửi và xem ý kiến ​​ph

Hướng dẫn Python: Chuẩn bị dữ liệu để đào tạo mô hình hồi quy tuyến tính với học máy SQL

  • Bài viết

15/06/2022

3 Phú

Trong bài viết nào

Tập lệnh Python bên dưới nhập dữ liệu từ bảng dbo.rental_data trong cơ sở dữ liệu của bạn vào khung dữ liệu Pandas DF.df.

Trong chuỗi kết nối, thay thế chi tiết kết nối khi cần thiết. Để sử dụng xác thực Windows với chuỗi kết nối ODBC, chỉ định Trusted_Connection=Yes; thay vì tham số UIDPWD.

import pyodbc
import pandas
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Connection string to your SQL Server instance
conn_str = pyodbc.connect('DRIVER={ODBC Driver 17 for SQL Server}; SERVER=; DATABASE=TutorialDB;UID=;PWD=')

query_str = 'SELECT Year, Month, Day, Rentalcount, Weekday, Holiday, Snow FROM dbo.rental_data'

df = pandas.read_sql(sql=query_str, con=conn_str)
print("Data frame:", df)

Bạn sẽ thấy kết quả tương tự như sau.

Data frame:      Year  Month  Day  Rentalcount  WeekDay  Holiday  Snow
0    2014      1   20          445        2        1     0
1    2014      2   13           40        5        0     0
2    2013      3   10          456        1        0     0
3    2014      3   31           38        2        0     0
4    2014      4   24           23        5        0     0
..    ...    ...  ...          ...      ...      ...   ...
448  2013      2   19           57        3        0     1
449  2015      3   18           26        4        0     0
450  2015      3   24           29        3        0     1
451  2014      3   26           50        4        0     1
452  2015     12    6          377        1        0     1

[453 rows x 7 columns]

Lọc các cột từ DataFrame để loại bỏ các cột mà chúng tôi không muốn sử dụng trong khóa đào tạo. Rentalcount không nên được bao gồm vì nó là mục tiêu của các dự đoán.

columns = df.columns.tolist()
columns = [c for c in columns if c not in ["Year", "Rentalcount"]]

print("Training set:", test[columns])

Lưu ý dữ liệu tập huấn luyện sẽ có quyền truy cập:

Training set:      Month  Day  Weekday  Holiday  Snow
1        2   13        5        0     0
3        3   31        2        0     0
7        3    8        7        0     0
15       3    4        2        0     1
22       1   18        1        0     0
..     ...  ...      ...      ...   ...
416      4   13        1        0     1
421      1   21        3        0     1
438      2   19        4        0     1
441      2    3        3        0     1
447      1    4        6        0     1

[91 rows x 5 columns]

Bước tiếp theo

Trong phần hai của loạt hướng dẫn này, bạn đã hoàn thành các bước sau:

  • Tải dữ liệu từ cơ sở dữ liệu vào khung dữ liệu gấu trúcpandas data frame
  • Chuẩn bị dữ liệu trong Python bằng cách xóa một số cột

Để đào tạo mô hình học máy sử dụng dữ liệu từ cơ sở dữ liệu TutorialDB, hãy làm theo Phần ba của chuỗi hướng dẫn này:

Phản HồI

Gửi và xem ý kiến ​​ph