Hướng dẫn which command is used to get the dummy variable in python? - lệnh nào được sử dụng để lấy biến giả trong python?

Xem thảo luận

Cải thiện bài viết

Lưu bài viết

  • Đọc
  • Bàn luận
  • Xem thảo luận

    Cải thiện bài viết

    Lưu bài viết

    Đọc

    Explanation:

    Hướng dẫn which command is used to get the dummy variable in python? - lệnh nào được sử dụng để lấy biến giả trong python?

    Bàn luận

    Một bộ dữ liệu có thể chứa các loại giá trị khác nhau, đôi khi nó bao gồm các giá trị phân loại. Vì vậy, theo đơn đặt hàng để sử dụng các giá trị phân loại đó để lập trình một cách hiệu quả, chúng tôi tạo ra các biến giả. Một biến giả là một biến nhị phân cho biết liệu một biến phân loại riêng biệt có vào một giá trị cụ thể hay không. & NBSP;pandas.get_dummies(data, prefix=None, prefix_sep=’_’,)

    Parameters:

    • Như bạn có thể thấy ba biến giả được tạo cho ba giá trị phân loại của thuộc tính nhiệt độ. Chúng ta có thể tạo các biến giả trong python bằng phương thức get_dummies ().
    • Cú pháp: pandas.get_dummies (dữ liệu, tiền tố = none, prefix_sep = xông _,)
    • Dữ liệu = dữ liệu đầu vào, tức là nó bao gồm khung dữ liệu gấu trúc. danh sách . bộ . Mảng numpy, v.v.

    tiền tố = giá trị ban đầu Dummy variables.

    prefix_sep = phân tách giá trị dữ liệu.

    • Loại trả về: Biến giả.
    • Cách tiếp cận từng bước:
    • Nhập các mô -đun cần thiết

    Xem xét dữ liệu

    Python3

    Thực hiện các hoạt động trên dữ liệu để lấy người giả

    Ví dụ 1: & nbsp;

    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    0
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    1

    >>> s1 = ['a', 'b', np.nan]
    
    7
    >>> s1 = ['a', 'b', np.nan]
    
    8

    >>> s1 = ['a', 'b', np.nan]
    
    9
    >>> pd.get_dummies(s1)
       a  b
    0  1  0
    1  0  1
    2  0  0
    
    0

    >>> pd.get_dummies(s1)
       a  b
    0  1  0
    1  0  1
    2  0  0
    
    1

    Output:

    Hướng dẫn which command is used to get the dummy variable in python? - lệnh nào được sử dụng để lấy biến giả trong python?

    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    0
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    3

    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    4
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    5
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    6
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    7
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    8
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    9
    >>> s1 = ['a', 'b', np.nan]
    
    0
    >>> s1 = ['a', 'b', np.nan]
    
    1
    >>> s1 = ['a', 'b', np.nan]
    
    0
    >>> s1 = ['a', 'b', np.nan]
    
    3__

    Python3

    Thực hiện các hoạt động trên dữ liệu để lấy người giả

    Ví dụ 1: & nbsp;

    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    0
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    1

    >>> s1 = ['a', 'b', np.nan]
    
    9
    >>> pd.get_dummies(s1, dummy_na=True)
       a  b  NaN
    0  1  0    0
    1  0  1    0
    2  0  0    1
    
    4

    >>> pd.get_dummies(s1, dummy_na=True)
       a  b  NaN
    0  1  0    0
    1  0  1    0
    2  0  0    1
    
    5

    Output:

    Hướng dẫn which command is used to get the dummy variable in python? - lệnh nào được sử dụng để lấy biến giả trong python?

    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    0
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    3
     

    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    4
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    5
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    6
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    7
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    8
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    9
    >>> s1 = ['a', 'b', np.nan]
    
    0
    >>> s1 = ['a', 'b', np.nan]
    
    1
    >>> s1 = ['a', 'b', np.nan]
    
    0
    >>> s1 = ['a', 'b', np.nan]
    
    3__

    Python3

    Thực hiện các hoạt động trên dữ liệu để lấy người giả

    Ví dụ 1: & nbsp;

    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    0
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    1

    >>> s1 = ['a', 'b', np.nan]
    
    7
    >>> pd.get_dummies(df, prefix=['col1', 'col2'])
       C  col1_a  col1_b  col2_a  col2_b  col2_c
    0  1       1       0       0       1       0
    1  2       0       1       1       0       0
    2  3       1       0       0       0       1
    
    2
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    8
    >>> df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
    ...                    'C': [1, 2, 3]})
    
    7
    >>> s1 = ['a', 'b', np.nan]
    
    0
    >>> df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
    ...                    'C': [1, 2, 3]})
    
    5
    >>> s1 = ['a', 'b', np.nan]
    
    0
    >>> df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
    ...                    'C': [1, 2, 3]})
    
    5
    >>> s1 = ['a', 'b', np.nan]
    
    6

    >>> s1 = ['a', 'b', np.nan]
    
    7
    >>> pd.get_dummies(pd.Series(list('abcaa')))
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    4  1  0  0
    
    1
    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    
    8
    >>> pd.get_dummies(pd.Series(list('abcaa')))
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    4  1  0  0
    
    3
    >>> s1 = ['a', 'b', np.nan]
    
    0
    >>> pd.get_dummies(pd.Series(list('abcaa')))
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    4  1  0  0
    
    5
    >>> s1 = ['a', 'b', np.nan]
    
    0
    >>> pd.get_dummies(pd.Series(list('abcaa')))
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    4  1  0  0
    
    7
    >>> pd.get_dummies(pd.Series(list('abcaa')))
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    4  1  0  0
    
    8

    >>> s1 = ['a', 'b', np.nan]
    
    9
    >>> pd.get_dummies(s1)
       a  b
    0  1  0
    1  0  1
    2  0  0
    
    0

    >>> pd.get_dummies(s1)
       a  b
    0  1  0
    1  0  1
    2  0  0
    
    1

    Output:

    Hướng dẫn which command is used to get the dummy variable in python? - lệnh nào được sử dụng để lấy biến giả trong python?


    pandas.get_dummies (dữ liệu, tiền tố = none, prefix_sep = '_', dummy_na = falseget_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False, dtype=None)[source]#

    Chuyển đổi biến phân loại thành các biến giả/chỉ báo.

    Tham sốDataArray-like, series hoặc dataFramedataarray-like, Series, or DataFrame

    Dữ liệu để có được các chỉ số giả.

    tiền tố, danh sách str hoặc dict của str, không có mặc địnhstr, list of str, or dict of str, default None

    Chuỗi để nối các tên cột DataFrame. Vượt qua danh sách có độ dài bằng số lượng cột khi gọi get_dummies trên DataFrame. Ngoài ra, tiền tố có thể là một tên cột ánh xạ từ điển thành tiền tố.

    prefix_sepstr, mặc định ‘_str, default ‘_’

    Nếu thêm tiền tố, dấu phân cách/dấu phân cách sử dụng. Hoặc vượt qua danh sách hoặc từ điển như với tiền tố.

    dummy_nabool, mặc định saibool, default False

    Thêm một cột để chỉ ra NAN, nếu NAN sai bị bỏ qua.

    Cột List giống như, Không có mặc địnhlist-like, default None

    Tên cột trong khung dữ liệu được mã hóa. Nếu các cột không có thì tất cả các cột có đối tượng, chuỗi hoặc danh mục DTYPE sẽ được chuyển đổi.

    Sparsebool, mặc định saibool, default False

    Cho dù các cột được mã hóa giả phải được hỗ trợ bởi

    >>> pd.get_dummies(pd.Series(list('abcaa')), drop_first=True)
       b  c
    0  0  0
    1  1  0
    2  0  1
    3  0  0
    4  0  0
    
    2 (đúng) hoặc một mảng numpy thông thường (sai).

    drop_firstbool, mặc định saibool, default False

    Có nên đưa Dummies K-1 ra khỏi các cấp phân loại K bằng cách loại bỏ cấp độ đầu tiên.

    DTYPedType, mặc định np.uint8dtype, default np.uint8

    Kiểu dữ liệu cho các cột mới. Chỉ cho phép một DTYPE duy nhất.

    ReturnSdatAframe

    Dữ liệu mã hóa giả.

    Ghi chú

    Tham khảo Hướng dẫn sử dụng để biết thêm ví dụ.the user guide for more examples.

    Ví dụ

    >>> s = pd.Series(list('abca'))
    

    >>> pd.get_dummies(s)
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    

    >>> s1 = ['a', 'b', np.nan]
    

    >>> pd.get_dummies(s1)
       a  b
    0  1  0
    1  0  1
    2  0  0
    

    >>> pd.get_dummies(s1, dummy_na=True)
       a  b  NaN
    0  1  0    0
    1  0  1    0
    2  0  0    1
    

    >>> df = pd.DataFrame({'A': ['a', 'b', 'a'], 'B': ['b', 'a', 'c'],
    ...                    'C': [1, 2, 3]})
    

    >>> pd.get_dummies(df, prefix=['col1', 'col2'])
       C  col1_a  col1_b  col2_a  col2_b  col2_c
    0  1       1       0       0       1       0
    1  2       0       1       1       0       0
    2  3       1       0       0       0       1
    

    >>> pd.get_dummies(pd.Series(list('abcaa')))
       a  b  c
    0  1  0  0
    1  0  1  0
    2  0  0  1
    3  1  0  0
    4  1  0  0
    

    >>> pd.get_dummies(pd.Series(list('abcaa')), drop_first=True)
       b  c
    0  0  0
    1  1  0
    2  0  1
    3  0  0
    4  0  0
    

    >>> pd.get_dummies(pd.Series(list('abc')), dtype=float)
         a    b    c
    0  1.0  0.0  0.0
    1  0.0  1.0  0.0
    2  0.0  0.0  1.0
    

    Làm thế nào để bạn tạo một biến giả trong Python?

    Để chuyển đổi các biến phân loại của bạn thành các biến giả trong python, bạn c một phương thức sử dụng pandas get_dummies (). Ví dụ: nếu bạn có biến phân loại giới tính, trong dataFrame của bạn có tên là DF DF, bạn có thể sử dụng mã sau để tạo các biến giả: df_dc = pd. get_dummies (df, cột = ['giới tính']).use Pandas get_dummies() method. For example, if you have the categorical variable “Gender” in your dataframe called “df” you can use the following code to make dummy variables: df_dc = pd. get_dummies(df, columns=['Gender']) .

    Làm thế nào để bạn có được một hình nộm trong gấu trúc?

    Cú pháp của gấu trúc nhận được người giả rất đơn giản. Bạn gọi hàm là pd.get_dummies ().pd. get_dummies() .

    Chức năng nào được sử dụng để có được người giả?

    Chuyển đổi biến phân loại thành các biến giả/chỉ báo.Dữ liệu để có được các chỉ số giả.Chuỗi để nối các tên cột DataFrame.Vượt qua danh sách có độ dài bằng số lượng cột khi gọi get_dummies trên DataFrame.

    Một biến giả trong gấu trúc là gì?

    Một biến giả trong gấu trúc là một biến chỉ báo chỉ lấy giá trị, 0 hoặc, 1, để cho biết liệu một biến phân loại riêng biệt có thể lấy một giá trị cụ thể hay không.Để tạo một biến giả trong một khung dữ liệu nhất định trong gấu trúc, chúng tôi sử dụng hàm get_dummies ().an indicator variable that takes only the value, 0 , or, 1 , to indicate whether a separate categorical variable can take a specific value or not. To create a dummy variable in a given DataFrame in pandas, we make use of the get_dummies() function.