Hướng dẫn how do you add a dummy value in python? - làm thế nào để bạn thêm một giá trị giả trong python?
47 Show Mới! Lưu câu hỏi hoặc câu trả lời và sắp xếp nội dung yêu thích của bạn. Tìm hiểu thêm. Tôi đang cố gắng tạo ra một loạt các biến giả từ một biến phân loại sử dụng gấu trúc trong Python. Tôi đã bắt gặp hàm 3, nhưng bất cứ khi nào tôi cố gắng gọi nó, tôi nhận được một lỗi mà tên không được xác định.
Bất kỳ suy nghĩ hoặc cách khác để tạo ra các biến giả sẽ được đánh giá cao. Chỉnh sửa: Vì những người khác dường như đang gặp phải điều này, chức năng 3 function in pandas now works perfectly fine. This means the following should work:
Xem http://blog.yhathq.com/posts/logistic-regression-and-python.html để biết thêm thông tin.
Pirsquared Phù bằng vàng 273K53446 Huy hiệu bạc587 Huy hiệu đồng53 gold badges446 silver badges587 bronze badges Đã hỏi ngày 20 tháng 7 năm 2012 lúc 22:33Jul 20, 2012 at 22:33
Khi tôi nghĩ về các biến giả, tôi nghĩ đến việc sử dụng chúng trong bối cảnh hồi quy OLS, và tôi sẽ làm điều gì đó như thế này:
Đã trả lời ngày 29 tháng 5 năm 2014 lúc 3:26May 29, 2014 at 3:26
AkavallakavallAkavall 78.6K47 Huy hiệu vàng199 Huy hiệu bạc244 Huy hiệu Đồng47 gold badges199 silver badges244 bronze badges 5 Dựa trên tài liệu chính thức:
Ngoài ra còn có một bài viết hay trong blog FASTML. Đã trả lời ngày 24 tháng 12 năm 2015 lúc 21:07Dec 24, 2015 at 21:07
1 Thật khó để suy luận những gì bạn đang tìm kiếm từ câu hỏi, nhưng dự đoán tốt nhất của tôi là như sau. Nếu chúng tôi giả sử bạn có một khung dữ liệu trong đó một số cột là 'danh mục' và chứa các số nguyên (hoặc các định danh duy nhất) cho các danh mục, thì chúng ta có thể làm như sau. Gọi DataFrame 5 và giả sử rằng với mỗi hàng, 6 là một số giá trị trong tập hợp các số nguyên từ 1 đến N. sau đó,
Bây giờ sẽ có một cột chỉ báo mới cho mỗi danh mục đúng/sai tùy thuộc vào việc dữ liệu trong hàng đó có trong danh mục đó hay không. Nếu bạn muốn kiểm soát các tên danh mục, bạn có thể tạo một từ điển, chẳng hạn như
Để dẫn đến việc có các cột có tên được chỉ định, thay vì chỉ chuyển đổi chuỗi của các giá trị danh mục. Trong thực tế, đối với một số loại, 7 có thể không sản xuất bất cứ điều gì hữu ích cho bạn.Đã trả lời ngày 21 tháng 7 năm 2012 lúc 2:29Jul 21, 2012 at 2:29
ELLYely 71.3K32 Huy hiệu vàng143 Huy hiệu bạc220 Huy hiệu đồng32 gold badges143 silver badges220 bronze badges 1 Đối với trường hợp của tôi, 8 trong 9 đã giải quyết vấn đề của tôi. Trên thực tế, chức năng này được thiết kế để tạo các biến phụ thuộc và độc lập từ một khung dữ liệu nhất định với chuỗi công thức kiểu R. Nhưng nó có thể được sử dụng cho việc tạo các tính năng giả từ các tính năng phân loại. Tất cả những gì bạn cần làm sẽ là thả cột 'chặn' được tạo bởi 8 tự động bất kể dữ liệu gốc của bạn.
Đã trả lời ngày 23 tháng 9 năm 2016 lúc 18:06Sep 23, 2016 at 18:06
Erdem Kayaerdem KayaErdem KAYA 4291 Huy hiệu vàng4 Huy hiệu bạc13 Huy hiệu đồng1 gold badge4 silver badges13 bronze badges Bạn có thể tạo các biến giả để xử lý dữ liệu phân loại
Điều này sẽ giảm các cột ban đầu trong TrainDF và nối cột với các biến giả ở cuối DataFdummies DataFrame.trainDf and append the column with dummy variables at the end of the trainDfDummies dataframe. Nó tự động tạo tên cột bằng cách nối thêm các giá trị ở cuối tên cột gốc. Đã trả lời ngày 21 tháng 5 năm 2017 lúc 23:28May 21, 2017 at 23:28
rzskhrrzskhrrzskhr 87111 Huy hiệu bạc9 Huy hiệu đồng11 silver badges9 bronze badges Một cách tiếp cận rất đơn giản mà không sử dụng get_dummies nếu bạn có biến rất ít phân loại bằng cách sử dụng numpy và gấu trúc.without using get_dummies if you have very less categorical variable using NumPy and Pandas.
Chúng ta có thể làm điều đó với mã đơn giản sau đây.
1
Đã trả lời ngày 23 tháng 7 năm 2021 lúc 6:56Jul 23, 2021 at 6:56
Vì vậy, tôi thực sự cần một câu trả lời cho câu hỏi này ngày hôm nay (25/7/2013), vì vậy tôi đã viết điều này sớm hơn. Tôi đã thử nghiệm nó với một số ví dụ đồ chơi, hy vọng bạn sẽ nhận được một số dặm từ nó
Đã trả lời ngày 25 tháng 7 năm 2013 lúc 0:12Jul 25, 2013 at 0:12
1 Tôi đã tạo một biến giả cho mọi trạng thái bằng cách sử dụng mã này. 0Tổng quát hơn, tôi sẽ chỉ sử dụng. Apply và chuyển nó một chức năng ẩn danh với sự bất bình đẳng xác định danh mục của bạn. (Cảm ơn @prpl.mnky.dshwshr cho cái nhìn sâu sắc .unique ()) Đã trả lời ngày 20 tháng 12 năm 2014 lúc 5:51Dec 20, 2014 at 5:51
userfoguserfoguserFog Phim huy hiệu vàng 9,90111 gold badge14 silver badges7 bronze badges Xử lý các tính năng phân loại Scikit-Learn mong đợi tất cả các tính năng sẽ có số. Vậy làm thế nào để chúng tôi bao gồm một tính năng phân loại trong mô hình của chúng tôi? Các loại được đặt hàng: Chuyển đổi chúng thành các giá trị số hợp lý (ví dụ: Small = 1, Medium = 2, Lớn = 3) Danh mục không được đặt hàng: Sử dụng mã hóa giả (0/1) Các tính năng phân loại trong bộ dữ liệu của chúng tôi là gì? Các loại được đặt hàng: thời tiết (đã được mã hóa với các giá trị số hợp lý) Các loại không được đặt hàng: mùa (nhu cầu mã hóa giả), kỳ nghỉ (đã được mã hóa giả), ngày làm việc (đã được mã hóa giả) cho mùa , 2 = mùa hè, 3 = mùa thu và 4 = mùa đông, bởi vì đó sẽ ngụ ý một mối quan hệ theo thứ tự. Thay vào đó, chúng tôi tạo nhiều biến giả: 1Đã trả lời ngày 5 tháng 4 năm 2018 lúc 7:38Apr 5, 2018 at 7:38
Một cách đơn giản và mạnh mẽ để tạo hình nộm dựa trên một cột với các giá trị danh mục của bạn: 2Nhưng coi chừng khi thực hiện một số hồi quy OLS vì bạn sẽ cần loại trừ một trong các danh mục để bạn không rơi vào biến Bẫy Dummie Đã trả lời ngày 6 tháng 11 năm 2021 lúc 12:55Nov 6, 2021 at 12:55
RamonramonRamon 356 Huy hiệu Đồng6 bronze badges Làm thế nào để bạn tạo một biến giả?Có hai bước để thiết lập thành công các biến giả trong hồi quy bội: (1) tạo các biến giả đại diện cho các loại của biến độc lập phân loại của bạn; và (2) nhập các giá trị vào các biến giả này - được gọi là mã hóa giả - để thể hiện các loại của độc lập phân loại ...create dummy variables that represent the categories of your categorical independent variable; and (2) enter values into these dummy variables – known as dummy coding – to represent the categories of the categorical independent ...
Làm thế nào để bạn làm mã hóa giả trong Python?Để thực hiện mã hóa giả, hãy đặt tham số này thành 'Đầu tiên' làm giảm danh mục đầu tiên của mỗi biến. Sắp sáng - Đặt điều này thành FALSE để trả lại đầu ra dưới dạng mảng numpy. Mặc định là đúng trả về một ma trận thưa thớt.set this parameter to 'first' that drops the first category of each variable. sparse — Set this to False to return the output as a NumPy array. The default is True which returns a sparse matrix.
Làm cách nào để thêm một cột giả vào DataFrame trong Python?Ví dụ: nếu bạn có biến phân loại giới tính, trong dataFrame của bạn có tên là DF DF, bạn có thể sử dụng mã sau để tạo các biến giả: df_dc = pd.get_dummies (df, cột = ['giới tính']). Nếu bạn có nhiều biến phân loại, bạn chỉ cần thêm mọi tên biến làm chuỗi vào danh sách!df_dc = pd. get_dummies(df, columns=['Gender']) . If you have multiple categorical variables you simply add every variable name as a string to the list!
Làm thế nào để bạn có được các biến giả trong gấu trúc?Làm thế nào để tạo các biến giả trong gấu trúc.. Dữ liệu: Tên của gấu trúc DataFrame .. Tiền tố: Một chuỗi để nối vào mặt trước của cột biến giả mới .. Cột: Tên của (các) cột để chuyển đổi thành biến giả .. drop_first: có nên thả cột biến giả đầu tiên hay không .. Giá trị giả là gì?Một biến giả là một biến có giá trị 0 và 1, trong đó các giá trị chỉ ra sự hiện diện hoặc vắng mặt của một cái gì đó (ví dụ: 0 có thể chỉ ra giả dược và 1 có thể chỉ ra một loại thuốc).a variable that takes values of 0 and 1, where the values indicate the presence or absence of something (e.g., a 0 may indicate a placebo and 1 may indicate a drug).
Làm thế nào để bạn sử dụng các biến giả trong hồi quy?Các biến giả: Các biến số được sử dụng trong phân tích hồi quy để biểu thị dữ liệu phân loại chỉ có thể nhận được một trong hai giá trị: 0 hoặc một.Cái này là cái gì?Số lượng các biến giả mà chúng ta phải tạo bằng K-1 trong đó K là số lượng các giá trị khác nhau mà biến phân loại có thể đảm nhận.The number of dummy variables we must create is equal to k-1 where k is the number of different values that the categorical variable can take on. |