Hướng dẫn python string format mask - mặt nạ định dạng chuỗi python

Chia sẻ dữ liệu, tạo tài liệu và thực hiện các cuộc biểu tình công khai thường yêu cầu dữ liệu có chứa PII hoặc tài liệu nhạy cảm khác được che dấu.

Nội dung chính ShowShow

  • Nhập mô -đun
  • Chức năng mặt nạ cá nhân
  • Hash_String
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.
  • 2019-02-12 14: 22: 40.681
  • 2019-02-12 14: 22: 40.681
  • 2019-02-12 14: 22: 40.697

Nội dung chính ShowShowShow

  • Nhập mô -đun
  • Chức năng mặt nạ cá nhân
  • Hash_String
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Hash_Item
  • Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.
  • 2019-02-12 14: 22: 40.681
  • 2019-02-12 14: 22: 40.681
  • 2019-02-12 14: 22: 40.697
  • Nội dung chính ShowShow
  • 2019-02-12 13: 00: 48.000
  • fmlmbnlpdcbnbnn
  • Kiểm tra kết quả mặt nạ của bạn

Làm thế nào để bạn che giấu dữ liệu nhạy cảm?

Làm thế nào để bạn ẩn danh dữ liệu trong Python?

Làm thế nào để bạn áp dụng mặt nạ dữ liệu?

Nhập mô -đun

from msticpy.data import data_obfus

MSTICPY chứa một thư viện đơn giản để xua tan dữ liệu bằng cách sử dụng băm và ánh xạ ngẫu nhiên các giá trị. Bạn có thể sử dụng các chức năng này trên một mục dữ liệu hoặc toàn bộ khung dữ liệu.

Cảnh báo

Chức năng mặt nạ cá nhân

Hash_String

data_obfus.hash_string(...)

Hash_String

Hash_Item

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944

2019-02-12 14: 22: 40.681

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

> hash_item('sensitive data', delim=' ')
kdneqoiia laoe

> hash_item('most-sensitive-data/here', delim=' /-')
kmea-kdneqoiia-laoe/fcec

Hash_Item

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

2019-02-12 14: 22: 40.681

Làm thế nào để bạn ẩn danh dữ liệu trong Python?

Làm thế nào để bạn áp dụng mặt nạ dữ liệu?

Nhập mô -đun

MSTICPY chứa một thư viện đơn giản để xua tan dữ liệu bằng cách sử dụng băm và ánh xạ ngẫu nhiên các giá trị. Bạn có thể sử dụng các chức năng này trên một mục dữ liệu hoặc toàn bộ khung dữ liệu.

Cảnh báo

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
2

Hash_Item

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
5

Hash_Item

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

data_obfus.hash_string(...)
1

Hash_Item

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

data_obfus.hash_string(...)
3

Hash_Item

2019-02-12 14: 22: 40.681

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

data_obfus.hash_string(...)
5

Hash_Item

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

2019-02-12 14: 22: 40.681

data_obfus.hash_string(...)
6

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

2019-02-12 14: 22: 40.681

Hash_Item

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

2019-02-12 14: 22: 40.681

2019-02-12 14: 22: 40.697

Nội dung chính ShowShow

data_obfus.hash_string(...)
8

Làm thế nào để bạn ẩn danh dữ liệu trong Python?

Làm thế nào để bạn áp dụng mặt nạ dữ liệu?

MSTICPY chứa một thư viện đơn giản để xua tan dữ liệu bằng cách sử dụng băm và ánh xạ ngẫu nhiên các giá trị. Bạn có thể sử dụng các chức năng này trên một mục dữ liệu hoặc toàn bộ khung dữ liệu.

Cảnh báo

Các chức năng này chỉ được dự định để che dấu dữ liệu. Không có nỗ lực thực sự được thực hiện để bảo tồn cú pháp và ý nghĩa của đầu ra. Chúng tôi khuyên bạn không nên cố gắng sử dụng một tập dữ liệu bị che khuất làm đầu vào cho bất kỳ phân tích nào. Thay vào đó, hãy thực hiện phân tích của bạn và che giấu kết quả.

Xem

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
8 để biết chi tiết API.

Hash_Item

Trong các ví dụ dưới đây, chúng tôi sẽ nhập các chức năng riêng lẻ từ mô -đun data_obfus nhưng bạn có thể truy cập chúng với câu lệnh nhập duy nhất hiển thị ở trên dưới dạng thuộc tính của mô -đun đó.

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
9 thực hiện một hàm băm đơn giản của đầu vào. Nếu đầu vào là một chuỗi số, nó sẽ xuất ra một số.
Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string

Ví dụ

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
0 cho phép đặc điểm kỹ thuật của các dấu phân cách. Điều này rất hữu ích để bảo tồn giao diện của miền, email, v.v.
Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
7

L4Protocol

Hash_list

52b1ab41-869e-4138-9e40-2a4457f09bf0

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
4 sẽ chọn ngẫu nhiên một danh sách các mục bảo tồn cấu trúc danh sách nhưng coi từng phần tử là một chuỗi đơn giản để băm.

Hash_dict

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
5 sẽ chọn ngẫu nhiên một bản mới của các mục bảo tồn cấu trúc và tên của các khóa từ điển. Chỉ các giá trị của các khóa được băm.

msticalertswin1

10.0.3.5

thay thế_guid

MSTICPY chứa một thư viện đơn giản để xua tan dữ liệu bằng cách sử dụng băm và ánh xạ ngẫu nhiên các giá trị. Bạn có thể sử dụng các chức năng này trên một mục dữ liệu hoặc toàn bộ khung dữ liệu.

Cảnh báo

MSTICPY chứa một thư viện đơn giản để xua tan dữ liệu bằng cách sử dụng băm và ánh xạ ngẫu nhiên các giá trị. Bạn có thể sử dụng các chức năng này trên một mục dữ liệu hoặc toàn bộ khung dữ liệu.

Cảnh báo

Các chức năng này chỉ được dự định để che dấu dữ liệu. Không có nỗ lực thực sự được thực hiện để bảo tồn cú pháp và ý nghĩa của đầu ra. Chúng tôi khuyên bạn không nên cố gắng sử dụng một tập dữ liệu bị che khuất làm đầu vào cho bất kỳ phân tích nào. Thay vào đó, hãy thực hiện phân tích của bạn và che giấu kết quả.

65.55.44.109

52b1ab41-869e-4138-9e40-2a4457f09bf0

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

2019-02-12 14: 22: 40.681

Mặt nạ DataFrames

msticalertswin1

10.0.3.5

Chúng ta có thể sử dụng tiện ích mở rộng gấu trúc MSTICPY để che dấu dữ liệu trong toàn bộ khung dữ liệu.

Xem

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
7

Xem

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
7

Thư viện mặt nạ chứa một ánh xạ cho một số tên trường chung. Bạn có thể xem danh sách này bằng cách hiển thị thuộc tính:

13.71.172.128

52b1ab41-869e-4138-9e40-2a4457f09bf0

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Phương pháp và phần mở rộng gấu trúc được đổi tên từ mSticpy 0.9.0 từ mp_obfus.obfuscate () thành mp_mask.mask ()

Mặt nạ DataFrames

msticalertswin1

10.0.3.5

Chúng ta có thể sử dụng tiện ích mở rộng gấu trúc MSTICPY để che dấu dữ liệu trong toàn bộ khung dữ liệu.

Xem

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
7

Xem

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
7

Thư viện mặt nạ chứa một ánh xạ cho một số tên trường chung. Bạn có thể xem danh sách này bằng cách hiển thị thuộc tính:

13.71.172.130

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Phương pháp và phần mở rộng gấu trúc được đổi tên từ mSticpy 0.9.0 từ mp_obfus.obfuscate () thành mp_mask.mask ()

Địa chỉ IPv6 có các thành phần riêng lẻ của chúng được băm vào chuỗi HEX và không sử dụng ánh xạ này. Điều này vẫn sẽ dẫn đến một địa chỉ IP đầu vào đã cho được ánh xạ tới cùng một địa chỉ đeo mặt nạ. Địa chỉ IPv6 đầu ra thường sẽ không phải là địa chỉ IP hợp lệ.

Hash_sid
> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
2 sẽ chọn ngẫu nhiên các phần dành riêng cho miền của Windows SID. Nó bảo tồn các SID tích hợp và các RID nổi tiếng (ví dụ: Quản trị viên ‘-500, RID sẽ được bảo tồn trong đầu ra đeo mặt nạ). Các SID tích hợp (như Hệ thống địa phương và Networkservice được bảo tồn AS-IS.
Hash_account

Hash_list

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
4 sẽ chọn ngẫu nhiên một danh sách các mục bảo tồn cấu trúc danh sách nhưng coi từng phần tử là một chuỗi đơn giản để băm.

Hash_dict

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
5 sẽ chọn ngẫu nhiên một bản mới của các mục bảo tồn cấu trúc và tên của các khóa từ điển. Chỉ các giá trị của các khóa được băm.

L4Protocol

thay thế_guid

68a5a31d-7516-4c54-ad27-3b1360ce0b56

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
6 sẽ xuất một UUID ngẫu nhiên được ánh xạ vào đầu vào. UUUD đầu vào tương tự sẽ được ánh xạ tới cùng một UUID đầu ra mới được tạo cho phiên Python hiện tại.

Trong ví dụ dưới đây, bạn có thể thấy rằng UUID #4 giống như #1 và được ánh xạ tới cùng một UUID đầu ra.

Mặt nạ DataFrames

msticalertswin1

10.0.3.5

Chúng ta có thể sử dụng tiện ích mở rộng gấu trúc MSTICPY để che dấu dữ liệu trong toàn bộ khung dữ liệu.

Xem

Xem

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
7

65.55.44.109

68a5a31d-7516-4c54-ad27-3b1360ce0b56

Thư viện mặt nạ chứa một ánh xạ cho một số tên trường chung. Bạn có thể xem danh sách này bằng cách hiển thị thuộc tính:

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Phương pháp và phần mở rộng gấu trúc được đổi tên từ mSticpy 0.9.0 từ mp_obfus.obfuscate () thành mp_mask.mask ()

msticalertswin1

10.0.3.5

Địa chỉ IPv6 có các thành phần riêng lẻ của chúng được băm vào chuỗi HEX và không sử dụng ánh xạ này. Điều này vẫn sẽ dẫn đến một địa chỉ IP đầu vào đã cho được ánh xạ tới cùng một địa chỉ đeo mặt nạ. Địa chỉ IPv6 đầu ra thường sẽ không phải là địa chỉ IP hợp lệ.

Xem

Xem

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
7

13.71.172.128

68a5a31d-7516-4c54-ad27-3b1360ce0b56

Thư viện mặt nạ chứa một ánh xạ cho một số tên trường chung. Bạn có thể xem danh sách này bằng cách hiển thị thuộc tính:

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Phương pháp và phần mở rộng gấu trúc được đổi tên từ mSticpy 0.9.0 từ mp_obfus.obfuscate () thành mp_mask.mask ()

msticalertswin1

10.0.3.5

Địa chỉ IPv6 có các thành phần riêng lẻ của chúng được băm vào chuỗi HEX và không sử dụng ánh xạ này. Điều này vẫn sẽ dẫn đến một địa chỉ IP đầu vào đã cho được ánh xạ tới cùng một địa chỉ đeo mặt nạ. Địa chỉ IPv6 đầu ra thường sẽ không phải là địa chỉ IP hợp lệ.

Xem

Xem

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
7

13.71.172.130

Thư viện mặt nạ chứa một ánh xạ cho một số tên trường chung. Bạn có thể xem danh sách này bằng cách hiển thị thuộc tính:

Trong ví dụ đầu tiên, Tenantid, Resourcegroup, VMName đã được che dấu.

Phương pháp và phần mở rộng gấu trúc được đổi tên từ mSticpy 0.9.0 từ mp_obfus.obfuscate () thành mp_mask.mask ()

Địa chỉ IPv6 có các thành phần riêng lẻ của chúng được băm vào chuỗi HEX và không sử dụng ánh xạ này. Điều này vẫn sẽ dẫn đến một địa chỉ IP đầu vào đã cho được ánh xạ tới cùng một địa chỉ đeo mặt nạ. Địa chỉ IPv6 đầu ra thường sẽ không phải là địa chỉ IP hợp lệ.Creating custom mappings.

data_obfus.hash_string(...)
9

Hash_sid

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
2 sẽ chọn ngẫu nhiên các phần dành riêng cho miền của Windows SID. Nó bảo tồn các SID tích hợp và các RID nổi tiếng (ví dụ: Quản trị viên ‘-500, RID sẽ được bảo tồn trong đầu ra đeo mặt nạ). Các SID tích hợp (như Hệ thống địa phương và Networkservice được bảo tồn AS-IS.

Hash_account

> hash_string('sensitive data')
jdiqcnrqmlidkd

> hash_string('42424')
59944
2 sẽ chọn ngẫu nhiên một tên tài khoản trong khi bảo tồn cấu trúc và ánh xạ một-một giữa tên tài khoản được che dấu và thực tế. Nó bảo tồn các tài khoản tích hợp, chẳng hạn như Root Root, hệ thống trực tuyến, v.v.

Đầu ra DataFrame Sau khi áp dụng ánh xạ cột tùy chỉnh

Người thuê nhà

Thời gian được tạo ra

FlowstartTime

Nhóm tài nguyên

Tên vmname

L4Protocol

Vmipaddress

68a5a31d-7516-4c54-ad27-3b1360ce0b56

Công khai

Srcip

ibmkajbmepnmiaeilfofa

[‘13 .71.172.130, ‘13 .71.172.128,]]

149.172.239.103

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

nan

nan

T

62.100.208.57

68a5a31d-7516-4c54-ad27-3b1360ce0b56

2019-02-12 14: 22: 40.681

2019-02-12 13: 00: 48.000

ibmkajbmepnmiaeilfofa

[‘13 .71.172.130, ‘13 .71.172.128,]]

149.172.239.103

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

nan

nan

T

156.64.40.236

68a5a31d-7516-4c54-ad27-3b1360ce0b56

2019-02-12 14: 22: 40.681

2019-02-12 13: 00: 48.000

ibmkajbmepnmiaeilfofa

[‘13 .71.172.130, ‘13 .71.172.128,]]

149.172.239.103

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

nan

nan

T

156.64.40.139

2019-02-12 14: 22: 40.681

2019-02-12 13: 00: 48.000

ibmkajbmepnmiaeilfofa

[‘13 .71.172.130, ‘13 .71.172.128,]]

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

nan

T

2019-02-12 14: 22: 40.681

Đầu ra DataFrame Sau khi áp dụng ánh xạ cột tùy chỉnh

Người thuê nhà

Thời gian được tạo ra

FlowstartTime

Nhóm tài nguyên

Tên vmname

L4Protocol

Vmipaddress

68a5a31d-7516-4c54-ad27-3b1360ce0b56

Công khai

Srcip

ibmkajbmepnmiaeilfofa

[‘13 .71.172.130, ‘13 .71.172.128,]]

149.172.239.103

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

nan

nan

T

62.100.208.57

68a5a31d-7516-4c54-ad27-3b1360ce0b56

2019-02-12 14: 22: 40.681

2019-02-12 13: 00: 48.000

ibmkajbmepnmiaeilfofa

[‘13 .71.172.130, ‘13 .71.172.128,]]

149.172.239.103

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

nan

nan

T

156.64.40.236

68a5a31d-7516-4c54-ad27-3b1360ce0b56

2019-02-12 14: 22: 40.681

2019-02-12 13: 00: 48.000

ibmkajbmepnmiaeilfofa

[‘13 .71.172.130, ‘13 .71.172.128,]]

149.172.239.103

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

nan

nan

T

156.64.40.139

2019-02-12 14: 22: 40.681

2019-02-12 13: 00: 48.000

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
1

ibmkajbmepnmiaeilfofa

[‘13 .71.172.130, ‘13 .71.172.128,]]

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

nan

replace_guid

T

hash_ip

2019-02-12 14: 22: 40.681

hash_string

Đầu ra DataFrame Sau khi áp dụng ánh xạ cột tùy chỉnh

hash_dict

Người thuê nhà

hash_list

Thời gian được tạo ra

hash_sid

FlowstartTime

Nhóm tài nguyên

Tên vmname

hash_str*

delims_str

hash_item*

Vmipaddress

  • Công khai

  • Srcip

  • ibmkajbmepnmiaeilfofa

[‘13 .71.172.130, ‘13 .71.172.128,]]

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

nan

T

2019-02-12 14: 22: 40.681

2019-02-12 13: 00: 48.000

Tenantid và Resourcegroup đã được che dấu nhưng VMName và các trường iPaddress không có.

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
0

Thêm ánh xạ cột tùy chỉnh@mydomain.com”

Trong ví dụ trước, có lẽ bạn đã phát hiện ra rằng các cột VMipAddress, Publicips và Allextips đều không thay đổi. Điều này là do không có ánh xạ mặc định cho các tên cột này trong bảng ánh xạ tích hợ[email protected]

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
2

Chúng ta có thể thêm các cột này vào một từ điển ánh xạ tùy chỉnh và chạy lại quá trình che giấu. Xem phần sau về tạo ánh xạ tùy chỉnh.

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
3

Định mệnh

Allextips

2019-02-12 14: 22: 40.697

2019-02-12 13: 00: 07.000

fmlmbnlpdcbnbnn

[‘62 .100.208.57]]

[‘156.64.40.139,‘ 156.64.40.236,]]

Mặt nạ_df

Trong ví dụ trước, có lẽ bạn đã phát hiện ra rằng các cột VMipAddress, Publicips và Allextips đều không thay đổi. Điều này là do không có ánh xạ mặc định cho các tên cột này trong bảng ánh xạ tích hợ[email protected]

Chúng ta có thể thêm các cột này vào một từ điển ánh xạ tùy chỉnh và chạy lại quá trình che giấu. Xem phần sau về tạo ánh xạ tùy chỉnh.

Định mệnh

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
4
Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
5

Allextips

Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
6
Hash a simple string.

Parameters
----------
input_str : str
    The input string

Returns
-------
str
    The masked output string
7

2019-02-12 14: 22: 40.697Take a backup or a golden copy of the production database to a different environment. Remove any unnecessary data, and mask it while in stasis. Save the masked copy to the desired location.