Cột DataFrame phân tích cú pháp Python

Pandas Hàm


# Syntax of Series.str.split[]
Series.str.split[pat=None, n=-1, expand=False]
2 được sử dụng để chia giá trị cột một chuỗi thành hai cột dựa trên dấu phân cách hoặc dấu phân cách được chỉ định. Hàm này hoạt động tương tự như phương thức

# Syntax of Series.str.split[]
Series.str.split[pat=None, n=-1, expand=False]
3, nhưng phương thức split[] hoạt động trên tất cả các cột Dataframe, trong khi Sê-ri. str. hàm split[] hoạt động trên các cột được chỉ định

Trong bài viết này, tôi sẽ giải thích Series. str. split[] và sử dụng cú pháp và tham số của nó, cách chúng tôi có thể chia một cột thành nhiều cột trong Pandas với các ví dụ

1. Ví dụ nhanh về tách cột thành hai cột

Sau đây là các ví dụ nhanh về tách một cột chuỗi thành hai cột


# Below are the quick examples
# Example 1: Split column of lists into two new columns
 Split string column into two new columns
df[['First Name', 'Last Name']] = df.Student_details.str.split["_", expand = True]

# Example 2: Split single column into two columns use ',' delimiter
df[['First Name', 'Last Name']] = df.Student_details.str.split[",", expand = True]

# Example 3: Split single column into two columns use ',' delimiter
df[['First Name', 'Last Name']] = df.Student_details.str.split[",", expand = True]

# Example 4: Split single column into two columns use apply[]
df[['First Name', 'Last Name']] = df["Student_details"].apply[lambda x: pd.Series[str[x].split[","]]]

# Example 5: # Split single column into two columns use apply[]
df[['First Name', 'Last Name']] = df["Student_details"].apply[lambda x: pd.Series[str[x].split["_"]]]

2. Cú pháp của chuỗi. str. tách ra[]

Sau đây là cú pháp của


# Syntax of Series.str.split[]
Series.str.split[pat=None, n=-1, expand=False]
4


# Syntax of Series.str.split[]
Series.str.split[pat=None, n=-1, expand=False]

2. 1 Thông số của sê-ri. str. tách ra[]

  • 
    # Syntax of Series.str.split[]
    Series.str.split[pat=None, n=-1, expand=False]
    
    5 Đó là ký hiệu dấu phân cách, dùng để chia một cột thành hai cột. Theo mặc định, nó là khoảng trắng
  • 
    # Syntax of Series.str.split[]
    Series.str.split[pat=None, n=-1, expand=False]
    
    6 [kiểu int] Là một số phần tách, mặc định là -1
  • 
    # Syntax of Series.str.split[]
    Series.str.split[pat=None, n=-1, expand=False]
    
    7 [loại bool]Mặc định là Sai. Nếu nó được đặt thành True, chức năng này sẽ trả về DataFrame. Theo mặc định, nó trả về Sê-ri

2. 2 Giá trị trả về

Nó trả về DataFrame/Series

3. Cách sử dụng sê-ri. str. tách ra[]

Pandas cung cấp sê-ri. str. split[] được sử dụng để chia giá trị cột chuỗi thành hai hoặc nhiều cột cùng với dấu phân cách được chỉ định. Các giá trị chuỗi được phân tách là nhiều giá trị trong một cột được phân tách bằng dấu gạch ngang, khoảng trắng, dấu phẩy, e. t. c. Hàm này trả về Pandas Series hoặc DataFrame

Hãy tạo Pandas DataFrame bằng cách sử dụng dữ liệu từ một từ điển Python. Tôi có một DataFrame với một cột [chuỗi] có tên là


# Syntax of Series.str.split[]
Series.str.split[pat=None, n=-1, expand=False]
8 và tôi muốn chia nó thành hai cột [chuỗi] có tên là

# Syntax of Series.str.split[]
Series.str.split[pat=None, n=-1, expand=False]
9


import pandas as pd
import numpy as np
technologies = {
    'Student_details':["Pramodh_Roy", "Leena_Singh", "James_William", "Addem_Smith"],
    'Courses':["Spark", "PySpark", "Pandas",  "Hadoop"],
    'Fee' :[25000, 20000, 22000, 25000]
              }
df = pd.DataFrame[technologies]
print[df]

Sản lượng dưới sản lượng


# Output:
  Student_details  Courses    Fee
0     Pramodh_Roy    Spark  25000
1     Leena_Singh  PySpark  20000
2   James_William   Pandas  22000
3     Addem_Smith   Hadoop  25000

4. Chia cột Chuỗi thành hai cột trong Pandas

Áp dụng Pandas


# Syntax of Series.str.split[]
Series.str.split[pat=None, n=-1, expand=False]
4 trên một cột DataFrame nhất định để chia thành nhiều cột trong đó cột có các giá trị chuỗi được phân tách. Ở đây, tôi đã chỉ định dấu phân cách

import pandas as pd
import numpy as np
technologies = {
    'Student_details':["Pramodh_Roy", "Leena_Singh", "James_William", "Addem_Smith"],
    'Courses':["Spark", "PySpark", "Pandas",  "Hadoop"],
    'Fee' :[25000, 20000, 22000, 25000]
              }
df = pd.DataFrame[technologies]
print[df]
1[gạch dưới] giữa các giá trị chuỗi của một trong các cột [mà chúng tôi muốn chia thành hai cột] của Khung dữ liệu của mình. Vì vậy, chúng tôi chuyển

import pandas as pd
import numpy as np
technologies = {
    'Student_details':["Pramodh_Roy", "Leena_Singh", "James_William", "Addem_Smith"],
    'Courses':["Spark", "PySpark", "Pandas",  "Hadoop"],
    'Fee' :[25000, 20000, 22000, 25000]
              }
df = pd.DataFrame[technologies]
print[df]
1 làm đối số đầu tiên cho Sê-ri. str. chức năng tách []

Hãy áp dụng chức năng trên và chia cột thành hai cột,


# Split string column into two new columns
df[['First Name', 'Last Name']] = df.Student_details.str.split["_", expand = True]
print[df]

Sản lượng dưới sản lượng


# Output:
  Student_details  Courses    Fee First Name Last Name
0     Pramodh_Roy    Spark  25000    Pramodh       Roy
1     Leena_Singh  PySpark  20000      Leena     Singh
2   James_William   Pandas  22000      James   William
3     Addem_Smith   Hadoop  25000      Addem     Smith

5. Sử dụng ',' Dấu phân cách và Cột chia

Trong ví dụ này, tôi đã chỉ định dấu phân cách


import pandas as pd
import numpy as np
technologies = {
    'Student_details':["Pramodh_Roy", "Leena_Singh", "James_William", "Addem_Smith"],
    'Courses':["Spark", "PySpark", "Pandas",  "Hadoop"],
    'Fee' :[25000, 20000, 22000, 25000]
              }
df = pd.DataFrame[technologies]
print[df]
3[dấu phẩy] giữa các giá trị chuỗi của một trong các cột [mà chúng tôi muốn chia thành hai cột] của Khung dữ liệu của chúng tôi


# Create One of the column of DataFrame 
# contain ',' delimiter values
'Student_details':["Pramodh, Roy", "Leena, Singh", "James, William", "Addem, Smith"]
    
# Split single column into two columns use ',' delimiter
df[['First Name', 'Last Name']] = df.Student_details.str.split[",", expand = True]
print[df]

Sản lượng thấp hơn sản lượng'


# Output:
  Student_details  Courses    Fee First Name Last Name
0    Pramodh, Roy    Spark  25000    Pramodh       Roy
1    Leena, Singh  PySpark  20000      Leena     Singh
2  James, William   Pandas  22000      James   William
3    Addem, Smith   Hadoop  25000      Addem     Smith

6. Sử dụng chức năng apply[] Chia cột thành hai cột trong Pandas

Trong Pandas, hàm apply[] được sử dụng để thực thi một hàm có thể được sử dụng để chia một giá trị cột thành nhiều cột. Để làm được điều đó, chúng ta phải truyền hàm lambda và Sê-ri. str. split[] thành hàm pandas apply[], sau đó gọi cột DataFrame mà chúng tôi muốn chia thành hai cột


# Split single column into two columns use apply[]
df[['First Name', 'Last Name']] = df["Student_details"].apply[lambda x: pd.Series[str[x].split[","]]]
print[df]

Sản lượng dưới sản lượng


# Output:
 Student_details  Courses    Fee First Name Last Name
0    Pramodh, Roy    Spark  25000    Pramodh       Roy
1    Leena, Singh  PySpark  20000      Leena     Singh
2  James, William   Pandas  22000      James   William
3    Addem, Smith   Hadoop  25000      Addem     Smith

6. 1 Sử dụng dấu gạch dưới [_]

Trong ví dụ này, tôi đã tách một trong các giá trị cột của một DataFrame nhất định bằng dấu phân cách gạch dưới [‘_’]. Chúng tôi chuyển '_' làm tham số của hàm split[] cùng với hàm lambda và hàm apply[]


# Syntax of Series.str.split[]
Series.str.split[pat=None, n=-1, expand=False]
0

Sản lượng dưới sản lượng


# Output:
  Student_details  Courses    Fee First Name Last Name
0     Pramodh_Roy    Spark  25000    Pramodh       Roy
1     Leena_Singh  PySpark  20000      Leena     Singh
2   James_William   Pandas  22000      James   William
3     Addem_Smith   Hadoop  25000      Addem     Smith

7. Phần kết luận

Trong bài viết này, tôi đã giải thích hàm


# Syntax of Series.str.split[]
Series.str.split[pat=None, n=-1, expand=False]
4 và cách sử dụng cú pháp cũng như tham số của nó để chia cột chuỗi Pandas DataFrame thành nhiều cột. Ngoài ra, tôi đã sử dụng hàm apply[] trong một số ví dụ để tách một cột chuỗi thành hai cột

Chủ Đề