Hướng dẫn how do you merge two rows in python? - làm thế nào để bạn hợp nhất hai hàng trong python?
Tôi có một khung dữ liệu với hai hàng và tôi muốn hợp nhất hai hàng thành một hàng. DF trông như sau: Show
Tôi đã cố gắng tạo hai khung dữ liệu riêng biệt và kết hợp chúng với df.merge (df2) mà không thành công. Kết quả phải là như sau
Bất kỳ ý tưởng? Cảm ơn trước DF.Update là một giải pháp khả thi? EDIT:
Điều này hoạt động cho ví dụ trên. Tuy nhiên, đối với các cột chứa các giá trị số, phương pháp này không mang lại đầu ra mong muốn, ví dụ: vì
Đầu ra phải là:
Công thức ở trên không tổng hợp các giá trị trong hai cột cuối cùng, nhưng lấy các giá trị trong hàng đầu tiên của DataFrame.
Làm thế nào vấn đề này có thể được khắc phục? Xem bây giờ hướng dẫn này có một khóa học video liên quan được tạo bởi nhóm Python thực sự. Xem cùng với hướng dẫn bằng văn bản để hiểu sâu hơn về sự hiểu biết của bạn: kết hợp dữ liệu trong gấu trúc với concat () và merge () This tutorial has a related video course created by the Real Python team. Watch it together with the written tutorial to deepen your understanding: Combining Data in pandas With concat() and merge() Làm thế nào để bạn hợp nhất các hàng trong Python?merge, join, and concatenate your datasets, allowing you to unify and better understand your data as you analyze it. Để hợp nhất các hàng trong một nhóm với nhau trong gấu trúc, chúng ta có thể sử dụng phương thức Agg (~) cùng với phương thức tham gia (~) để kết hợp các giá trị hàng.
Ngoài việc học cách sử dụng các kỹ thuật này, bạn cũng đã tìm hiểu về logic đặt bằng cách thử nghiệm các cách khác nhau để tham gia bộ dữ liệu của bạn. Ngoài ra, bạn đã tìm hiểu về các tham số phổ biến nhất cho từng kỹ thuật trên và những đối số nào bạn có thể truyền để tùy chỉnh đầu ra của chúng. Bạn đã thấy các kỹ thuật này hoạt động trên một bộ dữ liệu thực thu được từ NOAA, điều này cho thấy bạn không chỉ làm thế nào để kết hợp dữ liệu của mình mà còn cả những lợi ích của việc làm như vậy với các kỹ thuật tích hợp của Pandas. Nếu bạn đã tải xuống các tệp dự án, bạn có thể nhận được chúng ở đây: Bạn đã học được điều gì đó mới? Tìm ra một cách sáng tạo để giải quyết một vấn đề bằng cách kết hợp các bộ dữ liệu phức tạp? Cho chúng tôi biết trong các ý kiến dưới đây!Xem bây giờ hướng dẫn này có một khóa học video liên quan được tạo bởi nhóm Python thực sự. Xem cùng với hướng dẫn bằng văn bản để hiểu sâu hơn về sự hiểu biết của bạn: kết hợp dữ liệu trong gấu trúc với concat () và merge () Làm thế nào để bạn hợp nhất các hàng trong Python? Để hợp nhất các hàng trong một nhóm với nhau trong gấu trúc, chúng ta có thể sử dụng phương thức Agg (~) cùng với phương thức tham gia (~) để kết hợp các giá trị hàng.many-to-one and many-to-many joins with 0. In a many-to-one join, one of your datasets will have many rows in the merge column that repeat the same values. For example, the values could be 1, 1, 3, 5, and 5. At the same
time, the merge column in the other dataset won’t have repeated values. Take 1, 3, and 5 as an example.Làm cách nào để hợp nhất hai hàng trong Pandas Python? Hợp nhất () để kết hợp dữ liệu trên các cột hoặc chỉ số chung. . tham gia () để kết hợp dữ liệu trên cột khóa hoặc chỉ mục. Concat () để kết hợp các khung dữ liệu trên các hàng hoặc cột. Điều làm cho 0 rất linh hoạt là số lượng tùy chọn tuyệt đối để xác định hành vi hợp nhất của bạn. Mặc dù danh sách có vẻ khó khăn, nhưng với thực tế, bạn sẽ có thể hợp nhất các bộ dữ liệu thuộc mọi loại.Khi bạn sử dụng 0, bạn sẽ cung cấp hai đối số bắt buộc:
Sau đó, bạn có thể cung cấp một số đối số tùy chọn để xác định cách các bộ dữ liệu của bạn được hợp nhất:
Đây là một số thông số quan trọng nhất để chuyển sang 0. Để biết danh sách đầy đủ, xem tài liệu Pandas.Cách sử dụng PC Rating CY Rating PY HT MV1 MV2 0 DE101 NaN AA GV 0 20 0 DE101 AA+ NaN GV 10 0 0Trước khi đi sâu vào các chi tiết về cách sử dụng 0, trước tiên bạn nên hiểu các hình thức tham gia khác nhau:
Bạn có thể tìm hiểu về các kết nối khác nhau này một cách chi tiết dưới đây, nhưng trước tiên hãy xem đại diện trực quan này của họ: Đại diện trực quan của các loại tham giaTrong hình ảnh này, hai vòng tròn là hai bộ dữ liệu của bạn và các nhãn chỉ vào phần hoặc phần của bộ dữ liệu bạn có thể mong đợi. Mặc dù sơ đồ này không bao gồm tất cả các sắc thái, nhưng nó có thể là một hướng dẫn tiện dụng cho người học trực quan. Nếu bạn có nền SQL, thì bạn có thể nhận ra tên hoạt động hợp nhất từ cú pháp 3. Ngoại trừ 9, tất cả các kỹ thuật này là các loại tham gia bên ngoài. Với các kết nối bên ngoài, bạn sẽ hợp nhất dữ liệu của mình dựa trên tất cả các khóa trong đối tượng bên trái, đối tượng bên phải hoặc cả hai. Đối với các khóa chỉ tồn tại trong một đối tượng, các cột chưa từng có trong đối tượng khác sẽ được điền vào 5, viết tắt của không phải là một số.outer joins. With outer joins, you’ll merge your data based on all the keys in the left object, the right object, or both.
For keys that only exist in one object, unmatched columns in the other object will be filled in with 5, which stands for Not a Number.Bạn cũng có thể thấy một lời giải thích trực quan về các liên kết khác nhau trong bối cảnh SQL về kinh dị mã hóa. Bây giờ hãy xem các tham gia khác nhau trong hành động. Ví dụNhiều hướng dẫn của gấu trúc cung cấp các khung dữ liệu rất đơn giản để minh họa các khái niệm mà họ đang cố gắng giải thích. Cách tiếp cận này có thể gây nhầm lẫn vì bạn có thể liên hệ dữ liệu với bất cứ điều gì cụ thể. Vì vậy, đối với hướng dẫn này, bạn sẽ sử dụng hai bộ dữ liệu trong thế giới thực làm các khung dữ liệu được hợp nhất:
Bạn có thể khám phá các bộ dữ liệu này và theo dõi cùng với các ví dụ bên dưới bằng cách sử dụng máy tính xách tay Jupyter tương tác và dữ liệu khí hậu CSVS: Nếu bạn muốn tìm hiểu cách sử dụng máy tính xách tay Jupyter, thì hãy xem Jupyter Notebook: Giới thiệu. Hai bộ dữ liệu này là từ Cơ quan Khí quyển và Đại dương Quốc gia (NOAA) và được lấy từ kho lưu trữ dữ liệu công cộng NOAA. Đầu tiên, tải các bộ dữ liệu vào các khung dữ liệu riêng biệt: >>>
Trong mã trên, bạn đã sử dụng gấu trúc 6 để tải các tệp CSV nguồn của bạn vào các đối tượng 9 một cách thuận tiện. Sau đó, bạn có thể nhìn vào các tiêu đề và một vài hàng đầu tiên của các khung dữ liệu được tải với 8:>>>
Trong mã trên, bạn đã sử dụng gấu trúc 6 để tải các tệp CSV nguồn của bạn vào các đối tượng 9 một cách thuận tiện. Sau đó, bạn có thể nhìn vào các tiêu đề và một vài hàng đầu tiên của các khung dữ liệu được tải với 8:Tại đây, bạn đã sử dụng 8 để có được năm hàng đầu tiên của mỗi DataFrame. Đảm bảo tự mình thử điều này, với máy tính xách tay Jupyter tương tác hoặc trong bảng điều khiển của bạn, để bạn có thể khám phá dữ liệu ở độ sâu lớn hơn.>>>
Trong mã trên, bạn đã sử dụng gấu trúc 6 để tải các tệp CSV nguồn của bạn vào các đối tượng 9 một cách thuận tiện. Sau đó, bạn có thể nhìn vào các tiêu đề và một vài hàng đầu tiên của các khung dữ liệu được tải với 8:Tại đây, bạn đã sử dụng >>> climate_temp.head()
STATION STATION_NAME ... DLY-HTDD-BASE60 DLY-HTDD-NORMAL
0 GHCND:USC00049099 TWENTYNINE PALMS CA US ... 10 15
1 GHCND:USC00049099 TWENTYNINE PALMS CA US ... 10 15
2 GHCND:USC00049099 TWENTYNINE PALMS CA US ... 10 15
3 GHCND:USC00049099 TWENTYNINE PALMS CA US ... 10 15
4 GHCND:USC00049099 TWENTYNINE PALMS CA US ... 10 15
>>> climate_precip.head()
STATION ... DLY-SNOW-PCTALL-GE050TI
0 GHCND:USC00049099 ... -9999
1 GHCND:USC00049099 ... -9999
2 GHCND:USC00049099 ... -9999
3 GHCND:USC00049099 ... 0
4 GHCND:USC00049099 ... 0
|