Các Hàm Pandas Hỗ Trợ So Sánh Khung Dữ Liệu Từng Phần Tử | Bài Viết của Soner Yıldırım

#Sựkiệnngàyhômnhay

Trong Pandas, có 4 hàm để so sánh các khung dữ liệu theo từng phần tử. Đó là hàm combine, combine_first, update và where. Trong đó, hàm combine sẽ kết hợp giữa 2 khung dữ liệu và thực hiện so sánh từng phần tử dựa trên hàm đã cho.

Ví dụ, chúng ta có thể chọn giá trị lớn nhất trong số hai giá trị cho mỗi vị trí bằng cách sử dụng np.maximum. Nếu một trong các giá trị là NaN (tức là thiếu giá trị), DataFrame kết hợp tại vị trí này có NaN, vì Pandas không thể so sánh một giá trị với một giá trị bị thiếu.

Để giải quyết vấn đề này, chúng ta có thể chọn một giá trị không đổi để sử dụng trong trường hợp thiếu giá trị bằng cách sử dụng tham số fill_value. Các giá trị bị thiếu sẽ được lấp đầy bằng giá trị này trước khi so sánh chúng với các giá trị trong DataFrame khác.

Đây là một trong các hàm rất hữu ích trong Pandas cho việc so sánh các khung dữ liệu. #Pandas #DataFrame #SoSánhPhầnTử #Combine #FillValue

Nguồn: https://techtoday.co/4-pandas-functions-for-element-wise-comparison-of-dataframes-by-soner-yildirim-jun-2023/

bản tin

Sed ut perspiciatis unde.

Đặt mua

1. kết hợp

Các combine hàm thực hiện so sánh từng phần tử dựa trên hàm đã cho.

Chẳng hạn, chúng ta có thể chọn giá trị lớn nhất trong số hai giá trị cho mỗi vị trí. Sẽ rõ ràng hơn khi chúng ta làm ví dụ.

combined_df = df1.combine(df2, np.maximum)

(hình ảnh của tác giả)

Hãy xem giá trị ở hàng đầu tiên và cột đầu tiên. DataFrame kết hợp có số lớn hơn là 5 và 2.

Nếu một trong các giá trị là NaN (tức là thiếu giá trị), DataFrame kết hợp tại vị trí này có NaN cũng như vì Pandas không thể so sánh một giá trị với một giá trị bị thiếu.

Chúng ta có thể chọn một giá trị không đổi để sử dụng trong trường hợp thiếu giá trị bằng cách sử dụng fill_value tham số. Các giá trị bị thiếu được lấp đầy bằng giá trị này trước khi so sánh chúng với các giá trị trong DataFrame khác.

combined_df = df1.combine(df2, np.maximum, fill_value=0)

(hình ảnh của tác giả)

có hai NaN các giá trị trong df1, được điền bằng 0 và sau đó được so sánh với các giá trị ở cùng vị trí của df2.

liên kết nguồn


[ad_2]

Leave a Reply

Your email address will not be published. Required fields are marked *