#Sựkiệnngàyhômnhay
Trong Pandas, có 4 hàm để so sánh các khung dữ liệu theo từng phần tử. Đó là hàm combine, combine_first, update và where. Trong đó, hàm combine sẽ kết hợp giữa 2 khung dữ liệu và thực hiện so sánh từng phần tử dựa trên hàm đã cho.
Ví dụ, chúng ta có thể chọn giá trị lớn nhất trong số hai giá trị cho mỗi vị trí bằng cách sử dụng np.maximum. Nếu một trong các giá trị là NaN (tức là thiếu giá trị), DataFrame kết hợp tại vị trí này có NaN, vì Pandas không thể so sánh một giá trị với một giá trị bị thiếu.
Để giải quyết vấn đề này, chúng ta có thể chọn một giá trị không đổi để sử dụng trong trường hợp thiếu giá trị bằng cách sử dụng tham số fill_value. Các giá trị bị thiếu sẽ được lấp đầy bằng giá trị này trước khi so sánh chúng với các giá trị trong DataFrame khác.
Đây là một trong các hàm rất hữu ích trong Pandas cho việc so sánh các khung dữ liệu. #Pandas #DataFrame #SoSánhPhầnTử #Combine #FillValue
bản tin
Sed ut perspiciatis unde.
1. kết hợp
Các combine
hàm thực hiện so sánh từng phần tử dựa trên hàm đã cho.
Chẳng hạn, chúng ta có thể chọn giá trị lớn nhất trong số hai giá trị cho mỗi vị trí. Sẽ rõ ràng hơn khi chúng ta làm ví dụ.
combined_df = df1.combine(df2, np.maximum)
Hãy xem giá trị ở hàng đầu tiên và cột đầu tiên. DataFrame kết hợp có số lớn hơn là 5 và 2.
Nếu một trong các giá trị là NaN
(tức là thiếu giá trị), DataFrame kết hợp tại vị trí này có NaN
cũng như vì Pandas không thể so sánh một giá trị với một giá trị bị thiếu.
Chúng ta có thể chọn một giá trị không đổi để sử dụng trong trường hợp thiếu giá trị bằng cách sử dụng fill_value
tham số. Các giá trị bị thiếu được lấp đầy bằng giá trị này trước khi so sánh chúng với các giá trị trong DataFrame khác.
combined_df = df1.combine(df2, np.maximum, fill_value=0)
có hai NaN
các giá trị trong df1, được điền bằng 0 và sau đó được so sánh với các giá trị ở cùng vị trí của df2
.
[ad_2]