Reddit đã bắt đầu cuộc tấn công của mình đối với các công cụ tìm kiếm, được cho là đã chặn những công cụ mà không có mối quan hệ thương mại với công ty. Trong tháng Hai năm nay, Google đã đồng ý với một “liên kết mở rộng” trị giá 60 triệu đô la với trang web lớn kết hợp các yếu tố của mạng xã hội, tổng hợp tin tức và diễn đàn. Dữ liệu Reddit bây giờ có thể được sử dụng cho sự tiến bộ của mô hình AI của tập đoàn Alphabet, trong khi nội dung Reddit sẽ có vị trí đáng chú ý hơn trên Tìm kiếm Google, giúp dễ dàng tham gia vào các cuộc trò chuyện và cộng đồng trên trang web. Một trong những điều đáng chú ý nhất là giờ đây công ty công nghệ đa quốc gia của Mỹ đã có quyền truy cập vào Reddit Data API cung cấp nội dung thời gian thực.
Theo 404 Media, kết quả từ Reddit trên các nền tảng công cụ tìm kiếm khác bây giờ bị chặn khi công ty tiến công chống lại các công cụ thu thập dữ liệu web. Điều này ảnh hưởng đến các công cụ tìm kiếm như Bing, DuckDuckGo và Mojeek, với kết quả không hiển thị bất kỳ nội dung gần đây nào hoặc không hiển thị kết quả tìm kiếm đầy đủ. Người phát ngôn của Microsoft, Caitlin Roulston, cho biết, “Microsoft tôn trọng tiêu chuẩn robots.txt và chúng tôi tuân thủ hướng dẫn của các trang web không muốn nội dung trên trang web của họ được sử dụng với mô hình trí tuệ nhân tạo của chúng tôi,” thêm rằng công cụ tìm kiếm Bing đã ngừng quét Reddit khi nó cập nhật tệp robots.txt của mình vào ngày 1 tháng 7.
Đó là một động thái mạnh mẽ của Reddit khi hiệu quả chặn một số công cụ tìm kiếm lớn nhất trên web, nhưng đây có thể là một tín hiệu khác về hướng đi của công ty sau khi IPO vào đầu năm nay và mong muốn tìm cách mới để tăng doanh thu.
Tuy nhiên, một người phát ngôn của Reddit đã cung cấp một giải thích khác về tình hình. “Điều này hoàn toàn không liên quan đến đối tác gần đây của chúng tôi với Google,” Tim Rathschmidt tuyên bố trong một tuyên bố cho The Verge. “Chúng tôi đã thảo luận với nhiều công cụ tìm kiếm. Chúng tôi đã không thể đạt được thỏa thuận với tất cả họ, vì một số không thể hoặc không muốn thực hiện cam kết có thể áp dụng đối với việc sử dụng nội dung Reddit, bao gồm việc sử dụng cho AI.” Đã thông báo rằng kết quả trực tuyến là do thay đổi vào tệp robots.txt của Reddit, nhằm vào “tất cả các crawler” mà không đồng ý không sử dụng dữ liệu Reddit cho việc đào tạo AI, với công ty liệt kê Internet Archie và reddit4research là hai ví dụ về các crawler vẫn hoạt động. #Reddit #Google #BlockSearchEngines
Nguồn: https://readwrite.com/reddit-blocking-all-major-search-engines-except-google/
Reddit has commenced its assault on search engines, reportedly blocking those that don’t have a commercial relationship with the company.
Back in February this year, Google agreed to a $60 million “expanded partnership” with the mega-site which combines elements of social media, news aggregation, and messageboards. Reddit data can now be used for the advances of the Alphabet company’s AI models, while Reddit content will have a more prominent position on Google Search, making it easier to participate in the site’s conversations and communities.
One of the most notable aspects is that the US multinational tech leader now has access to the Reddit Data API which delivers real-time content.
As reported by 404 Media, Reddit results on other search engine platforms are now being blocked as the company goes on the offensive against web crawlers. That impacts the likes of Bing, DuckDuckGo, and Mojeek, with results either not showing any recent content, or not displaying the search result in full.
Microsoft spokesperson Caitlin Roulston stated, “Microsoft respects the robots.txt standard and we honor the directions provided by websites that do not want content on their pages to be used with our generative AI models,” adding that its Bing search engine stopped crawling Reddit when it updated its robots.txt file on July 1.
It’s a bold move for Reddit to effectively block some of the biggest search engines on the web, but it could be another pointer of its direction of travel since the IPO earlier this year and desire to find new ways to drive revenue.
Unable or unwilling to make enforceable promises
However, a Reddit spokesperson has provided a different explanation of the situation.
“This is not at all related to our recent partnership with Google,” stated Tim Rathschmidt in a statement to The Verge.
“We have been in discussions with multiple search engines. We have been unable to reach agreements with all of them, since some are unable or unwilling to make enforceable promises regarding their use of Reddit content, including their use for AI.”
It has been conveyed that the online results are due to changes to Reddit’s robots.txt file, aimed at “all crawlers” that do not agree to not utilize Reddit data for AI training, with the company listing Internet Archie and reddit4research as two examples of crawlers that still work.
Image credit: Via Ideogram
[ad_2]