Hãy quên các thuật toán “Nguồn mở” đi - Thay vào đó hãy tập trung vào các thử nghiệm Thông minh dữ liệu PlatoBlockchain. Tìm kiếm dọc. Ái.

Hãy quên các thuật toán “Nguồn mở” - Thay vào đó hãy tập trung vào các thử nghiệm

Vào năm 2016, tôi đã lãnh đạo một nhóm nhỏ tại Instagram đã thiết kế và xây dựng một trong những thử nghiệm phân phối nội dung lớn nhất trong lịch sử: giới thiệu thuật toán xếp hạng được cá nhân hóa cho 500 triệu người dùng của nền tảng (khi đó). Dự đoán trước những tranh cãi, chúng tôi đã dành vài năm tiếp theo để đo lường một cách khoa học sự khác biệt giữa những người nhận được “thuật toán đề xuất” đang phát triển này (như đôi khi nó được gọi) và một nhóm nhỏ được chọn ngẫu nhiên nhận nguồn cấp dữ liệu theo trình tự thời gian đảo ngược được sử dụng kể từ khi Instagram ra đời. 

Những khác biệt đó cho thấy trải nghiệm được cải thiện vượt bậc với thuật toán mới cho mọi khía cạnh của ứng dụng.

Mặc dù tôi vẫn tự tin rằng xếp hạng theo thuật toán là lựa chọn tốt nhất cho các nền tảng truyền thông xã hội nhưng nó không phải là không có nhược điểm. Có thể kể tên một vài ví dụ: tăng cường kiểm soát nền tảng đối với việc phân phối nội dung, tiêu chí vận hành không rõ ràng, rủi ro quảng bá nội dung có hại và sự thất vọng chung của người dùng. Những nhược điểm đó gần đây đã khiến chủ sở hữu tương lai tiềm năng của Twitter, Elon Musk, kêu gọi “mở nguồn thuật toán”.

Với tư cách là một kỹ sư, ý tưởng này nghe có vẻ quá đơn giản vì nguồn mở của mô hình học máy cho chúng ta biết rất ít về tác động của nó. Nhưng lời kêu gọi về sự minh bạch là có giá trị và nó có thể bắt đầu bằng việc tiết lộ các thử nghiệm tương tự như thử nghiệm mà tôi đã hướng dẫn tại Instagram. Tôi cho rằng tính minh bạch hữu ích nằm ở thử nghiệm nguồn mở hơn là thuật toán. 

Tôi không đề xuất nên làm gì với thông tin đến từ thử nghiệm nguồn mở; đúng hơn, bài viết này là điểm khởi đầu để suy nghĩ về tính minh bạch trong bối cảnh các hệ thống xếp hạng hiện đại. Trong đó, tôi thảo luận về lý do tại sao thử nghiệm vừa cần thiết trong xếp hạng thuật toán vừa là sự tập trung tốt hơn vào các nỗ lực trong tương lai nhằm làm sáng tỏ việc phân phối nội dung trên mạng xã hội. 

Các thuật toán hiện đại ưu tiên nội dung “thú vị nhất”

Hầu hết các nền tảng xã hội đều có nhiều nội dung hơn mức mà bất kỳ ai cũng có thể tiêu thụ một cách hợp lý.

Instagram ra mắt vào năm 2010 với nguồn cấp dữ liệu theo trình tự thời gian đảo ngược, hiển thị nội dung “được kết nối” mới nhất (nghĩa là nội dung từ những người bạn chọn theo dõi) ở đầu nguồn cấp dữ liệu của người dùng. Sau sáu năm, người dùng trung bình chỉ nhìn thấy 30% nội dung được kết nối của họ. Khoảng chú ý là cố định nên chúng tôi cho rằng lượng này đại diện cho giới hạn tự nhiên của những gì một người bình thường muốn tiêu thụ. Mục đích của việc giới thiệu thuật toán xếp hạng là làm cho 30% nội dung đó trở thành nội dung thú vị nhất thay vì nội dung mới nhất. Các nền tảng khác như TikTok, YouTube và Twitter có tỷ lệ riêng (tức là họ cung cấp lượng nội dung khác nhau), nhưng cách tiếp cận để chọn nội dung thú vị nhất trong khoảng thời gian chú ý cố định là giống nhau.

Việc lựa chọn chính xác cách thuật toán xếp hạng phân phối nội dung sẽ quyết định ý nghĩa của từ “thú vị nhất”. Một lựa chọn là làm cho mọi thứ không được cá nhân hóa — tất cả những người đủ điều kiện xem cùng một bộ nội dung sẽ thấy nội dung đó theo cùng một thứ tự. Các thuật toán được xây dựng để hiển thị nội dung được yêu thích nhất trước tiên hoặc chọn những bức ảnh đẹp nhất hoặc thậm chí làm nổi bật “lựa chọn của biên tập viên” đều thuộc danh mục đó. Nhưng bản thân hương vị đã mang tính cá nhân hóa cao; Tuy nhiên, hai người dùng khác nhau theo dõi cùng một người sẽ thích nội dung khác nhau. Xếp hạng không được cá nhân hóa không thể nắm bắt được “thú vị nhất” ở quy mô hàng tỷ. 

Ngược lại, các thuật toán xếp hạng hiện đại được cá nhân hóa: Thuật toán đưa ra các lựa chọn nội dung khác nhau tùy thuộc vào người duyệt. Không thể đọc được suy nghĩ của người dùng và biết sở thích chính xác của họ, nhưng mô hình học máy có thể dựa trên hành vi trong quá khứ để dự đoán câu trả lời cho những câu hỏi như “Nếu bạn xem nội dung này, có khả năng bạn sẽ thích nó không, hãy bình luận về nó, chia sẻ nó, xem nó, bỏ qua nó hay báo cáo nó?”

Xếp hạng thuật toán kết hợp những dự đoán này với logic kinh doanh sâu rộng (ví dụ: đa dạng hóa nội dung, thiên vị chống lại nội dung thù địch, quảng bá nội dung từ các tài khoản ít được biết đến hơn) để tạo cơ sở xác định nội dung thú vị nhất cho một người dùng nhất định. 

Tại sao “nguồn mở” thuật toán không hoạt động

Đây là sự hiểu biết của tôi về điều mà những người kêu gọi thuật toán nguồn mở hình dung: Nếu chúng tôi xuất bản mã nguồn nội bộ và trọng số của các mô hình học máy liên quan đến xếp hạng thì các kỹ sư, nhà phân tích và những người khác sẽ có thể hiểu tại sao một số nội dung nhất định được quảng bá hoặc bị giáng chức. Sự thật là ngay cả sự minh bạch hoàn toàn về các mô hình vẫn cho chúng ta biết rất ít về tác động của chúng.

Dự đoán từ các mô hình học máy khác nhau tùy theo người dùng, nội dung và hoàn cảnh. Những biến thể đó được chia thành các “tính năng” mà mô hình học máy có thể sử dụng để đưa ra dự đoán. Ví dụ về các tính năng bao gồm: nội dung gần đây mà người dùng đã xem, số lượng bạn bè của người dùng thích nội dung nào đó, tần suất người dùng tương tác với một người nhất định trong quá khứ và mức độ tương tác trên mỗi lượt xem của những người trong thành phố của người dùng.

Phép tính đằng sau “hàng tốt” - không phải chi tiết vi mô của thuật toán xếp hạng cụ thể - xác định xem thử nghiệm có thành công hay không.

Các mô hình xếp hạng thuật toán hiện đại có tính đến hàng triệu của các tính năng này để đưa ra từng dự đoán. Một số mô hình phụ thuộc vào nhiều mô hình con để hỗ trợ chúng; một số sẽ được đào tạo lại theo thời gian thực để thích ứng với hành vi thay đổi. Những thuật toán này rất phức tạp để hiểu, ngay cả đối với các kỹ sư làm việc với chúng.

Quy mô và độ phức tạp của những mô hình này khiến người ta không thể hiểu hết cách chúng đưa ra dự đoán. Chúng có hàng tỷ trọng lượng tương tác theo những cách tinh tế để đưa ra dự đoán cuối cùng; nhìn chúng giống như hy vọng hiểu được tâm lý học bằng cách kiểm tra từng tế bào não. Ngay cả trong môi trường học thuật với những mô hình vững chắc, khoa học về có thể giải thích các mô hình vẫn còn non trẻ. Một số phương pháp hiện có để giúp hiểu chúng liên quan đến các bộ dữ liệu nhạy cảm về quyền riêng tư được sử dụng trong quá trình đào tạo. Các mô hình xếp hạng thuật toán tìm nguồn mở sẽ không thay đổi điều đó.

Khi nào một thử nghiệm gây ra thay đổi về “lợi ích ròng”?

Những kỹ sư như tôi đo lường khả năng dự đoán. Thay vì tìm cách hiểu hoạt động bên trong của các thuật toán, chúng tôi thử nghiệm và quan sát tác động của chúng. Các nhóm xếp hạng (thường là sự kết hợp của các nhà khoa học dữ liệu, kỹ sư, quản lý sản phẩm và nhà nghiên cứu) có thể có hàng nghìn thử nghiệm đồng thời (thử nghiệm A/B), mỗi thử nghiệm cho các nhóm người tiếp xúc với các biến thể của thuật toán xếp hạng và mô hình học máy.

Câu hỏi lớn nhất thúc đẩy thử nghiệm là liệu một thay đổi có phải - sử dụng thuật ngữ mà tôi nghĩ ra - “lợi ích ròng” cho hệ sinh thái hay không. Trong quá trình giới thiệu xếp hạng thuật toán cho người dùng Instagram, chúng tôi đã quan sát thấy những cải tiến đáng kể về tương tác sản phẩm và những thay đổi không đáng kể về chất lượng trải nghiệm được báo cáo. Sau khi một nhóm quyết định rằng một thử nghiệm gây ra thay đổi có lợi như chúng tôi đã làm, thử nghiệm đó sẽ trở thành trải nghiệm người dùng mặc định của nền tảng và thay đổi một cách tinh tế nội dung mà hàng trăm triệu người nhìn thấy mỗi ngày.

Việc xác định lợi ích ròng đòi hỏi phải phân tích tác động của các thử nghiệm thông qua số liệu thống kê tóm tắt về sự thay đổi hành vi của người dùng và phân phối nội dung (tức là loại nội dung nào được thăng hạng và bị hạ cấp). Ví dụ: một nhóm có thể xem tần suất người dùng kiểm tra một ứng dụng hoặc nội dung "thích", lượng thời gian họ dành cho ứng dụng mỗi ngày hoặc mỗi phiên, tần suất ai đó nói rằng họ có trải nghiệm "5 trên 5", liệu những người sáng tạo “nhỏ” có được ưa chuộng hơn những người sáng tạo “lớn” hay không, mức độ phổ biến của nội dung “chính trị”, v.v. Số liệu thống kê tóm tắt được tạo ra bằng cách xử lý số lượng lớn hành động của từng người dùng — bạn thuộc nhóm thử nghiệm, bạn đăng nhập lúc 3 giờ chiều, bạn xem video của người bạn thân nhất và sau đó thích nó, bạn bỏ lỡ một bài đăng khác của một người nổi tiếng, v.v.. và dễ dàng đếm đến hàng nghìn. Các nhóm tìm kiếm những thay đổi có ý nghĩa thống kê trong các số liệu thống kê đó giữa nhóm thử nghiệm và nhóm đối chứng.

Nói “tất cả dữ liệu đều là nguồn mở” là chưa đủ - đó là một cơn ác mộng về sự đổi mới và quyền riêng tư. Nhưng có thể tiết lộ một cách an toàn nhiều hơn những gì các công ty làm ngày nay.

Bất kỳ nhóm xếp hạng thuật toán nào hoạt động tốt đều có phương pháp để quyết định xem một thay đổi có tốt hay không so với đường cơ sở đã thiết lập. Phương pháp luận có thể được hệ thống hóa: Bất cứ điều gì làm tăng số lượng người dùng hoạt động đều tốt. Hoặc nó có thể dựa trên phán đoán: Nếu người X đăng xuất sau khi xem số liệu thống kê tóm tắt thì điều đó thật tốt. Hoặc nó có thể là đối nghịch: Nếu không có đội nào tìm ra được vấn đề thì điều đó thật tốt. Trong thực tế, nó có thể là sự kết hợp của mọi thứ. 

Phép tính đằng sau lợi ích ròng - không phải chi tiết vi mô của thuật toán xếp hạng cụ thể - xác định xem thử nghiệm có thành công hay không. Các thử nghiệm hướng dẫn sự thành công của các nhóm xếp hạng trong một công ty. Và sự thành công của các nhóm xếp hạng sẽ định hướng cách phân phối nội dung cho tất cả người dùng nền tảng.

Với lợi ích ròng là một định danh mạnh mẽ như vậy, việc kêu gọi nguồn mở trong các thử nghiệm là hợp lý.

Nguồn mở có ý nghĩa gì đối với các thử nghiệm

Vấn đề với hệ thống hiện tại của chúng tôi là những người thực hiện thí nghiệm là những người duy nhất có thể nghiên cứu chúng. Mặc dù có những lý do chính đáng cho việc này, nhưng những người thực hiện thay đổi xếp hạng không nhất thiết được khuyến khích tìm ra một số loại vấn đề nhất định theo cách mà cộng đồng rộng lớn hơn có thể làm. (Thật vậy, đây là điều mà phong trào nguồn mở trong lĩnh vực phần mềm đã làm tốt từ trước đến nay - tức là dựa vào cộng đồng kỹ sư để phát hiện vấn đề và đóng góp cải tiến, bên cạnh các nhà phát triển cốt lõi làm việc trong dự án.) Bằng cách cung cấp cho cộng đồng. với sự minh bạch hơn về các thử nghiệm, các nhóm phụ trách chúng có thể thiết lập các phương pháp thực hành tốt nhất để đưa ra quyết định và tiết lộ những tác động từ các thử nghiệm ngoài những gì nhóm đang nghiên cứu. 

Khi mở các thử nghiệm tìm nguồn cung ứng, chúng ta cần cân bằng hai lợi ích cạnh tranh nhau: giữ đủ thông tin độc quyền để cho phép các công ty đổi mới trong khi tiết lộ đủ để cho phép bên ngoài hiểu biết. Nói “tất cả dữ liệu nguồn mở” là chưa đủ - đó là cơn ác mộng về sự đổi mới và quyền riêng tư. Nhưng có thể tiết lộ một cách an toàn nhiều hơn những gì các công ty làm ngày nay. Việc tiết lộ có thể diễn ra theo hai cách:

  1. Phương pháp nguồn mở: Là gì ý định về sự thay đổi thứ hạng? Những mục tiêu và quyết định nào của nhóm có thể được tiết lộ một cách an toàn mà không gây tổn hại đến sự đổi mới của công ty?
  2. Thử nghiệm nguồn mở: Là gì hậu quả về sự thay đổi thứ hạng? Thông tin nào có thể được chia sẻ để cho phép các bên thứ ba, chẳng hạn như cơ quan kiểm toán, kiểm tra tác động của các thử nghiệm xếp hạng mà không ảnh hưởng đến quyền riêng tư của người dùng? 

Bản thân việc tiết lộ không giải quyết được các vấn đề lớn hơn về khuyến khích trong xếp hạng thuật toán. Nhưng nó mang lại cho cộng đồng rộng lớn hơn một cơ sở đầy đủ thông tin để suy nghĩ về chúng, đồng thời nó tập trung nghiên cứu và chú ý vào nơi nó có thể có tác động nhiều nhất.

Phương pháp nguồn mở

Điều quan trọng cần nhớ là quyết định quan trọng trong xếp hạng thuật toán là yếu tố tạo nên sự thay đổi mang lại lợi ích ròng. Việc khuyến khích phương pháp nguồn mở cho phép hiểu rõ hơn về cách đưa ra các quyết định như vậy và cách các nền tảng đánh giá hệ sinh thái nội dung của họ. Dữ liệu liên quan sẽ được tóm tắt, điều này loại trừ những lo ngại về việc vi phạm quyền riêng tư cá nhân. Khi đó, rủi ro của việc tiết lộ chủ yếu là về lợi thế cạnh tranh và các tác nhân xấu như trang web spam và những kẻ tấn công phối hợp. Để bắt đầu, đây là ba loại thông tin có thể không có rủi ro cho một nền tảng để chia sẻ:

  • Quy trình chung để quyết định xem biến thể xếp hạng mới có phải là một thay đổi tốt hay không.
  • Ai, nếu có, có quyền ra quyết định đối với những thay đổi thuật toán rộng hơn.
  • Giải thích về số liệu thống kê tóm tắt có sẵn trong việc ra quyết định và được đánh giá trong các thí nghiệm.

Một tiết lộ giả định liên quan đến thông tin đó có thể trông như thế này: Mỗi năm, nhóm điều hành của nền tảng đặt ra các mục tiêu cho các biện pháp tương tác, cộng với các mục tiêu phụ liên quan đến chất lượng nội dung. Các nhóm xếp hạng chịu trách nhiệm đạt được mục tiêu được phép thực hiện tới 1,000 thử nghiệm mỗi năm, mỗi thử nghiệm có sự tham gia của hàng triệu người dùng. Người quản lý sản phẩm phải xem xét các thử nghiệm trước khi chúng bắt đầu và họp mỗi tuần một lần với các nhóm xếp hạng có trách nhiệm để xem xét tác động đang diễn ra đối với các mục tiêu chính và phụ, trong số bất kỳ tác động nào khác nổi lên có ý nghĩa thống kê, chẳng hạn như nội dung chuyển sang tài khoản lớn hơn hoặc sự phổ biến của nội dung được gắn thẻ chính trị. Sau đó, quyết định cuối cùng về việc có thực hiện thử nghiệm hay không sẽ thuộc về đội ngũ điều hành. Các nhóm xếp hạng đo lường sự đóng góp tổng thể của các bản cập nhật thuật toán bằng cách có một thử nghiệm “kiềm chế” tất cả các thay đổi trong năm.

Câu hỏi thiết yếu về tính minh bạch của thử nghiệm là: Làm cách nào chúng tôi có thể chia sẻ dữ liệu thử nghiệm rộng rãi hơn mà không phải hy sinh quyền riêng tư?

Kiểu tiết lộ đó giúp chúng tôi hiểu làm thế nào các quyết định được đưa ra tại một công ty và có thể được ghi lại trong các trung tâm minh bạch của nền tảng và báo cáo hàng năm. Những tiết lộ cụ thể hơn, cung cấp cái nhìn sâu sắc hữu ích hơn cho việc ra quyết định, cũng có nhiều khả năng có nguy cơ tiết lộ bí mật công ty hơn. Những loại tiết lộ này sẽ bao gồm nhiều hơn về ý định thống kê tóm tắt, chẳng hạn như:

  • Thống kê tóm tắt nào đáng mong muốn, thống kê nào không mong muốn và thống kê nào được sử dụng làm rào chắn bảo vệ (và không nên thay đổi).
  • Các công thức cụ thể được sử dụng để đánh giá liệu một quyết định có tốt hay không.
  • Danh sách tất cả các thí nghiệm với giả thuyết, ngày tháng và quyết định được đưa ra.

Liệu đây có phải là quá chi tiết việc tiết lộ là tùy thuộc vào còn tranh cãi và tùy vào hoàn cảnh cụ thể, mục tiêu của từng sản phẩm. Nhưng quay trở lại ví dụ về Twitter và vấn đề “thư rác” thường được thảo luận, đây là một tình huống giả định mô tả một tiết lộ hữu ích: Giả sử Twitter đã chạy 10 thử nghiệm nhắm mục tiêu giảm mức độ phổ biến của thư rác. Mỗi thử nghiệm nhằm mục đích đo lường xem liệu việc thay đổi yếu tố dự đoán “nhấp vào một tweet” có làm giảm số lượng người dùng nhìn thấy thư rác hay không. Trong những thử nghiệm đó, số lượng báo cáo spam giảm được coi là một kết quả đáng mong đợi, số lượng phản hồi giảm là điều không mong muốn và số lượng tin nhắn lại được sử dụng như một rào chắn bảo vệ và được kỳ vọng sẽ duy trì ổn định. Các thử nghiệm từ một đến năm sử dụng các mô hình lớn hơn, được đào tạo lại để dự đoán xem người dùng có “nhấp vào một tweet hay không”. Các thử nghiệm từ 10 đến 20 không thay đổi mô hình nhưng giảm trọng lượng dự đoán nhấp chuột trong xếp hạng cuối cùng. Mô hình xếp hạng sản xuất hiện tại được sử dụng làm nhóm kiểm soát. Tất cả các biến thể thử nghiệm bắt đầu vào ngày 5 tháng 10, có sự tham gia của các nhóm thử nghiệm với XNUMX triệu người dùng mỗi nhóm và chạy trong hai tuần. Thử nghiệm thứ bảy, với trọng lượng giảm vừa phải, đã được giám đốc sản phẩm phê duyệt vào ngày XNUMX tháng XNUMX và trở thành trải nghiệm cơ bản.

Một tiết lộ như vậy sẽ giúp người ngoài đánh giá xem Twitter có đang tích cực cố gắng giải quyết vấn đề thư rác và thực hiện điều đó bằng một cách tiếp cận hợp lý hay không. Tính minh bạch tạo ra nguy cơ kẻ xấu sử dụng thông tin để điều chỉnh chiến thuật, nhưng nó cũng khiến các nhóm xếp hạng có trách nhiệm hơn với người dùng của họ và truyền cảm hứng tin tưởng hơn vào cách trải nghiệm của người dùng diễn ra.

Thử nghiệm nguồn mở

Mặc dù phương pháp nguồn mở cung cấp cái nhìn sâu sắc về nhóm xếp hạng ý định, nó không cho phép các bên bên ngoài hiểu được hậu quả không lường của các quyết định xếp hạng. Vì điều đó, chúng ta nên kiểm tra nguồn mở của chính dữ liệu thử nghiệm.

Việc phân tích thử nghiệm yêu cầu quyền truy cập vào thông tin bí mật chỉ dành cho nhân viên, chẳng hạn như hành động của từng người dùng, ví dụ: “Người dùng A đã xem video này, xem trong 10 giây và sau đó thích video đó”. So sánh số liệu thống kê tóm tắt về thông tin này giữa các nhóm kiểm tra và kiểm soát cho phép công ty hiểu được những thay đổi thuật toán mà họ thực hiện. Câu hỏi thiết yếu về tính minh bạch của thử nghiệm là: Làm cách nào chúng tôi có thể chia sẻ dữ liệu thử nghiệm rộng rãi hơn mà không phải hy sinh quyền riêng tư?

Phiên bản minh bạch nhất của thử nghiệm nguồn mở đòi hỏi phải tiết lộ thông tin thô - hành động của mỗi người trong mọi thử nghiệm từng chạy. Cùng với đó, các bên bên ngoài có thể đưa ra kết luận khoa học, đúng đắn về hành vi của người dùng và sự thay đổi nội dung trên mạng xã hội. Nhưng điều này chỉ là một mục tiêu ngây thơ. Hành động của cá nhân người dùng rất nhạy cảm và tiết lộ cá nhân, và trong một số bối cảnh, họ thậm chí còn mạo hiểm tính mạng. Thay vào đó, chúng ta nên tập trung vào việc đạt được mức độ minh bạch không tiết lộ thông tin nhạy cảm hoặc vi phạm sự đồng ý nhưng vẫn tạo điều kiện cho các bên khác nghiên cứu kết quả thí nghiệm một cách khoa học.

  • Giới hạn khán giả: Chia sẻ dữ liệu thử nghiệm thô cho một nhóm đáng tin cậy nhỏ hơn bên ngoài công ty, chẳng hạn như nhóm kiểm toán viên thuật toán bên thứ ba có thể bị ràng buộc bởi các quy định chuyên môn.
  • Tiết lộ cá nhân: Cho phép người dùng xem mọi thử nghiệm mà họ đã tiếp xúc.
  • Chọn tham gia cá nhân: Giảm thiểu một số lo ngại về quyền riêng tư bằng cách cho phép các cá nhân chọn tiết lộ hành động của mình cho các nhóm cụ thể, chẳng hạn như bằng cách cho phép chọn tham gia các nghiên cứu học thuật được giám sát thông qua các cơ chế trong ứng dụng. 
  • Tóm tắt: Xuất bản thông tin ít nhạy cảm hơn bằng cách gộp dữ liệu thử nghiệm vào các nhóm thuần tập (ví dụ: tiết lộ những thay đổi trong việc phân phối nội dung tới các tài khoản lớn hơn, video, quốc gia cụ thể, v.v.). 

Những cách tiếp cận này đều cung cấp công cụ phân tích cho những người không làm việc trên nền tảng xã hội và do đó không bị ràng buộc bởi các ưu đãi của công ty. Nếu chúng ta xem lại thử nghiệm kéo dài nhiều năm mà tôi đã thực hiện để giới thiệu thuật toán xếp hạng của Instagram, thì việc có cái nhìn mới về nhóm thử nghiệm có thể mang lại những góc nhìn mới cho những lo ngại như liệu xếp hạng có gây ra bong bóng bộ lọc hay không, liệu việc giới thiệu xếp hạng có gây ra sự thay đổi đối với nhiều tài khoản chính trị hơn hay không, và liệu mọi người có đăng nhiều nội dung có hại hơn nhờ xếp hạng hay không. Không có quyền truy cập vào dữ liệu, tất cả chúng ta đều mắc kẹt với những lý luận sai lầm dựa trên các tiêu đề và giai thoại.

***

Bất chấp sự phổ biến của các mô hình xếp hạng thuật toán, hoạt động bên trong của chúng vẫn chưa được hiểu rõ - đó cũng không phải là vấn đề. Các công ty phân tích tác động của thuật toán bằng cách chạy thử nghiệm để quyết định xem những thay đổi mà chúng gây ra có tốt cho hệ sinh thái nội dung của họ hay không.

Ngày nay, các bên bên ngoài, bao gồm cả những người dùng sử dụng các sản phẩm này hàng ngày, không có cách nào đưa ra kết luận về lợi ích ròng vì dữ liệu thử nghiệm là riêng tư và phương pháp ra quyết định không được tiết lộ. Điều đó không nhất thiết phải như vậy: Có thể mở ra nhiều phương pháp ra quyết định hơn trong khi vẫn duy trì khả năng cạnh tranh cho các công ty. Thông tin về các thử nghiệm có thể được tiết lộ theo cách cho phép các bên bên ngoài đưa ra kết luận mà không ảnh hưởng đến quyền riêng tư.

Tính minh bạch bản thân nó là một thuộc tính, nhưng tính minh bạch có ý nghĩa mới là mục tiêu tốt hơn. Trong tương lai, hãy tập trung vào việc mở các thử nghiệm chứ không phải các thuật toán. 

Đăng ngày 24 tháng 2022 năm XNUMX

Công nghệ, sự đổi mới và tương lai, như những gì đã nói với những người xây dựng nó.

Cảm ơn bạn đã đăng ký.

Kiểm tra hộp thư đến của bạn để biết thông báo chào mừng.

Dấu thời gian:

Thêm từ Andreessen Horowitz