Tại Quốc hội Vương quốc Anh tuần này, Microsoft và Meta đã né tránh câu hỏi liệu người sáng tạo có nên được trả tiền khi tài liệu có bản quyền của họ được sử dụng để đào tạo các mô hình ngôn ngữ lớn hay không.
Những gã khổng lồ công nghệ, với tổng doanh thu vượt quá 200 tỷ USD, đang bị nướng bởi Ủy ban Truyền thông và Kỹ thuật số của Hạ viện khi vấn đề bản quyền được chú trọng.
Vào tháng 17, Hiệp hội Tác giả, một hiệp hội thương mại dành cho các nhà văn đã xuất bản và XNUMX tác giả đệ đơn kiện tập thể ở Hoa Kỳ về việc OpenAI sử dụng tài liệu của họ để tạo ra các dịch vụ dựa trên LLM.
Giám đốc điều hành OpenAI Sam Altman kể từ đó cho biết công ty sẽ chi trả các chi phí pháp lý cho khách hàng của mình đối với các vụ kiện vi phạm bản quyền thay vì xóa tài liệu khỏi bộ đào tạo của mình.
Microsoft đã vốn đầu tư 13 tỷ USD trong OpenAI. Nó có mối quan hệ hợp tác mở rộng với nhà phát triển máy học, hỗ trợ khối lượng công việc của mình trên nền tảng đám mây Azure và sử dụng các mô hình của mình để chạy trợ lý tự động Copilot.
Phát biểu với Lords ngày hôm qua, Owen Larter, giám đốc chính sách công tại Văn phòng AI có trách nhiệm của Microsoft, cho biết: “Điều quan trọng là phải đánh giá cao mô hình ngôn ngữ lớn là gì. Đó là một mô hình lớn được đào tạo về dữ liệu văn bản, tìm hiểu mối liên hệ giữa các ý tưởng khác nhau. Nó không nhất thiết phải hút bất cứ thứ gì từ bên dưới.”
Ông cho biết cần phải có một “khuôn khổ” để cung cấp một số biện pháp bảo vệ cho tài liệu có bản quyền và Microsoft sẽ chịu trách nhiệm về bất kỳ hành vi vi phạm nào của các hệ thống dựa trên LLM của mình. Nhưng ông cũng cho biết Microsoft hỗ trợ gần đây Báo cáo đường viền vào luật AI “ủng hộ đổi mới” ở Vương quốc Anh ủng hộ các ngoại lệ về văn bản và dữ liệu trong các mô hình đào tạo.
Nhưng Donald Michael, Lord Foster of Bath, đã ép Larter về việc liệu ông có chấp nhận rằng nếu một công ty sử dụng tài liệu có bản quyền để xây dựng LLM vì lợi nhuận thì chủ sở hữu bản quyền phải được hoàn trả.
Giám đốc Microsoft cho biết: “Điều thực sự quan trọng là phải hiểu rằng bạn cần huấn luyện các mô hình ngôn ngữ lớn này trên các tập dữ liệu lớn nếu bạn muốn chúng hoạt động hiệu quả, nếu bạn muốn cho phép chúng được an toàn và bảo mật… Ngoài ra còn có một số vấn đề về cạnh tranh [trong việc đảm bảo] rằng việc đào tạo các mô hình lớn có sẵn cho tất cả mọi người. Nếu bạn đi quá xa vào con đường rất khó lấy dữ liệu để đào tạo mô hình, thì đột nhiên, khả năng làm được điều đó sẽ chỉ dành riêng cho những công ty rất lớn.”
Vụ kiện tụng đang được tiến hành để giải quyết cách tập dữ liệu huấn luyện Sách1, Books2 và Books3, những tài liệu vi phạm bản quyền một cách hiệu quả, đã được sử dụng để giúp xây dựng các LLM phổ biến.
Meta đứng đằng sau Llama 2 LLM, có quy mô lên tới 70 tỷ tham số. Gã khổng lồ truyền thông xã hội đã quảng bá mô hình này dưới dạng nguồn mở, mặc dù những người theo chủ nghĩa thuần túy FOSS chỉ ra một số cảnh báo trong cách tiếp cận của nó.
Nói chuyện với Lords, Rob Sherman, phó chủ tịch kiêm phó giám đốc quyền riêng tư về chính sách tại Meta, cho biết công ty sẽ tuân thủ luật pháp.
Nhưng ông nói thêm rằng “việc duy trì quyền truy cập rộng rãi vào thông tin trên internet và thông tin bao gồm cả việc sử dụng trong đổi mới như thế này là khá quan trọng. Tôi ủng hộ việc trao cho chủ sở hữu quyền khả năng quản lý cách sử dụng thông tin của họ.
“Tôi hơi thận trọng về ý tưởng buộc các công ty đang xây dựng AI phải ký kết các thỏa thuận riêng với các chủ sở hữu quyền cá nhân hoặc yêu cầu thanh toán cho nội dung không có giá trị kinh tế đối với họ.”
Tuần trước, Dan Conway, Giám đốc điều hành Hiệp hội các nhà xuất bản Vương quốc Anh, nói với ủy ban rằng các mô hình ngôn ngữ lớn đang vi phạm nội dung có bản quyền trên “quy mô cực kỳ lớn”.
“Chúng tôi biết điều này trong ngành xuất bản vì cơ sở dữ liệu Books3 liệt kê 120,000 đầu sách lậu mà chúng tôi biết đã bị các mô hình ngôn ngữ lớn tiếp thu,” ông nói. “Chúng tôi biết rằng nội dung đang được tiếp thu trên quy mô cực kỳ lớn bởi các mô hình ngôn ngữ lớn. LLM vi phạm bản quyền ở nhiều phần của quy trình về thời điểm họ thu thập thông tin này, cách họ lưu trữ thông tin này và cách họ xử lý thông tin đó. Luật bản quyền đang bị vi phạm trên quy mô lớn.”
Tại phiên điều trần tương tự, Tiến sĩ Hayleigh Bosher, độc giả về luật sở hữu trí tuệ tại Đại học Brunel London, cho biết cô không đại diện cho các công ty công nghệ hoặc người sáng tạo nội dung và đưa ra quan điểm trung lập.
Cô nói: “Nguyên tắc khi nào bạn cần giấy phép và khi nào không thì rõ ràng, và việc sao chép một tác phẩm được bảo vệ bản quyền mà không được phép sẽ phải có giấy phép hoặc nếu không thì sẽ là vi phạm. Đó là những gì AI thực hiện ở các bước khác nhau của quy trình: Nhập, chạy chương trình và thậm chí có thể là đầu ra.
“Một số nhà phát triển công nghệ và AI đang tranh cãi về cách giải thích luật khác. Tôi không đại diện cho một trong hai bên đó. Tôi là một chuyên gia về bản quyền và từ vị trí của tôi, hiểu biết về những gì bản quyền phải đạt được và cách nó đạt được nó, bạn sẽ cần có giấy phép cho hoạt động đó.” ®
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- nguồn: https://go.theregister.com/feed/www.theregister.com/2023/11/15/house_of_lords_ai_copyright/
- : có
- :là
- :không phải
- :Ở đâu
- $ LÊN
- 000
- 120
- 17
- 7
- 70
- a
- có khả năng
- Giới thiệu
- hoàn toàn
- Chấp nhận
- truy cập
- Đạt được
- Đạt được
- hoạt động
- thêm
- địa chỉ
- những người ủng hộ
- thỏa thuận
- AI
- Tất cả
- cho phép
- Đã
- Ngoài ra
- Mặc dù
- an
- và
- bất kì
- bất cứ điều gì
- đánh giá cao
- phương pháp tiếp cận
- LÀ
- AS
- Trợ lý
- Hiệp hội
- các hiệp hội
- đảm đương
- At
- tác giả
- Tự động
- có sẵn
- Azure
- Đám mây Azure
- BE
- bởi vì
- được
- sau
- được
- bespoke
- giữa
- Tỷ
- Một chút
- cuốn sách
- rộng
- Bị phá vỡ
- xây dựng
- Xây dựng
- nhưng
- by
- đến
- dè dặt
- giám đốc điều hành
- chánh
- trong sáng
- khách hàng
- đám mây
- Nền tảng đám mây
- CO
- thu thập
- kết hợp
- ủy ban
- Truyền thông
- Các công ty
- công ty
- cạnh tranh
- tuân theo
- nội dung
- người tạo nội dung
- quyền tác giả
- vi phạm bản quyền
- Chi phí
- che
- tạo
- người sáng tạo
- dữ liệu
- bộ dữ liệu
- Cơ sở dữ liệu
- Phó
- Nhà phát triển
- phát triển
- ĐÃ LÀM
- khác nhau
- kỹ thuật số
- Giám đốc
- do
- làm
- doesn
- don
- donald
- xuống
- dr
- Kinh tế
- giá trị kinh tế
- hiệu quả
- hay
- đăng ký hạng mục thi
- Ngay cả
- mọi người
- dư thừa
- chuyên gia
- xa
- hãng
- Tập trung
- Trong
- buộc
- Foster
- Khung
- từ
- được
- khổng lồ
- đại gia
- Cho
- Go
- đi
- phường
- xử lý
- Cứng
- Có
- he
- nghe
- giúp đỡ
- người
- House
- NHÀ CHÚA
- Độ đáng tin của
- HTTPS
- i
- ý tưởng
- ý tưởng
- if
- quan trọng
- in
- Bao gồm
- hệ thống riêng biệt,
- ngành công nghiệp
- thông tin
- sự vi phạm
- sự đổi mới
- trí tuệ
- sở hữu trí tuệ
- Internet
- giải thích
- trong
- các vấn đề
- IT
- ITS
- jpg
- Biết
- Ngôn ngữ
- lớn
- Luật
- học tập
- Hợp pháp
- giấy phép
- Lượt thích
- Chức năng
- ít
- LLM
- London
- Lords
- máy
- học máy
- Duy trì
- làm cho
- Làm
- quản lý
- lớn
- vật liệu
- Phương tiện truyền thông
- Siêu dữ liệu
- Michael
- microsoft
- kiểu mẫu
- mô hình
- nhiều
- my
- nhất thiết
- Cần
- Neutral
- được
- of
- cung cấp
- Office
- Nhân viên văn phòng
- on
- có thể
- mở
- mã nguồn mở
- OpenAI
- or
- gọi món
- nếu không thì
- đầu ra
- kết thúc
- chủ sở hữu
- thanh toán
- thông số
- Quốc hội
- Công ty
- các bộ phận
- con đường
- Trả
- Thực hiện
- cho phép
- quan điểm
- cướp biển
- nền tảng
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- Điểm
- điều luật
- Phổ biến
- vị trí
- có khả năng
- Chạy
- Chủ tịch
- nguyên tắc
- riêng tư
- quá trình
- Lợi nhuận
- chương trình
- Promoted
- tài sản
- bảo vệ
- cho
- công khai
- công bố
- nhà xuất bản
- Xuất bản
- câu hỏi
- Câu hỏi
- khá
- hơn
- RE
- Người đọc
- có thật không
- gần đây
- tẩy
- đại diện
- sinh sản
- yêu cầu
- trách nhiệm
- chịu trách nhiệm
- doanh thu
- quyền
- cướp
- quy tắc
- chạy
- chạy
- s
- an toàn
- Nói
- Sam
- Sam Altman
- tương tự
- Quy mô
- quy mô
- an toàn
- Tháng Chín
- DỊCH VỤ
- bộ
- chị ấy
- Sherman
- nên
- Sides
- kể từ khi
- So
- Mạng xã hội
- truyền thông xã hội
- một số
- nguồn
- Các bước
- hàng
- đột ngột
- hỗ trợ
- Hỗ trợ
- phải
- chắc chắn
- hệ thống
- công nghệ cao
- đại gia công nghệ
- về
- văn bản
- hơn
- việc này
- Sản phẩm
- luật
- Anh
- cung cấp their dịch
- Them
- sau đó
- Đó
- Kia là
- họ
- điều này
- tuần này
- những
- người khổng lồ
- trò chơi
- đến
- nói với
- quá
- thương mại
- Train
- đào tạo
- Hội thảo
- Uk
- Dưới
- bên dưới
- hiểu
- sự hiểu biết
- trường đại học
- us
- sử dụng
- đã sử dụng
- sử dụng
- sử dụng
- giá trị
- rất
- phó
- Phó Chủ Tịch
- we
- tuần
- TỐT
- là
- Điều gì
- khi nào
- liệu
- cái nào
- sẽ
- với
- không có
- Công việc
- sẽ
- nhà văn
- hôm qua
- Bạn
- zephyrnet