Nghệ thuật không chết, nó chỉ là trí thông minh dữ liệu PlatoBlockchain do máy tạo ra. Tìm kiếm dọc. Ái.

Nghệ thuật không chết, nó chỉ do máy tạo ra

Tại sao các mô hình AI sẽ thay thế các nghệ sĩ từ rất lâu trước khi chúng thay thế các lập trình viên

Có lẽ hàm ý đáng kinh ngạc nhất mà chúng ta thấy từ AI sáng tạo là, trái ngược với quan điểm thông thường rằng sự sáng tạo sẽ là pháo đài cuối cùng của sự khéo léo của con người khi đối mặt với tự động hóa, nó thực sự có vẻ như là Dễ dàng hơn để tự động hóa các tác vụ sáng tạo khá khó hơn là tự động hóa các tác vụ lập trình tương đối đơn giản. Để hiểu được điều này, chúng tôi so sánh hai trong số các trường hợp sử dụng phổ biến hơn đối với AI tổng quát: tạo mã và tạo hình ảnh. Nhưng chúng tôi tin rằng tuyên bố này có giá trị chung hơn, ngay cả khi các mô hình tổng quát mở rộng sang các ứng dụng phức tạp hơn.

Phiên bản ngắn của lập luận (mà chúng tôi giải quyết chi tiết hơn bên dưới) là mặc dù một sản phẩm như Trợ lý GitHub, ở dạng hiện tại, có thể làm cho việc viết mã hiệu quả hơn phần nào, nhưng điều đó không làm giảm nhu cầu về các nhà phát triển phần mềm có năng lực với kiến ​​thức lập trình. Một lý do quan trọng là khi nói đến việc xây dựng một chương trình, tính chính xác thực sự quan trọng. Nếu AI tạo ra một chương trình, thì nó vẫn yêu cầu con người xác minh chương trình đó là chính xác — một nỗ lực ở mức độ gần giống như việc tạo ra nó lúc đầu.

Mặt khác, bất kỳ ai có thể gõ đều có thể sử dụng một mô hình như Khuếch tán ổn định để tạo ra những hình ảnh chất lượng cao, có một không hai trong vài phút, với nhiều đơn đặt hàng với chi phí thấp hơn. Các sản phẩm công việc sáng tạo thường không có các ràng buộc nghiêm ngặt về tính chính xác và kết quả đầu ra của các mô hình hoàn chỉnh một cách đáng kinh ngạc. Thật khó để không nhận thấy sự thay đổi toàn diện trong các ngành dựa vào hình ảnh sáng tạo bởi vì, đối với nhiều mục đích sử dụng, hình ảnh mà AI có thể tạo ra hiện nay đã là đủ và chúng ta vẫn đang ở giai đoạn đầu của công nghệ.

Chúng tôi hoàn toàn thừa nhận rằng thật khó để tin tưởng vào bất kỳ dự đoán nào với tốc độ mà lĩnh vực này đang chuyển động. Tuy nhiên, ngay bây giờ, có vẻ như chúng ta có nhiều khả năng thấy các ứng dụng chứa đầy hình ảnh sáng tạo được tạo bởi các lập trình viên hơn là các ứng dụng có nghệ thuật do con người thiết kế được xây dựng bởi các nhà sáng tạo. 

Tại sao sự cường điệu, và tại sao bây giờ?

Trước khi chúng ta đi vào chi tiết cụ thể của việc tạo mã so với tạo hình ảnh, sẽ rất hữu ích nếu hiểu được mức độ phổ biến của AI nói chung và AI tổng quát, cụ thể là tại thời điểm này.

AI sáng tạo đang được các nhà phát triển tiếp thu nhanh nhất mà chúng tôi từng thấy. Khi chúng tôi viết bài này, Stable Diffusion dễ dàng đứng đầu bảng xếp hạng xu hướng của kho lưu trữ GitHub với biên độ rộng. Tốc độ tăng trưởng của nó vượt xa bất kỳ công nghệ gần đây nào về cơ sở hạ tầng hoặc tiền điện tử (xem hình trên). Hầu như ngày nào cũng có thông báo khởi động và cấp vốn cho các công ty khởi nghiệp sử dụng công nghệ này và các mạng xã hội trực tuyến đang tràn ngập nội dung do các mô hình tổng quát tạo ra.

Mức đầu tư tổng thể vào AI trong thập kỷ qua cũng khó có thể phóng đại. Chúng tôi đã chứng kiến ​​sự gia tăng theo cấp số nhân của các ấn phẩm kể từ giữa những năm 2010 (xem hình bên dưới). Ngày nay, khoảng 20% ​​tất cả các bài viết được đăng trên arXiv là về AI, ML và NLP. Điều quan trọng là, các kết quả lý thuyết đã vượt qua ngưỡng quan trọng khi chúng trở nên dễ dàng sử dụng được và gây ra sự bùng nổ kỹ thuật, phần mềm và công ty khởi nghiệp mới ở kỷ Cambri. 

Nghệ thuật không chết, nó chỉ là trí thông minh dữ liệu PlatoBlockchain do máy tạo ra. Tìm kiếm dọc. Ái.

Mức tăng đột biến gần đây nhất trong hình trên phần lớn là do AI tổng hợp. Chỉ trong một thập kỷ, chúng ta đã chuyển từ các mô hình AI chỉ dành cho chuyên gia có thể phân loại hình ảnh và tạo từ nhúng sang các mô hình có thể sử dụng công khai, có thể viết mã hiệu quả và tạo hình ảnh chính xác đáng kể bằng lời nhắc ngôn ngữ tự nhiên. Không có gì ngạc nhiên khi tốc độ đổi mới chỉ tăng lên và không có gì ngạc nhiên khi các mô hình thế hệ mới bắt đầu xâm nhập vào các lĩnh vực khác từng do con người thống trị.

Trí tuệ nhân tạo và lập trình

Một trong những ứng dụng sớm nhất của AI tổng quát là hỗ trợ lập trình viên. Cách nó hoạt động là một mô hình được đào tạo trên một kho mã lớn (ví dụ: tất cả các kho lưu trữ công khai trong GitHub) và sau đó đưa ra đề xuất cho một lập trình viên khi họ viết mã. Kết quả thật xuất sắc. Nhiều đến mức hợp lý là cách tiếp cận này sẽ trở thành đồng nghĩa với việc lập trình trong tương lai.

Nghệ thuật không chết, nó chỉ là trí thông minh dữ liệu PlatoBlockchain do máy tạo ra. Tìm kiếm dọc. Ái.
Mã được tạo: bảo mật trước các cuộc tấn công không sử dụng dấu chấm phẩy.

Tuy nhiên, mức tăng năng suất còn khiêm tốn so với việc tạo hình ảnh mà chúng tôi đề cập bên dưới. Một phần lý do cho điều này, như đã đề cập ở trên, là tính chính xác rất quan trọng trong lập trình (và thực sự là các vấn đề kỹ thuật rộng hơn, nhưng chúng tôi tập trung vào lập trình trong bài đăng này). Ví dụ, một nghiên cứu gần đây được tìm thấy rằng đối với các kịch bản phù hợp với rủi ro cao CWEs (liệt kê điểm yếu chung), 40% mã do AI tạo ra chứa lỗ hổng.

Do đó, người dùng phải đạt được sự cân bằng giữa việc tạo đủ mã để tăng năng suất có ý nghĩa, trong khi vẫn hạn chế nó để có thể kiểm tra tính chính xác. Kết quả là, Copilot có đã giúp cải thiện năng suất của nhà phát triển — các nghiên cứu gần đây (tại đâytại đây) đặt mức tăng theo thứ tự gấp 2 lần hoặc ít hơn — nhưng ở mức ngang bằng với những gì chúng ta đã thấy trong những tiến bộ trước đây của ngôn ngữ và công cụ dành cho nhà phát triển. Ví dụ, việc chuyển từ lắp ráp sang C đã cải thiện năng suất gấp 2-5 lần theo một số ước tính.

Đối với các lập trình viên có kinh nghiệm hơn, mối quan tâm có thể vượt ra ngoài tính chính xác của mã và chất lượng mã tổng thể. Như nhanh.aicủa Jeremy Howard đã giải thích liên quan đến các phiên bản gần đây của mô hình OpenAI Codex, “[Tôi] không viết mã dài dòng vì nó đang tạo Trung bình cộng mã số. Đối với tôi, lấy mã trung bình và biến nó thành mã mà tôi thích và tôi biết là đúng sẽ chậm hơn nhiều so với việc chỉ viết nó từ đầu — ít nhất là bằng ngôn ngữ mà tôi biết rõ.”

Vì vậy, mặc dù rõ ràng lập trình tổng quát là một chức năng từng bước trong năng suất của nhà phát triển, nhưng không rõ sự cải tiến có khác biệt đáng kể so với những gì chúng ta đã thấy trước đây. Trí tuệ nhân tạo tạo ra các lập trình viên giỏi hơn, nhưng họ vẫn phải lập trình.

AI sáng tạo và hình ảnh

Mặt khác, tác động của các mô hình tổng quát đối với đầu ra của công việc sáng tạo, chẳng hạn như tạo hình ảnh, là cực kỳ nghiêm trọng. Nó đã dẫn đến nhiều đơn đặt hàng cải thiện đáng kể về hiệu quả và chi phí, và thật khó để không thấy nó mở ra một sự thay đổi giai đoạn trong toàn ngành.

Cách AI tổng quát hoạt động trong không gian này là lấy các đầu vào văn bản đơn giản từ người dùng, được gọi là lời nhắc, sau đó mô hình tạo ra đầu ra trực quan. Hiện tại, có các mô hình để tạo nhiều định dạng đầu ra, bao gồm hình ảnh, video, mô hình 3D và kết cấu.

Điều đặc biệt thú vị là làm thế nào các mô hình này có thể được mở rộng để tạo ra các hình ảnh mới hoặc theo miền cụ thể mà hầu như không có sự can thiệp sáng tạo nào. Ví dụ, Guido (một trong những tác giả) đã lấy một mô hình hình ảnh được đào tạo trước và đào tạo lại nó trên vài chục bức ảnh của chính mình. Từ đó, anh ấy đã có thể tạo ra những bức ảnh bằng cách sử dụng trong dấu nhắc. Dưới đây là những bức ảnh được tạo từ các lời nhắc sau: ” với tư cách là đội trưởng Mỹ"," ở Paris"," trong một bức tranh".

Nghệ thuật không chết, nó chỉ là trí thông minh dữ liệu PlatoBlockchain do máy tạo ra. Tìm kiếm dọc. Ái.
Trường hợp tạo hình ảnh là một sự khác biệt lớn so với tạo mã trong bối cảnh kinh doanh là mức độ mà AI tạo ra thay đổi tính toán kinh tế. Để tạo ra những bức ảnh trên, Guido đã đào tạo người mẫu trên một số bức ảnh có giá khoảng 50 đô la tài nguyên cơ sở hạ tầng. Sau khi được đào tạo, việc tạo hình ảnh có giá khoảng 0.001 đô la trong tài nguyên điện toán và có thể được thực hiện trên đám mây hoặc trên máy tính xách tay thế hệ mới nhất. Hơn nữa, việc tạo hình ảnh chỉ mất vài giây. 

Nếu không có AI sáng tạo, cách duy nhất để có được hình ảnh tùy chỉnh là thuê một nghệ sĩ hoặc tự làm. Ngay cả khi chúng ta bắt đầu với giả định rằng một người có thể tạo ra một hình ảnh chân thực, tùy chỉnh hoàn toàn trong vòng một giờ với giá 10 đô la, cách tiếp cận AI tổng quát dễ dàng rẻ hơn bốn bậc độ lớn và nhanh hơn một bậc độ lớn. Thực tế hơn, bất kỳ dự án thiết kế đồ họa hoặc tác phẩm nghệ thuật tùy chỉnh nào cũng có thể mất vài ngày hoặc vài tuần và sẽ tốn hàng trăm, nếu không muốn nói là hàng nghìn đô la. 

Tương tự như các công cụ hỗ trợ lập trình ở trên, AI tổng quát sẽ được thông qua như một công cụ bởi các nghệ sĩ và cả hai đều yêu cầu một số mức độ giám sát của người dùng. Nhưng thật khó để phóng đại sự khác biệt về mặt kinh tế được tạo ra bởi khả năng bắt chước toàn bộ sản phẩm của nghệ sĩ của một mô hình hình ảnh. Sử dụng mô hình tạo mã, viết ngay cả một chương trình chức năng rất cơ bản thực hiện tác vụ tính toán tiêu chuẩn cũng yêu cầu xem xét, chỉnh sửa và thêm các bài kiểm tra cho nhiều đoạn mã. Nhưng đối với một hình ảnh cơ bản, việc nhập lời nhắc và chọn một hình ảnh từ hàng tá gợi ý có thể được thực hiện trong vòng chưa đầy một phút.

Lấy ví dụ như họa sĩ truyện tranh (và đối tác đầu tư) của chúng tôi, Yoko Li (@stuffyokodraws). Chúng tôi đã đào tạo một người mẫu bằng cách sử dụng 70 hình ảnh trước đó của cô ấy và người mẫu này có thể tạo ra những hình ảnh có mức độ bắt chước kỳ lạ. Mọi nghệ sĩ phải tìm ra thứ cần tạo tiếp theo và cô ấy thậm chí còn nhận thấy rằng các người mẫu được đào tạo có thể đưa ra nhiều lựa chọn hơn những gì cô ấy nghĩ trong đầu - ít nhất là khi bị ép phải sản xuất thứ gì đó trong một khoảng thời gian nhất định. Có hàng trăm cách để vẽ cùng một đối tượng, nhưng các mô hình tổng quát đã làm rõ ngay những con đường nào đáng để khám phá. 

Vì vậy, khi nói đến những nhiệm vụ như vậy, chúng tôi không tranh luận rằng máy tính nhất thiết phải hơn so với con người trên cơ sở 1:1. Nhưng cũng như rất nhiều nhiệm vụ khác, khi máy tính có thể tạo ra đầu ra công việc hoàn chỉnh, chúng sẽ giết chết chúng ta. tỉ lệ

Thử đoán xem bức vẽ nào dưới đây do Yoko trực tiếp vẽ và bức vẽ nào được tạo ra. 

Nghệ thuật không chết, nó chỉ là trí thông minh dữ liệu PlatoBlockchain do máy tạo ra. Tìm kiếm dọc. Ái.
Trả lời: Mô hình AI tạo ra hình ảnh có nền không phải màu trắng.

Sự cải thiện lớn về kinh tế, sự linh hoạt trong việc có thể tạo ra các phong cách và khái niệm mới, cũng như khả năng tạo ra sản phẩm hoàn chỉnh hoặc gần như hoàn chỉnh cho chúng tôi thấy rằng chúng tôi sẵn sàng chứng kiến ​​sự thay đổi rõ rệt trong tất cả các ngành nơi tài sản sáng tạo là một phần chính của doanh nghiệp. Và điều này không chỉ giới hạn ở hình ảnh mà còn áp dụng cho toàn bộ lĩnh vực thiết kế. Ví dụ:

  • AI sáng tạo có thể tạo nghệ thuật 2D, kết cấu, mô hình 3D và trợ giúp thiết kế cấp độ cho trò chơi. 
  • Trong tiếp thị, nó có vẻ sẵn sàng thay thế stock art, chụp ảnh sản phẩm và minh họa. 
  • Chúng ta đã thấy các ứng dụng trong thiết kế web, thiết kế nội thất và thiết kế cảnh quan.

Và chúng tôi thực sự chỉ mới bắt đầu. Nếu một trường hợp sử dụng yêu cầu tạo nội dung sáng tạo, thì thật khó để hiểu tại sao AI tổng quát sẽ không phá vỡ nó hoặc ít nhất là trở thành một phần của quy trình.

-

OK, vậy mục đích của bài đăng này là gì? Mặc dù nó hơi tập trung vào việc tạo mã và tạo hình ảnh, nhưng chúng tôi nghi ngờ rằng các kết quả sẽ có phạm vi rộng hơn. Đặc biệt, những nỗ lực sáng tạo trên toàn diện — dù là hình ảnh, văn bản hay âm nhạc — đều có khả năng bị AI làm gián đoạn từ rất lâu trước khi hệ thống được xây dựng. 

Ngoài lập luận về tính đúng đắn mà chúng tôi sử dụng ở trên, cũng có thể xảy ra trường hợp kết hợp và kết hợp lại tất cả các tác phẩm nghệ thuật trước đây có thể đủ cho phạm vi đầu ra sáng tạo thực tế. Ví dụ, ngành công nghiệp âm nhạc và điện ảnh trong lịch sử đã tạo ra vô số bản sao của các album và phim nổi tiếng. Hoàn toàn có thể hình dung rằng các mô hình tổng quát có thể giúp tự động hóa các chức năng đó theo thời gian. Tuy nhiên, điều đáng chú ý về rất nhiều hình ảnh do Stable Diffusion và DALL-E 2 tạo ra là họ thực sự tốt thực sự thú vị. Không khó để hình dung một mô hình AI tạo ra sự kết hợp thực sự thú vị giữa các phong cách âm nhạc hoặc thậm chí là những bộ phim dài tập “viết” hấp dẫn trong cách chúng kết hợp các khái niệm và phong cách với nhau. 

Ngược lại, thật khó để tưởng tượng rằng các hệ thống trước đó sẽ chứa tất cả các công cụ mà chúng ta cần để phát triển tất cả các hệ thống trong tương lai. Hoặc thậm chí các hệ thống phức tạp đó có thể được kết hợp dễ dàng như nhiều phong cách nghệ thuật hoặc âm nhạc khác nhau. Vì vậy, giá trị của một hệ thống và lý do tại sao chúng lại khó xây dựng đến vậy thường nằm ở phần chi tiết dài - tất cả sự đánh đổi, cách giải quyết, tối ưu hóa cho một không gian thiết kế nhất định và kiến ​​thức thể chế/tiềm ẩn mà chúng chứa đựng. Vì vậy, chúng ta phải tiếp tục xây dựng.

Chúng tôi sẽ chống lại sự thôi thúc để dự đoán chính xác AI sáng tạo sẽ tác động như thế nào đến ngành công nghiệp sáng tạo. Tuy nhiên, lịch sử gợi ý rằng các công cụ mới có xu hướng mở rộng chứ không phải là hợp đồng định nghĩa của nghệ thuậtvà để làm cho nó có thể tiếp cận được với các loại nghệ sĩ mới. Trong trường hợp này, các nghệ sĩ mới là những người xây dựng hệ thống. Vì thế, đối với những người sáng lập công nghệ, chúng tôi tin rằng AI sáng tạo hoàn toàn là một công cụ tích cực để mở rộng phạm vi tiếp cận của phần mềm – trò chơi sẽ đẹp hơn, tiếp thị hấp dẫn hơn, nội dung bằng văn bản hấp dẫn hơn, phim truyền cảm hứng hơn.

Ai biết được: Một ngày nào đó, một kho lưu trữ Internet vào cuối năm 2022 có thể được trân trọng như một trong những kho lưu trữ nội dung chủ yếu do con người tạo ra cuối cùng. Văn bản này cho bài viết này, ít nhất, được tạo ra hoàn toàn bởi con người. 

Nghệ thuật không chết, nó chỉ là trí thông minh dữ liệu PlatoBlockchain do máy tạo ra. Tìm kiếm dọc. Ái.
Tác phẩm này được viết bởi nhóm a16z infra, với các tác giả chính là Guido Appenzeller, Matt Bornstein, Martin Casado và Yoko Li, cùng với sự đóng góp to lớn của các thành viên còn lại trong nhóm.

***

Các quan điểm được thể hiện ở đây là quan điểm của từng nhân viên AH Capital Management, LLC (“a16z”) được trích dẫn và không phải là quan điểm của a16z hoặc các chi nhánh của nó. Một số thông tin nhất định trong đây đã được lấy từ các nguồn của bên thứ ba, bao gồm từ các công ty danh mục đầu tư của các quỹ do a16z quản lý. Mặc dù được lấy từ các nguồn được cho là đáng tin cậy, a16z đã không xác minh độc lập thông tin đó và không đưa ra tuyên bố về tính chính xác hiện tại hoặc lâu dài của thông tin hoặc sự phù hợp của nó đối với một tình huống nhất định. Ngoài ra, nội dung này có thể bao gồm các quảng cáo của bên thứ ba; a16z đã không xem xét các quảng cáo đó và không xác nhận bất kỳ nội dung quảng cáo nào có trong đó.

Nội dung này chỉ được cung cấp cho mục đích thông tin và không được dựa vào như lời khuyên về pháp lý, kinh doanh, đầu tư hoặc thuế. Bạn nên tham khảo ý kiến ​​của các cố vấn của riêng mình về những vấn đề đó. Các tham chiếu đến bất kỳ chứng khoán hoặc tài sản kỹ thuật số nào chỉ dành cho mục đích minh họa và không cấu thành khuyến nghị đầu tư hoặc đề nghị cung cấp dịch vụ tư vấn đầu tư. Hơn nữa, nội dung này không hướng đến cũng như không nhằm mục đích sử dụng cho bất kỳ nhà đầu tư hoặc nhà đầu tư tiềm năng nào và không được dựa vào bất kỳ trường hợp nào khi đưa ra quyết định đầu tư vào bất kỳ quỹ nào do a16z quản lý. (Đề nghị đầu tư vào quỹ a16z sẽ chỉ được thực hiện bởi bản ghi nhớ phát hành riêng lẻ, thỏa thuận đăng ký và các tài liệu liên quan khác về bất kỳ quỹ nào như vậy và phải được đọc toàn bộ.) Bất kỳ khoản đầu tư hoặc công ty danh mục đầu tư nào được đề cập, đề cập đến, hoặc được mô tả không phải là đại diện cho tất cả các khoản đầu tư vào xe do a16z quản lý và không thể đảm bảo rằng các khoản đầu tư sẽ sinh lời hoặc các khoản đầu tư khác được thực hiện trong tương lai sẽ có các đặc điểm hoặc kết quả tương tự. Danh sách các khoản đầu tư được thực hiện bởi các quỹ do Andreessen Horowitz quản lý (không bao gồm các khoản đầu tư mà tổ chức phát hành không cho phép a16z tiết lộ công khai cũng như các khoản đầu tư không thông báo vào tài sản kỹ thuật số được giao dịch công khai) có tại https://a16z.com/investments /.

Các biểu đồ và đồ thị được cung cấp bên trong chỉ nhằm mục đích cung cấp thông tin và không nên dựa vào khi đưa ra bất kỳ quyết định đầu tư nào. Hiệu suất trong quá khứ không cho thấy kết quả trong tương lai. Nội dung chỉ nói kể từ ngày được chỉ định. Mọi dự đoán, ước tính, dự báo, mục tiêu, triển vọng và / hoặc ý kiến ​​thể hiện trong các tài liệu này có thể thay đổi mà không cần báo trước và có thể khác hoặc trái ngược với ý kiến ​​của người khác. Vui lòng xem https://a16z.com/disclosures để biết thêm thông tin quan trọng.

Dấu thời gian:

Thêm từ Andreessen Horowitz