AI sáng tạo 'lấy cảm hứng từ vật lý' mới vượt quá mong đợi | Tạp chí Quanta

AI sáng tạo 'lấy cảm hứng từ vật lý' mới vượt quá mong đợi | Tạp chí Quanta

AI sáng tạo 'lấy cảm hứng từ vật lý' mới vượt quá mong đợi | Tạp chí Quanta PlatoThông minh dữ liệu Blockchain. Tìm kiếm dọc. Ái.

Giới thiệu

Các công cụ của trí tuệ nhân tạo - đặc biệt là mạng lưới thần kinh - rất hữu ích đối với các nhà vật lý. Trong nhiều năm, công nghệ này đã giúp các nhà nghiên cứu tái tạo lại quỹ đạo của các hạt trong các thí nghiệm máy gia tốc, tìm kiếm bằng chứng về các hạt mới và phát hiện sóng hấp dẫn và các ngoại hành tinh. Mặc dù các công cụ AI rõ ràng có thể giúp ích rất nhiều cho các nhà vật lý, nhưng câu hỏi hiện nay, theo Max Tegmark, nhà vật lý tại Viện Công nghệ Massachusetts, là: “Chúng ta có thể trả lại bất cứ điều gì không?”

Tegmark tin rằng các nhà vật lý đồng nghiệp của ông có thể có những đóng góp đáng kể cho khoa học về AI và ông đã đặt điều này làm ưu tiên nghiên cứu hàng đầu của mình. Ông nói, một cách mà các nhà vật lý có thể giúp thúc đẩy công nghệ AI là thay thế các thuật toán “hộp đen” của mạng lưới thần kinh, những thuật toán mà hoạt động của chúng phần lớn không thể hiểu được, bằng các phương trình được hiểu rõ về các quá trình vật lý.

Ý tưởng này không hoàn toàn mới. Các mô hình AI sáng tạo dựa trên sự khuếch tán - chẳng hạn, quá trình làm cho sữa đổ vào tách cà phê dàn đều - xuất hiện lần đầu tiên vào năm 2015 và chất lượng hình ảnh mà chúng tạo ra đã được cải thiện đáng kể kể từ đó. Công nghệ đó hỗ trợ các phần mềm tạo hình ảnh phổ biến như DALL·E 2 và Midjourney. Giờ đây, Tegmark và các đồng nghiệp của ông đang tìm hiểu xem liệu các mô hình sinh sản lấy cảm hứng từ vật lý khác có thể hoạt động tốt như các mô hình dựa trên sự khuếch tán hay thậm chí tốt hơn hay không.

Cuối năm ngoái, nhóm của Tegmark đã giới thiệu một phương pháp tạo hình ảnh mới đầy hứa hẹn được gọi là Mô hình tạo dòng Poisson (PFGM). Trong đó, dữ liệu được biểu thị bằng các hạt tích điện, chúng kết hợp với nhau để tạo ra một điện trường có đặc tính phụ thuộc vào sự phân bố điện tích tại bất kỳ thời điểm nào. Nó được gọi là mô hình dòng Poisson vì chuyển động của các điện tích bị chi phối bởi phương trình Poisson, xuất phát từ nguyên lý cho biết lực tĩnh điện giữa hai điện tích tỉ lệ nghịch với bình phương khoảng cách giữa chúng (tương tự như công thức của lực hấp dẫn Newton) .

Quá trình vật lý đó là trọng tâm của PFGM. “Mô hình của chúng tôi có thể được đặc trưng gần như hoàn toàn bởi cường độ và hướng của điện trường tại mọi điểm trong không gian,” cho biết. Yilun Xu, một sinh viên tốt nghiệp tại MIT và là đồng tác giả của bài báo. “Những gì mạng lưới thần kinh học được trong quá trình đào tạo là cách ước tính điện trường đó.” Và khi làm như vậy, nó có thể học cách tạo ra hình ảnh vì hình ảnh trong mô hình này có thể được mô tả ngắn gọn bằng điện trường.

Giới thiệu

PFGM có thể tạo ra hình ảnh có chất lượng tương tự như hình ảnh được tạo ra bằng phương pháp dựa trên khuếch tán và thực hiện nhanh hơn từ 10 đến 20 lần. “Nó sử dụng cấu trúc vật lý, điện trường, theo cách mà chúng tôi chưa từng thấy trước đây”, ông nói. Hananel Hazan, một nhà khoa học máy tính tại Đại học Tufts. “Điều đó mở ra cơ hội khai thác các hiện tượng vật lý khác để cải thiện mạng lưới thần kinh của chúng ta.”

Các mô hình dòng khuếch tán và dòng Poisson có nhiều điểm chung, ngoài việc dựa trên các phương trình được nhập từ vật lý. Trong quá trình huấn luyện, một mô hình khuếch tán được thiết kế để tạo hình ảnh thường bắt đầu bằng một hình ảnh - chẳng hạn như một con chó - và sau đó thêm nhiễu hình ảnh, thay đổi từng pixel theo cách ngẫu nhiên cho đến khi các đặc điểm của nó bị che phủ hoàn toàn (mặc dù không bị loại bỏ hoàn toàn). Sau đó, mô hình sẽ cố gắng đảo ngược quá trình và tạo ra một con chó gần giống với bản gốc. Sau khi được huấn luyện, mô hình có thể tạo thành công những chú chó — và các hình ảnh khác — bắt đầu từ một khung vẽ dường như trống.

Các mô hình dòng Poisson hoạt động theo cách tương tự. Trong quá trình đào tạo, có một quy trình chuyển tiếp, bao gồm việc thêm nhiễu tăng dần vào hình ảnh sắc nét một thời và quy trình ngược lại trong đó mô hình cố gắng loại bỏ nhiễu đó từng bước một cho đến khi phiên bản ban đầu gần như được khôi phục. Giống như quá trình tạo dựa trên sự khuếch tán, hệ thống cuối cùng sẽ học cách tạo ra những hình ảnh mà nó chưa từng thấy trong quá trình đào tạo.

Nhưng cơ sở vật lý của các mô hình Poisson lại hoàn toàn khác. Sự khuếch tán được điều khiển bởi lực nhiệt động, trong khi dòng Poisson được điều khiển bởi lực tĩnh điện. Cái sau thể hiện một hình ảnh chi tiết bằng cách sử dụng sự sắp xếp các điện tích có thể tạo ra một điện trường rất phức tạp. Tuy nhiên, từ trường đó làm cho các điện tích phân tán đều hơn theo thời gian – giống như sữa phân tán một cách tự nhiên trong một tách cà phê. Kết quả là bản thân trường trở nên đơn giản và đồng đều hơn. Nhưng trường thống nhất đầy tiếng ồn này không phải là một bảng trống hoàn toàn; nó vẫn chứa những hạt giống thông tin mà từ đó các hình ảnh có thể được tập hợp dễ dàng.

Đầu năm 2023, nhóm đã nâng cấp mô hình Poisson của họ, mở rộng nó để bao gồm toàn bộ nhóm người mẫu. Phiên bản tăng cường, PFGM++, bao gồm một tham số mới, D, cho phép các nhà nghiên cứu điều chỉnh kích thước của hệ thống. Điều này có thể tạo nên sự khác biệt lớn: Trong không gian ba chiều quen thuộc, cường độ điện trường do một điện tích tạo ra tỉ lệ nghịch với bình phương khoảng cách từ điện tích đó. Nhưng trong không gian bốn chiều, cường độ trường tuân theo định luật lập phương nghịch đảo. Và với mọi chiều không gian, và mọi giá trị của D, mối quan hệ đó có phần khác biệt.

Giới thiệu

Sự đổi mới duy nhất đó đã mang lại cho các mô hình dòng Poisson tính biến đổi lớn hơn nhiều, với các trường hợp cực đoan mang lại những lợi ích khác nhau. Khi D ở mức thấp, ví dụ, mô hình chắc chắn hơn, có nghĩa là nó có khả năng chịu đựng tốt hơn các lỗi xảy ra khi ước tính điện trường. “Mô hình này không thể dự đoán điện trường một cách hoàn hảo,” cho biết Lưu Tử Minh, một sinh viên tốt nghiệp khác tại MIT và là đồng tác giả của cả hai bài báo. “Luôn luôn có một số sai lệch. Nhưng độ bền có nghĩa là ngay cả khi sai số ước tính của bạn cao, bạn vẫn có thể tạo ra những hình ảnh đẹp.” Vì vậy, bạn có thể không có được con chó trong mơ của mình, nhưng cuối cùng bạn vẫn sẽ có được thứ gì đó giống một con chó.

Ở một thái cực khác, khi D cao, mạng lưới thần kinh trở nên dễ huấn luyện hơn, cần ít dữ liệu hơn để thành thạo các kỹ năng nghệ thuật của nó. Lý do chính xác không dễ giải thích, nhưng nó là do thực tế là khi có nhiều chiều hơn, mô hình có ít điện trường hơn để theo dõi - và do đó có ít dữ liệu hơn để đồng hóa.

Mô hình nâng cao, PFGM++, “mang đến cho bạn sự linh hoạt để nội suy giữa hai thái cực đó,” cho biết Hoa hồng Yu, một nhà khoa học máy tính tại Đại học California, San Diego.

Và đâu đó trong phạm vi này có một giá trị lý tưởng cho D Xu cho biết điều đó tạo ra sự cân bằng phù hợp giữa độ bền và khả năng đào tạo dễ dàng. “Một mục tiêu của công việc trong tương lai là tìm ra cách có hệ thống để tìm ra điểm phù hợp đó, để chúng tôi có thể chọn ra phương án tốt nhất có thể. D cho một tình huống nhất định mà không cần dùng đến phương pháp thử và sai.”

Một mục tiêu khác của các nhà nghiên cứu MIT liên quan đến việc tìm kiếm thêm các quy trình vật lý có thể cung cấp cơ sở cho các dòng mô hình sinh sản mới. Thông qua một dự án mang tên GenPhys, đội nghiên cứu đã xác định được một ứng cử viên đầy triển vọng: thế Yukawa, liên quan đến lực hạt nhân yếu. “Nó khác với các mô hình dòng chảy và khuếch tán Poisson, trong đó số lượng hạt luôn được bảo toàn,” Liu nói. “Tiềm năng Yukawa cho phép bạn hủy diệt các hạt hoặc tách một hạt thành hai. Ví dụ, một mô hình như vậy có thể mô phỏng các hệ thống sinh học trong đó số lượng tế bào không nhất thiết phải giữ nguyên.”

Yu cho biết đây có thể là một hướng điều tra hiệu quả. “Nó có thể dẫn đến các thuật toán mới và các mô hình tổng hợp mới với các ứng dụng tiềm năng vượt ra ngoài việc tạo ra hình ảnh.”

Và chỉ riêng PFGM++ đã vượt quá mong đợi ban đầu của các nhà phát minh. Lúc đầu họ không nhận ra rằng khi D được đặt ở vô cực, mô hình dòng Poisson được tăng cường của chúng trở nên không thể phân biệt được với mô hình khuếch tán. Liu đã phát hiện ra điều này trong các tính toán mà anh thực hiện vào đầu năm nay.

Mert Pilanci, một nhà khoa học máy tính tại Đại học Stanford, coi sự “hợp nhất” này là kết quả quan trọng nhất bắt nguồn từ công trình của nhóm MIT. Ông nói: “Bài báo PFGM++ tiết lộ rằng cả hai mô hình này đều là một phần của một lớp rộng hơn, [điều này] đặt ra một câu hỏi hấp dẫn: Liệu có những mô hình vật lý khác cho AI có thể tạo ra đang chờ khám phá, gợi ý về một sự thống nhất thậm chí còn lớn hơn không? ”

Dấu thời gian:

Thêm từ tạp chí lượng tử