Các nhà nghiên cứu khám phá một cách tiếp cận linh hoạt hơn đối với học máy

Các nhà nghiên cứu khám phá một cách tiếp cận linh hoạt hơn đối với học máy

Các nhà nghiên cứu khám phá một cách tiếp cận linh hoạt hơn đối với trí tuệ dữ liệu PlatoBlockchain trong học máy. Tìm kiếm dọc. Ái.

Giới thiệu

Các nhà nghiên cứu trí tuệ nhân tạo đã ăn mừng một chuỗi thành công với mạng thần kinh, các chương trình máy tính gần như bắt chước cách thức tổ chức bộ não của chúng ta. Nhưng bất chấp những tiến bộ nhanh chóng, các mạng lưới thần kinh vẫn tương đối không linh hoạt, ít có khả năng thay đổi nhanh chóng hoặc điều chỉnh theo các tình huống không quen thuộc.

Vào năm 2020, hai nhà nghiên cứu tại Viện Công nghệ Massachusetts đã lãnh đạo một nhóm giới thiệu một loại mạng lưới thần kinh mới dựa trên trí thông minh ngoài đời thực - nhưng không phải của chính chúng ta. Thay vào đó, họ lấy cảm hứng từ con giun tròn nhỏ bé, Caenorhabd viêm Elegans, để tạo ra cái mà họ gọi là mạng thần kinh lỏng. Sau một bước đột phá vào năm ngoái, các mạng mới giờ đây có thể đủ linh hoạt để thay thế các đối tác truyền thống của chúng trong một số ứng dụng nhất định.

Mạng thần kinh lỏng cung cấp “một giải pháp thay thế nhỏ gọn và thanh lịch,” cho biết Ken Goldberg, một người máy học tại Đại học California, Berkeley. Ông nói thêm rằng các thí nghiệm đã chỉ ra rằng các mạng này có thể chạy nhanh hơn và chính xác hơn so với cái gọi là mạng thần kinh thời gian liên tục khác, mô hình hóa các hệ thống thay đổi theo thời gian.

Ramin HasaniMathias Lechner, động lực đằng sau thiết kế mới, đã nhận ra từ nhiều năm trước rằng C. Elegans có thể là một sinh vật lý tưởng để sử dụng để tìm ra cách tạo ra các mạng lưới thần kinh kiên cường có thể đáp ứng bất ngờ. Loài ăn đáy dài một milimet là một trong số ít sinh vật có hệ thống thần kinh được lập bản đồ đầy đủ và nó có khả năng thực hiện một loạt các hành vi nâng cao: di chuyển, tìm thức ăn, ngủ, giao phối và thậm chí học hỏi kinh nghiệm. Lechner nói: “Nó tồn tại trong thế giới thực, nơi sự thay đổi luôn diễn ra và nó có thể hoạt động tốt trong hầu hết mọi điều kiện”.

Sự tôn trọng dành cho con sâu thấp kém đã dẫn anh ta và Hasani đến với mạng lưới chất lỏng mới của họ, nơi mỗi nơ-ron được điều khiển bởi một phương trình dự đoán hành vi của nó theo thời gian. Và giống như các tế bào thần kinh được liên kết với nhau, các phương trình này phụ thuộc vào nhau. Về cơ bản, mạng giải quyết toàn bộ tập hợp các phương trình được liên kết này, cho phép nó mô tả trạng thái của hệ thống tại bất kỳ thời điểm nào — khác với các mạng thần kinh truyền thống, vốn chỉ đưa ra kết quả tại những thời điểm cụ thể.

“[Họ] chỉ có thể cho bạn biết điều gì đang xảy ra sau một, hai hoặc ba giây,” Lechner nói. “Nhưng một mô hình thời gian liên tục như mô hình của chúng tôi có thể mô tả những gì đang diễn ra ở 0.53 giây hoặc 2.14 giây hoặc bất kỳ thời điểm nào khác mà bạn chọn.”

Mạng lỏng cũng khác nhau về cách chúng xử lý các khớp thần kinh, kết nối giữa các nơ-ron nhân tạo. Sức mạnh của những kết nối đó trong mạng thần kinh tiêu chuẩn có thể được biểu thị bằng một con số duy nhất, trọng số của nó. Trong các mạng lỏng, việc trao đổi tín hiệu giữa các nơ-ron là một quá trình xác suất được điều chỉnh bởi hàm “phi tuyến tính”, nghĩa là các phản hồi đối với đầu vào không phải lúc nào cũng tỷ lệ thuận. Chẳng hạn, việc tăng gấp đôi đầu vào có thể dẫn đến sự thay đổi lớn hơn hoặc nhỏ hơn nhiều ở đầu ra. Tính biến thiên tích hợp này là lý do tại sao các mạng được gọi là “chất lỏng”. Cách một nơ-ron phản ứng có thể khác nhau tùy thuộc vào đầu vào mà nó nhận được.

Giới thiệu

Trong khi các thuật toán cốt lõi của các mạng truyền thống được thiết lập trong quá trình đào tạo, khi các hệ thống này được cung cấp hàng loạt dữ liệu để hiệu chỉnh các giá trị tốt nhất cho trọng số của chúng, thì các mạng lưới thần kinh lỏng sẽ dễ thích ứng hơn. “Họ có thể thay đổi các phương trình cơ bản của mình dựa trên dữ liệu đầu vào mà họ quan sát được,” cụ thể là thay đổi tốc độ phản ứng của các nơ-ron thần kinh, cho biết Daniela Rus, giám đốc Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo của MIT.

Một thử nghiệm ban đầu để thể hiện khả năng này liên quan đến việc cố gắng điều khiển một chiếc ô tô tự trị. Một mạng thần kinh thông thường chỉ có thể phân tích dữ liệu hình ảnh từ camera của ô tô trong những khoảng thời gian cố định. Mạng lỏng — bao gồm 19 nơ-ron và 253 khớp thần kinh (làm cho nó cực nhỏ theo tiêu chuẩn của máy học) — có thể là phản ứng nhanh hơn nhiều. “Mô hình của chúng tôi có thể lấy mẫu thường xuyên hơn, chẳng hạn như khi đường ngoằn ngoèo,” Rus, đồng tác giả của nghiên cứu này và một số bài báo khác về mạng lưới chất lỏng, cho biết.

Lechner cho biết, mẫu xe này đã thành công trong việc giữ cho chiếc xe đi đúng hướng, nhưng nó có một khuyết điểm, Lechner nói: “Nó thực sự rất chậm.” Vấn đề bắt nguồn từ các phương trình phi tuyến tính biểu diễn các khớp thần kinh và tế bào thần kinh — những phương trình thường không thể giải được nếu không thực hiện các phép tính lặp lại trên máy tính, phương trình này trải qua nhiều lần lặp trước khi cuối cùng hội tụ về một giải pháp. Công việc này thường được giao cho các gói phần mềm chuyên dụng được gọi là bộ giải, các gói này sẽ cần được áp dụng riêng cho từng khớp thần kinh và nơ-ron.

Trong một giấy năm ngoái, nhóm đã tiết lộ một mạng thần kinh lỏng mới có thể vượt qua nút cổ chai đó. Mạng này dựa trên cùng một loại phương trình, nhưng bước tiến quan trọng là phát hiện của Hasani rằng những phương trình này không cần phải giải thông qua các phép tính phức tạp trên máy tính. Thay vào đó, mạng có thể hoạt động bằng cách sử dụng một giải pháp gần như chính xác hoặc “dạng khép kín”, về nguyên tắc, có thể được giải quyết bằng bút chì và giấy. Thông thường, các phương trình phi tuyến tính này không có nghiệm dạng đóng, nhưng Hasani đã tìm ra một nghiệm gần đúng đủ tốt để sử dụng.

“Có một giải pháp dạng đóng có nghĩa là bạn có một phương trình mà bạn có thể thế các giá trị cho các tham số của nó và thực hiện các phép toán cơ bản, và bạn sẽ nhận được câu trả lời,” Rus nói. “Bạn nhận được câu trả lời trong một lần chụp,” thay vì để máy tính hoạt động cho đến khi quyết định nó đủ gần. Điều đó cắt giảm thời gian và năng lượng tính toán, tăng tốc quá trình một cách đáng kể.

“Phương pháp của họ là đánh bại đối thủ bằng nhiều cấp độ lớn mà không làm giảm độ chính xác,” cho biết Sayan Mitra, một nhà khoa học máy tính tại Đại học Illinois, Urbana-Champaign.

Hasani cho biết, ngoài tốc độ nhanh hơn, các mạng mới nhất của họ cũng ổn định một cách bất thường, nghĩa là hệ thống có thể xử lý các đầu vào khổng lồ mà không gặp sự cố. “Đóng góp chính ở đây là tính ổn định và các đặc tính tốt đẹp khác được đưa vào các hệ thống này nhờ cấu trúc tuyệt đối của chúng,” cho biết Sriram Sankaranarayanan, một nhà khoa học máy tính tại Đại học Colorado, Boulder. Mạng lỏng dường như hoạt động ở cái mà ông gọi là “điểm hấp dẫn: Chúng đủ phức tạp để cho phép những điều thú vị xảy ra, nhưng không phức tạp đến mức dẫn đến hành vi hỗn loạn”.

Hiện tại, nhóm MIT đang thử nghiệm mạng mới nhất của họ trên một máy bay không người lái tự động. Mặc dù máy bay không người lái đã được huấn luyện để điều hướng trong rừng, nhưng họ đã chuyển nó đến môi trường đô thị của Cambridge để xem cách nó xử lý các điều kiện mới. Lechner gọi kết quả sơ bộ là đáng khích lệ.

Ngoài việc tinh chỉnh mô hình hiện tại, nhóm cũng đang làm việc để cải thiện kiến ​​trúc mạng của họ. Bước tiếp theo, Lechner nói, “là tìm ra có bao nhiêu hoặc ít bao nhiêu tế bào thần kinh mà chúng ta thực sự cần để thực hiện một nhiệm vụ nhất định.” Nhóm cũng muốn nghĩ ra một cách tối ưu để kết nối các nơ-ron. Hiện tại, mọi nơ-ron liên kết với mọi nơ-ron khác, nhưng đó không phải là cách nó hoạt động trong C. Elegans, nơi các kết nối synap chọn lọc hơn. Thông qua các nghiên cứu sâu hơn về hệ thống dây của giun tròn, họ hy vọng sẽ xác định được nơ-ron nào trong hệ thống của chúng sẽ được ghép nối với nhau.

Ngoài các ứng dụng như lái xe và bay tự động, mạng chất lỏng dường như rất phù hợp để phân tích lưới điện, giao dịch tài chính, thời tiết và các hiện tượng dao động theo thời gian khác. Ngoài ra, Hasani cho biết, phiên bản mới nhất của mạng chất lỏng có thể được sử dụng “để thực hiện mô phỏng hoạt động của não ở quy mô không thể thực hiện được trước đây”.

Mitra đặc biệt bị hấp dẫn bởi khả năng này. Ông nói: “Theo một cách nào đó, đó là một bài thơ, cho thấy rằng nghiên cứu này có thể đang đi vào vòng tròn đầy đủ. “Mạng lưới thần kinh đang phát triển đến mức chính những ý tưởng mà chúng ta rút ra từ tự nhiên có thể sớm giúp chúng ta hiểu rõ hơn về tự nhiên.”

Dấu thời gian:

Thêm từ tạp chí lượng tử