Компания CCC поддержала три научных сессии на ежегодной конференции AAAS в этом году, и если вы не смогли присутствовать лично, мы будем подводить итоги каждой сессии. На этой неделе мы подведем итоги сессии»,Генеративный ИИ в науке: обещания и подводные камни». В первой части мы подведем итоги введения и презентации доктора Ребекки Уиллетт.
Первое заседание группы AAAS CCC на ежегодном собрании 2024 года состоялось в пятницу, 16 февраля, во второй день конференции. Панель, модерируемая собственными сотрудниками CCC Доктор Мэтью Терк, президент Технологического института Toyota в Чикаго, состоял из экспертов, применяющих искусственный интеллект в различных научных областях. Доктор Ребекка Уиллетт, профессор статистики и информатики Чикагского университета, посвятила свою презентацию тому, как генеративные модели могут использоваться в науке и почему готовых моделей недостаточно для применения в научных исследованиях. Доктор Маркус Бюлер, профессор инженерных наук Массачусетского технологического института, рассказал о генеративных моделях применительно к материаловедению, и Доктор Дункан Уотсон-Пэррис, доцент Океанографического института Скриппса и Института обработки данных Халыджиоглу в Калифорнийском университете в Сан-Диего, обсудили, как можно использовать генеративные модели в изучении наук о климате.
Доктор Тёрк, эксперт в области компьютерного зрения и взаимодействия человека с компьютером, начал дискуссию с того, что выделил генеративный ИИ из всех видов ИИ. «В основе приложений генеративного ИИ лежат генеративные модели, состоящие из глубоких нейронных сетей, которые изучают структуру своих объемных обучающих данных, а затем генерируют новые данные на основе того, что они узнали».
Доктор Терк также обозначил распространенную обеспокоенность по поводу генеративных систем, как из-за сбоев самих систем, например тех, которые цитируют несуществующие юридические справки, так и из-за их использования злоумышленниками для создания фейкового контента, такого как фейковый аудио или видео политиков или знаменитостей.
«В частности, — сказал д-р Тёрк, — эта сессия будет сосредоточена на использовании генеративного искусственного интеллекта в науке, как в качестве преобразующей силы в поисках науки, так и в качестве потенциального риска разрушения».
Доктор Ребекка Уиллетт начала свою презентацию с описания того, как можно использовать генеративный искусственный интеллект для поддержки процесса научных открытий. Сначала она сосредоточилась на том, как работают генеративные модели. На изображении ниже из слайдов доктора Уиллетта показано, как языковая модель, такая как ChatGPT, оценивает вероятность появления слова с учетом предыдущего набора слов и как модель генерации изображений, такая как DALL-E 2, генерирует изображение. из заданной подсказки с использованием вероятностных распределений, полученных из миллиардов изображений во время обучения.
«Используя этот принцип распределения вероятностей, который лежит в основе всех генеративных моделей, эти модели можно применять к амбициозным научным идеям, таким как создание возможных климатических сценариев с учетом текущего климата и потенциальной политики или создание новых микробиомов с целевой функциональностью, таких как тот, который особенно эффективен при разрушении пластика», — говорит доктор Уиллетт.
Однако для научных исследований недостаточно использовать готовые генерирующие инструменты, такие как ChatGPT или DALL-E 2. Эти инструменты были созданы в условиях, сильно отличающихся от контекста, в котором работают ученые. Одно очевидное различие между стандартной генеративной моделью и научной моделью — это данные. В науке зачастую очень мало данных, на которых можно строить гипотезы. Научные данные обычно получаются в результате моделирования и экспериментов, которые часто являются дорогостоящими и отнимают много времени. Из-за этих ограничений ученым приходится тщательно выбирать, какие эксперименты проводить и как максимизировать эффективность и полезность этих систем. Готовые модели, напротив, придают гораздо меньшее значение источнику данных, предпочитая максимизировать объем данных, с которыми они могут работать. В науке точность наборов данных и их происхождение невероятно важны, поскольку ученым необходимо подтверждать свои исследования надежными эмпирическими данными.
«Кроме того, в науке наши цели отличаются от простого создания правдоподобных вещей», — говорит доктор Уиллетт. «Мы должны понять, как все работает за пределами того, что мы наблюдали до сих пор». Этот подход противоречит генеративным моделям ИИ, которые рассматривают данные как репрезентативные для всего диапазона вероятных наблюдений. Включение физических моделей и ограничений в генеративный ИИ помогает обеспечить лучшее представление физических явлений.
Научные модели также должны быть способны фиксировать редкие события. «Мы можем спокойно игнорировать множество редких событий, когда обучаем ChatGPT, но, напротив, редкие события часто являются тем, что нас больше всего волнует в контексте науки, например, в климатической модели, которая предсказывает редкие погодные явления. Если мы используем генеративную модель, которая избегает редких событий и, например, никогда не предсказывает ураган, то на практике эта модель будет не очень полезна».
Связанной с этим задачей является разработка генеративных моделей ИИ для хаотических процессов, чувствительных к начальным условиям. Доктор Уиллетт продемонстрировал видео ниже, на котором показаны две частицы, движущиеся в пространстве согласно уравнениям Лоренца 63. Эти уравнения являются детерминированными, а не случайными, но, учитывая два немного разных начальных местоположения, вы можете видеть, что в любой момент времени две частицы могут находиться в совершенно разных местах. Разработка генеративных моделей ИИ, которые предсказывают точный ход таких процессов, которые возникают в науке о климате, турбулентности и сетевой динамике, принципиально сложна, но новые подходы к генеративному моделированию могут гарантировать, что генерируемые процессы имеют общие ключевые статистические характеристики с реальными научными данными.
[Встраиваемое содержимое]
Наконец, доктор Уиллетт обратил внимание на тот факт, что научные данные часто охватывают огромный диапазон пространственных и временных масштабов. Например, в области материаловедения исследователи изучают материалы в нанометровом масштабе на предмет монет вплоть до крупномасштабной системы, такой как целый самолет. «Этот диапазон масштабов сильно отличается от данных, используемых в готовых моделях, и нам необходимо подумать о том, как мы создаем эти генеративные модели таким образом, чтобы они точно влияли на взаимодействие между масштабами».
«Генераторные модели — это будущее науки», — говорит доктор Уиллетт, — «но для того, чтобы гарантировать их эффективное использование, нам необходимо добиться фундаментальных успехов в области искусственного интеллекта и выйти за рамки простого подключения данных к ChatGPT».
Большое спасибо за чтение. Пожалуйста, подключайтесь завтра, чтобы прочитать краткий обзор презентации доктора Маркуса Бюлера «Генераторный искусственный интеллект в механобиологии».
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://feeds.feedblitz.com/~/873922907/0/cccblog~CCC-AAAS-Generative-AI-in-Science-Promises-and-Pitfalls-Recap-Part-One/
- :является
- :нет
- :куда
- $UP
- 16
- 2024
- a
- в состоянии
- О нас
- По
- точность
- точно
- актеры
- адресованный
- авансы
- AI
- AI модели
- Все
- причислены
- am
- количество
- an
- и
- годовой
- любой
- Приложения
- прикладной
- Применить
- подхода
- подходы
- МЫ
- возникать
- искусственный
- искусственный интеллект
- AS
- At
- посещать
- аудио
- позволяет избегать
- Плохой
- Использование темпера с изогнутым основанием
- основанный
- BE
- , так как:
- начал
- ниже
- Лучшая
- между
- Beyond
- миллиарды
- Блог
- изоферменты печени
- Разрыв
- Строительство
- но
- by
- CAN
- способный
- Захват
- заботится
- осторожно
- случаев
- CCC
- Блог ССС
- знаменитости
- вызов
- характеристика
- ChatGPT
- Чикаго
- Выберите
- климат
- выходит
- состоящие
- компьютер
- Информатика
- Компьютерное зрение
- Обеспокоенность
- Условия
- Конференция
- Рассматривать
- ограничения
- содержание
- контекст
- контраст
- Основные
- "Курс"
- создали
- Текущий
- дал-и
- данным
- наука о данных
- Наборы данных
- день
- глубоко
- развивающийся
- разница
- различный
- открытие
- обсуждается
- отображается
- дисплеев
- Нарушение
- распределения
- вниз
- dr
- два
- Duncan
- в течение
- динамика
- каждый
- фактически
- затрат
- встроенный
- Проект и
- огромный
- обеспечивать
- Весь
- уравнения
- События
- , поскольку большинство сенаторов
- точный
- пример
- дорогим
- Эксперименты
- эксперту
- эксперты
- факт
- сбои
- не настоящие
- далеко
- февраль
- Поля
- Во-первых,
- Фокус
- внимание
- Что касается
- Форс-мажор
- пятница
- от
- полный
- функциональность
- фундаментальный
- принципиально
- будущее
- порождать
- генерируется
- генерирует
- порождающий
- поколение
- генеративный
- Генеративный ИИ
- данный
- Go
- Цели
- Жесткий
- Есть
- помогает
- ее
- High
- основной момент
- Как
- How To
- HTTPS
- ураган
- идеи
- if
- игнорировать
- изображение
- изображений
- значение
- важную
- in
- включения
- невероятно
- начальный
- Институт
- учреждение
- Интеллекта
- взаимодействие
- взаимодействие
- в
- Введение
- IT
- Основные
- язык
- крупномасштабный
- УЧИТЬСЯ
- узнали
- Юр. Информация
- Меньше
- заемные средства
- Вероятно
- недостатки
- мало
- места
- серия
- сделать
- Массачусетс
- Массачусетский Технологический Институт
- материалы
- Мэтью
- макс-ширина
- Максимизировать
- максимизации
- Май..
- заседания
- просто
- MIT
- модель
- моделирование
- Модели
- полет на Луну
- самых
- перемещение
- много
- должен
- Необходимость
- сеть
- сетей
- нервный
- нейронные сети
- никогда
- Новые
- несуществующий
- роман
- Очевидный
- происходящий
- шансы
- of
- .
- on
- ONE
- работать
- or
- происхождения
- наши
- внешний
- изложенные
- с изложением
- внешнюю
- собственный
- панель
- часть
- особенно
- человек
- физический
- Часть
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- игрок
- пожалуйста
- сборах
- Политикам
- Популярное
- возможное
- потенциал
- практика
- предсказывать
- предсказывает
- presentation
- президент
- предыдущий
- принцип
- процесс
- Процессы
- производства
- Профессор
- Обещает
- преследование
- цену
- случайный
- ассортимент
- РЕДКИЙ
- Читать
- Reading
- реальные
- резюме
- Связанный
- представлять
- представитель
- исследованиям
- исследователи
- Снижение
- надежный
- Run
- безопасно
- Сказал
- Сан -
- говорит
- Шкала
- Весы
- Сценарии
- Наука
- НАУКА
- научный
- Ученые
- Во-вторых
- посмотреть
- чувствительный
- Сессия
- сессиях
- набор
- установка
- Поделиться
- она
- Шоу
- моделирование
- Горки
- немного отличается
- So
- уже
- Space
- пролеты
- пространственный
- Начало
- статистический
- статистика
- Структура
- Кабинет
- изучение
- такие
- достаточный
- суммировать
- поддержка
- Поддержанный
- система
- системы
- целевое
- технологический
- Технологии
- чем
- который
- Ассоциация
- Будущее
- их
- сами
- тогда
- Там.
- Эти
- они
- вещи
- этой
- На этой неделе
- те
- три
- время
- кропотливый
- в
- завтра
- приняли
- инструменты
- Тойота
- Обучение
- преобразующей
- лечить
- мелодия
- турбулентность
- два
- типично
- понимать
- Университет
- Чикагский университет
- использование
- используемый
- полезный
- через
- разнообразие
- очень
- Видео
- видение
- законопроект
- Путь..
- we
- Погода
- неделя
- были
- Что
- когда
- который
- КТО
- зачем
- будете
- Word
- слова
- Работа
- Ты
- YouTube
- зефирнет