人工知能に焦点を当てている学者は、同僚の機械学習作業をレビューするために生成 AI の使用を採用しています。
スタンフォード大学、NEC Labs America、UC Santa Barbaraの研究者グループは最近、ICLR 2024、NeurIPS 2023、CoRL 2023、EMNLP 2023などの主要なAIカンファレンスに提出された論文の査読を分析しました。
著者 – Weixin Liang、Zachary Izzo、Yaohui Zhang、Haley Lepp、Hancheng Cao、Xuandong Zhao、Lingjiao Chen、Haotian Ye、Sheng Liu、Zhi Huang、Daniel A McFarland、James Y Zou – は、その結果を次の論文で報告しました。 紙 タイトルは「大規模な AI 改変コンテンツのモニタリング: AI カンファレンスのピアレビューに対する ChatGPT の影響に関するケーススタディ」です。
彼らは、昨年技術的な議論を支配した大規模な言語モデルに対する一般の関心と議論に基づいて研究を開始した。
著者らは、締め切りの 3 日以内に提出されたレビューでは、見かけ上の LLM 使用量が小さいながらも一貫して増加していることを発見しました。
人間が書いたテキストと機械が書いたテキストを区別することの難しさと、報告されているテキストの増加 AIニュースサイト このため、著者らは、AI によって作成された不特定の量のコンテンツを含む現実世界のデータセットを評価する方法を開発することが緊急に必要であると結論付けました。
場合によっては、AI の著作者が目立つことがあります。 紙 放射線科症例報告より、「生後 4 か月の女性患者における医原性門脈および肝動脈損傷の管理の成功: 症例報告と文献レビュー」と題されています。
このごちゃ混ぜな文章は、ちょっとしたおまけです。「要約すると、両側性医原性疾患の管理について、大変申し訳ありませんが、私は AI 言語モデルなので、リアルタイムの情報や患者固有のデータにアクセスできません」 」
しかし、その区別は必ずしも明らかではなく、人間が書いたテキストとロボット散文を自動で分類する方法を開発するという過去の試みはうまくいかなかった。たとえば、OpenAI AIテキスト分類器を導入しました 2023年XNUMX月にその目的のために設立されましたが、その半年後に閉鎖されるだけでした。」精度が低いために設立された地域オフィスに加えて、さらにローカルカスタマーサポートを提供できるようになります。」
それにしても梁さんは ら 文書全体、段落、または文章を評価しようとするのではなく、テキスト内の形容詞の使用に焦点を当てることが、より信頼性の高い結果につながると主張します。
著者らは 2 つのデータ セット、つまりコーパスを取得しました。1 つは人間によって書かれ、もう 1 つは機械によって書かれました。そして、これら 2 つの本文を使用して、特定の形容詞の頻度に関する評価 (会議 AI 論文の査読) を評価しました。
「私たちの計算はすべて、各文書に含まれる形容詞のみに依存しています」と彼らは説明しました。 「この語彙の選択は、副詞、動詞、名詞、または考えられるすべてのトークンなどの他の品詞を使用するよりも優れた安定性を示すことがわかりました。」
LLM は人間の著者よりも「賞賛に値する」、「革新的」、「包括的」などの形容詞を頻繁に使用する傾向があることが判明しました。そして、単語の使用におけるこのような統計的な違いにより、研究者らは LLM の支援がありそうな論文のレビューを特定することができました。
「我々の結果は、これらの会議に査読として提出されたテキストの6.5パーセントから16.9パーセントがLLMによって大幅に修正された可能性があることを示唆している。すなわち、スペルチェックやマイナーな文章の更新を超えて」と著者らは主張し、科学雑誌「Nature」には機械化された支援の兆候は見られません。
いくつかの要因が LLM の使用量の増加と相関しているようです。 1 つは締め切りが近づいていることです。著者らは、締め切りの 3 日以内に提出されたレビューでは、見かけ上の LLM 使用量が小さいながらも一貫して増加していることを発見しました。
研究者らは、彼らの目的はAI執筆支援の利用について判断を下すことではなく、評価した論文が完全にAIモデルによって書かれたと主張することではないことを強調した。しかし彼らは、科学界はLLMの使用についてもっと透明性を保つ必要があると主張した。
そして彼らは、そのような慣行は、その作品がレビューされている人々から専門家からの多様なフィードバックを奪う可能性があると主張した。さらに、AI フィードバックには、AI モデルのバイアスに偏り、意味のある洞察から遠ざかる均質化効果が生じる危険性があります。 ®
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://go.theregister.com/feed/www.theregister.com/2024/03/19/ai_researchers_reviewing_peers/
- :は
- :not
- :どこ
- 100
- 16
- 2023
- 2024
- 378
- 7
- 9
- a
- 私たちについて
- アクセス
- AI
- すべて
- 許可されて
- 常に
- am
- アメリカ
- 量
- an
- 分析
- および
- どれか
- 見かけ上
- 現れる
- 接近する
- 主張した
- 人工の
- 人工知能
- AS
- 評価する
- 援助
- At
- 試み
- 著者
- 原作者
- 自動化
- 離れて
- ベース
- BE
- き
- さ
- の間に
- 越えて
- バイアス
- ビット
- ボディ
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 計算
- CAO
- 場合
- ケーススタディ
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- チェン
- 選択
- クレーム
- クリック
- クラウド
- CO
- 立派な
- コミュニティ
- 完全に
- 包括的な
- 結論
- 講演
- 会議
- 整合性のある
- 含む
- 含まれている
- 争う
- コンテンツ
- 可能性
- Daniel Mölk
- データ
- データセット
- 日
- 締め切り
- 考える
- 決まる
- 開発する
- の違い
- 難しさ
- 談話
- 議論
- 違い
- 異なる
- do
- ドキュメント
- ドキュメント
- 優勢
- ドン
- e
- 各
- 効果
- 強調
- 大きくする
- 全体
- と題する
- 評価する
- 評価
- 評価
- 例
- 展示
- 専門家
- 説明
- 要因
- フィードバック
- 女性
- 調査結果
- 焦点を当て
- 焦点
- 発見
- 周波数
- 頻繁に
- から
- 生々しい
- 生成AI
- 景品
- 行って
- 大きい
- グループ
- 持ってる
- 助けます
- HTTPS
- 黄
- 人間
- 人間
- i
- 識別する
- 影響
- in
- 含めて
- 増える
- 示します
- 情報
- 損傷
- 革新的な
- 洞察力
- インテリジェンス
- 意図
- 関心
- ISN
- IT
- ITS
- ジェームズ
- 1月
- ジャーナル
- JPG
- ラボ
- 言語
- 大
- 姓
- 昨年
- 後で
- 主要な
- リード
- 学習
- ツェッペリン
- less
- ような
- 可能性が高い
- レポート
- LLM
- ロー
- 機械
- 機械学習
- マシン
- 管理
- 意味のある
- マイナー
- モデル
- 修正されました
- モニタリング
- ヶ月
- 他には?
- 自然
- 必要
- ニーズ
- ニュース
- 注記
- 名詞
- 今
- 明白
- of
- on
- ONE
- の
- OpenAI
- or
- その他
- 私たちの
- でる
- 論文
- 部品
- パス
- 通過
- 過去
- 患者
- ピア
- ピア
- パーセント
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポータル
- 可能
- :
- プラクティス
- 公共
- 目的
- レート
- むしろ
- 現実の世界
- への
- 最近
- 信頼性のある
- レポート
- 報告
- レポート
- 研究者
- 結果
- レビュー
- 日
- レビュー
- レビュー
- 上昇
- リスク
- s
- サンタ
- 規模
- 科学的な
- セット
- サイン
- SIX
- 半年
- サイズ
- 小さい
- 一部
- 特定の
- スピーチ
- 安定性
- スタンド
- スタンフォード
- スタンフォード大学
- 統計的
- 勉強
- 提出された
- 実質上
- 成功した
- そのような
- 示唆する
- 概要
- 撮影
- 技術的
- 傾向があります
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- より
- それ
- アプリ環境に合わせて
- それら
- そこ。
- ボーマン
- 彼ら
- この
- それらの
- 三
- タイトル
- 〜へ
- トークン
- 取った
- top
- に向かって
- トランスペアレント
- しよう
- ターン
- 2
- 引き受けた
- 大学
- 更新版
- 緊急
- 使用法
- つかいます
- 中古
- 非常に
- ました
- 仕方..
- 方法
- we
- WELL
- した
- この試験は
- その
- Word
- 仕事
- 書き込み
- 書かれた
- Ye
- 年
- ゼファーネット
- 趙