インタビュー 生成型 AI が法の世界で自動的に議席を獲得すると考えているのなら、考え直してください。
最新の調査によると、上位の大規模言語モデルは不正確な法的情報を生成する傾向があり、訴訟の際に依存すべきではないことが示されています。
昨年、OpenAI が示したとき GPT-4 司法試験に合格することができたが、AI の画期的な進歩として歓迎され、一部の人々はこのテクノロジーがすぐに合格できるかどうか疑問を抱いた replace 弁護士。この種のモデルによって、高額な弁護士に依頼する余裕がない人々が法的正義を追求できるようになり、法的支援をより公平に利用できるようになるのではないかと期待する人もいた。しかし、現実には、LLM はプロの弁護士を効果的に支援することさえできないことが最近の研究で明らかになりました。
最大の懸念は、AI が虚偽の情報を捏造することが多く、特に事実の証拠に依存する業界では大きな問題となることです。イェール大学とスタンフォード大学の研究チームは、一般的な大規模言語モデルの幻覚率を分析したところ、関連する法的情報を正確に取得または生成できなかったり、さまざまな法律を理解して推論したりしていないことが多いことが判明しました。
実際、現在 ChatGPT の無料版を支えている OpenAI の GPT-3.5 は、さまざまなタスクにわたってテストした場合、約 69 パーセントの確率で幻覚を起こします。以前にGoogleのBardチャットボットの背後にあったシステムであるPaLM-2と、Metaによってリリースされた大規模言語モデルであるLlama 2では、結果はさらに悪く、それぞれ72パーセントと88パーセントの割合で虚偽を生成した。
当然のことながら、モデルは簡単なタスクではなく、より複雑なタスクを完了するのに苦労します。たとえば、さまざまな訴訟を比較し、ある問題について同意するかどうかを確認するよう AI に依頼するのは困難であり、訴訟がどの裁判所に提起されたかを確認するなどの簡単なタスクに直面した場合よりも、不正確な情報が生成される可能性が高くなります。
LLM は大量のテキストの処理に優れており、人間の弁護士が一生かけて読むことのできる量を超える膨大な量の法的文書について訓練を受けることができますが、法律を理解しておらず、健全な議論を行うことができません。
「この種のモデルがコーディングや数学の問題における演繹的推論の形で非常に大きな進歩を遂げるのを私たちは見てきましたが、それは一流の弁護士を特徴づける種類のスキルセットではありません」と共著者のダニエル・ホーは言う。 エール大学とスタンフォード大学の論文、教えて 登録.
「弁護士が本当に得意なこと、また得意とすることは、判例に基づいて推論する、コモンロー制度における類推の一形態としてよく説明されます」とスタンフォード大学人間中心研究所の副所長であるホー氏は付け加えた。人工知能。
機械は単純なタスクでも失敗することがよくあります。事件が本物かどうかを確認するために名前や引用を検査するよう求められた場合、GPT-3.5、PaLM-2、および Llama 2 は応答で偽の情報をでっち上げる可能性があります。
「モデルがその質問に正しく答えるために、法律について何も知る必要はありません。必要なのは、ケースが存在するかどうかを知ることだけで、トレーニング コーパスのどこにでもそれを確認できるのです」とイェール大学の法学博士課程の学生、マシュー ダール氏は言います。
これは、AI が情報を正確に取得することさえできず、テクノロジーの能力には根本的な限界があることを示しています。これらのモデルは、多くの場合、快適で役に立つように準備されています。彼らは通常、ユーザーの思い込みを修正することを気にせず、代わりにユーザーの側に立つことになります。たとえば、チャットボットが何らかの法的議論を裏付ける訴訟のリストを作成するように求められた場合、チャットボットは何も答えないよりも訴訟をでっち上げる傾向が高くなります。二人の弁護士は、このことを苦労して学んだ。 制裁 裁判所への提出書類の中で、OpenAI の ChatGPT によって完全にでっち上げられた訴訟を引用したことに対して。
研究者らはまた、テストした 3 つのモデルは、小規模で権限の低い裁判所に関する局所的な訴訟手続きと比較して、米国最高裁判所に関連する連邦訴訟に精通している可能性が高いことも発見しました。
GPT-3.5、PaLM-2、および Llama 2 はインターネットから収集したテキストでトレーニングされているため、他の種類で提出された法的文書と比較して、公的に公開されている米国最高裁判所の法的見解により精通していることは当然です。アクセスが容易ではない裁判所。
また、彼らは、古い事件や新しい事件からの情報を思い出す作業に苦労する可能性が高かった。
同紙によると、「幻覚は最高裁判所の最古および最新の訴訟で最も一般的であり、戦後のウォーレン裁判所の訴訟(1953年から1969年)では最も一般的ではない」とのこと。 「この結果は、ユーザーが認識すべき、LLM の法的知識に対する別の重要な制限を示唆しています。LLM のピークパフォーマンスは、現在の法理よりも数年遅れている可能性があり、LLM は、非常に古いがまだ適用可能な判例法を社内に取り入れることができない可能性があります」および関連法。」
AIが多すぎると「モノカルチャー」が生まれる可能性がある
研究者らはまた、これらのシステムに過度に依存すると、合法的な「モノカルチャー」が生まれる可能性があると懸念していた。 AI は限られた量のデータに基づいてトレーニングされるため、弁護士が他の法的解釈や関連判例を無視することになる、より著名でよく知られた事件を参照することになります。彼らは、訴訟において重要であることが判明する可能性がある、異なる視点や議論を理解するのに役立つ可能性のある他の訴訟を見逃してしまう可能性があります。
「法律自体は一枚岩ではありません」とダール氏は言う。 「モノカルチャーは法的な場面では特に危険です。米国には連邦コモンロー制度があり、法域が異なると州ごとに法律の発展が異なります。時間の経過とともに発展する、法学のさまざまな路線や傾向があります。」
「それは誤った結果や不当な信頼につながり、実際に訴訟当事者に損害を与える可能性があります」とホー氏は付け加えた。同氏は、モデルが弁護士や立ち退き法のようなものを理解しようとしている人々に対して不正確な応答を生成する可能性があると説明した。
「大規模な言語モデルの助けを求めると、申請期限がいつなのか、あるいはこの州における立ち退きのルールはどのようなものなのかについて、全く間違った答えが得られるかもしれません」と彼は例を挙げて言う。 「なぜなら、あなたに伝えているのは、あなたの司法管轄区の特定の状況にとって実際に重要な法律ではなく、ニューヨーク州の法律またはカリフォルニア州の法律だからです。」
研究者らは、この種の一般的なモデルを法的業務に使用するリスクは、特に専門知識が少なく、誤った仮定に基づいてモデルをクエリしている場合、小規模な州の下級裁判所に書類を提出する人にとって最も高いと結論付けています。これらの人々は弁護士である可能性が高く、リソースが少ない小規模法律事務所からの力が弱いか、自分自身の代理人を探している人々です。
「要するに、LLM から最も利益を得る人々のリスクが最も高いことがわかりました」と論文は述べています。 ®
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://go.theregister.com/feed/www.theregister.com/2024/01/10/top_large_language_models_struggle/
- :持っている
- :は
- :not
- :どこ
- $UP
- 7
- 72
- a
- 私たちについて
- アクセス
- アクセス可能な
- 従った
- 正確な
- 正確にデジタル化
- 越えて
- 実際に
- 追加されました
- 追加
- 再び
- AI
- また
- 間で
- 量
- 金額
- an
- 分析する
- および
- 別の
- 回答
- どれか
- 何でも
- どこにでも
- 適用可能な
- です
- 引数
- 引数
- 人工の
- 人工知能
- AS
- 質問
- アシスト
- 仲間
- 前提条件
- At
- オートマチック
- 知って
- バー
- ベース
- BE
- なぜなら
- 背後に
- 恩恵
- 最大の
- 悩まします
- 画期的な
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- カリフォルニア州
- 缶
- 機能
- できる
- 場合
- 例
- 挑戦
- 特徴付ける
- チャットボット
- チャットボット
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- チェック
- 点検
- 状況
- CO
- 共著者
- コーディング
- コマンドと
- コモンロー
- 比較します
- 比べ
- コンプリート
- 完全に
- 複雑な
- 懸念
- 心配
- について
- 結論
- 可能性
- 裁判所
- 法廷ファイリング
- 裁判所
- 作ります
- 重大な
- 電流プローブ
- 現在の状態
- 現在
- 危険な
- Daniel Mölk
- データ
- 記載された
- 開発する
- 開発
- 異なります
- 異なって
- 取締役
- do
- ドキュメント
- doesnの
- ドン
- 原因
- 容易
- 簡単に
- 効果的に
- エンパワー
- 公平な
- 特に
- さらに
- 証拠
- 試験
- 例
- Excel
- 存在
- 高価な
- 専門知識
- 説明
- 直面して
- 実際
- フェイル
- 偽
- false
- 偽り
- おなじみの
- 連邦政府の
- より少ない
- 提出
- ファイリング
- もう完成させ、ワークスペースに掲示しましたか?
- 企業
- フォーム
- フォーム
- 発見
- 無料版
- 新鮮な
- から
- 基本的な
- 生成する
- 生成された
- 生々しい
- 生成AI
- 受け
- 良い
- でログイン
- 素晴らしい
- ハード
- 害
- 持ってる
- he
- 助けます
- 役立つ
- 最高
- 正直に
- しかしながら
- HTTPS
- 巨大な
- 人間
- if
- 無視する
- 重要
- in
- その他の
- 不正確
- 産業を変えます
- info
- 情報
- を取得する必要がある者
- 機関
- インテリジェンス
- インターネット
- 発明された
- 関係する
- 問題
- IT
- ITS
- 自体
- JPG
- 管轄
- 管轄区域
- ただ
- 正義
- 種類
- 知っている
- 知識
- ラベル
- 言語
- 大
- 法律
- 法律事務所
- 法制
- 訴訟
- 弁護士
- 弁護士
- つながる
- 主要な
- 学んだ
- 最低
- ツェッペリン
- リーガルポリシー
- 法的手続き
- less
- 一生
- ような
- 可能性が高い
- LIMIT
- 制限
- 限定的
- ライン
- リスト
- 訴訟
- ラマ
- 探して
- 下側
- make
- 作る
- 作成
- math
- 事態
- マシュー
- 五月..
- Meta
- かもしれない
- モデル
- 一枚岩
- 他には?
- 最も
- ずっと
- 名
- 必要
- ニーズ
- 新作
- ニューヨーク
- 最新
- 何も
- of
- 頻繁に
- 古い
- 最も古い投稿
- on
- もの
- OpenAI
- 意見
- 反対した
- or
- その他
- 成果
- が
- ペア
- 紙素材
- 事務処理
- 特定の
- 特に
- 通過
- ピーク
- のワークプ
- パーセント
- パフォーマンス
- 視点
- 博士号
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 人気
- 強力な
- 力
- 前に
- 問題
- 問題
- Proceedings
- 処理
- 作り出す
- プロ
- 著名な
- 受験する
- 公然と
- 公表
- 追求する
- 質問
- 価格表
- 読む
- リアル
- 現実
- 本当に
- 理由
- 思い出す
- 最近
- 参照する
- 関連する
- リリース
- 関連した
- 依存
- 表す
- 研究
- 研究者
- リソース
- それぞれ
- 反応します
- 回答
- 結果
- 結果
- リスク
- ルール
- s
- 言う
- Seek
- 見て
- センス
- セッションに
- 設定
- いくつかの
- ショート
- すべき
- 示されました
- 示す
- 作品
- 側
- 簡単な拡張で
- から
- 技能
- より小さい
- 一部
- 何か
- すぐに
- 音
- スタンフォード
- スタンフォード大学
- 都道府県
- 米国
- まだ
- ストライド
- 奮闘
- 学生
- 勉強
- そのような
- 提案する
- サポート
- 最高
- 最高裁判所
- システム
- テーブル
- 仕事
- タスク
- チーム
- テクノロジー
- 技術の
- 占い
- 伝える
- 傾向があります
- テスト
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- より
- それ
- 法律
- 世界
- アプリ環境に合わせて
- それら
- 自分自身
- そこ。
- ボーマン
- 彼ら
- 考える
- この
- それらの
- 三
- 時間
- 〜へ
- あまりに
- top
- 訓練された
- トレーニング
- トレンド
- わかる
- ユナイテッド
- 米国
- 大学
- 不当
- に
- us
- users
- 通常
- さまざまな
- Ve
- バージョン
- 非常に
- ウォーレン
- ました
- 仕方..
- we
- 周知
- した
- この試験は
- 何ですか
- いつ
- かどうか
- which
- while
- 誰
- 意志
- 勝った
- 世界
- もっと悪い
- でしょう
- 間違った
- 年
- 年
- ヨーク
- You
- あなたの
- ゼファーネット