ChatGPT は、新人の一連の地味な C/C++ プログラミング タスクを通じてテストされ、栄誉とは言えませんでしたが、合格しました。
クロアチアの研究チームによると、XNUMX年生は一部の課題に苦戦する可能性があるが、 結果 [PDF] は、ChatGPT が平均と経験豊富なプログラマーのレベルの間の熟練度目標を達成していることを示しました。 そして当然のことながら、すべての大学試験と同様に、結果は質問の表現方法によって決まります。
ノース大学のスタッフは、大学の新入生レベルの一連のプログラミング課題を設計しました。最初は英語で書かれ、その後、言語間のニュアンスが結果に影響を与えるかどうかを確認するためにクロアチア語で書かれました。 彼らは、ChatGPT がどのようにコーディングするかだけでなく、それがさまざまな言語に適応できるかどうかも確認したいと考えていました。
最初のクイズは、XNUMX つの数値の最大公約数 (GCD) を計算するという基本的なプログラミング タスクに焦点を当てました。 当初、このボットは問題への取り組みを決定する方法にいくつかの限界を示しており、研究者らはこのボットには熟練のプログラマーに期待される精緻さが欠けていたと述べた。 しかし、他の学生と同じように、学習し、その後の試行を通じて、特にクロアチア語バージョンでは、いくつかの改善を示し、顕著な適応性を示しました。
たとえば、ある特定のタスクでは、C++ で基本的な統計関数をプログラムするという課題がありました。 当初は、必要に応じて「補正された」標準偏差を生成しない関数を使用するという見落としがありました。 しかし、同じタスクがクロアチア語で提示されたとき、チャットボットは以前のエラーを認識しただけでなく、洗練された解決策を見つけ出しました。
研究者らは、この適応力は新入生の歩みを反映している、つまり間違いから始まるが、繰り返しの練習とフィードバックによって学び、スキルを向上させる能力を示していると指摘している。 ああ、すごい。
もう XNUMX つのタスクには、特定の割り算ルールに基づいて範囲内の数値を識別するという、より微妙な問題が含まれていました。 ここで、ChatGPT のアキレス腱が明らかになりました。 英語でもクロアチア語でも、言語に関係なく、ChattyG は負の数に苦労しました。 ChatGPT による各試行は同様の結果につながり、このタスクのプログラミング ロジックに一貫した問題があることがわかりました。
おまけの質問には正確さが求められました。 ChatGPT は、特に定義された範囲の XNUMX 進数に対して入力フィルターを作成するために必要でした。 英語で提示されたときの AI の最初の解決策は的を射ていましたが、次の試み、特にタスクがクロアチア語で与えられたとき、いくつかの矛盾が明らかになり、場合によっては ChatGPT が不必要なプログラミング構造を使用していました。 これらはプログラムの機能を妨げるものではありませんでしたが、最適化が欠如していることを示していました。 ChatGPT は、ショートカットが利用できる場合でも、目的地までのより長いルートを選択することがあるようでした。
配列に関連するタスクでは、事態はさらに複雑になります。 ここで、ChatGPT は数値を保存し、平均値、標準偏差などの特定の統計を計算し、最小値と最大値を特定するように求められました。 この課題における ChattyG のパフォーマンスは特に興味深いものでした。 さまざまなテストで、さまざまな戦略が示されました。 場合によっては、問題をエレガントに解決し、簡単な解決策を提供することもありました。 他の試みでは、より複雑なメソッドに傾き、複数の操作を XNUMX つの関数にバンドルすることもありました。
これらすべてが重要な疑問を引き起こします。ChatGPT は常に最適な戦略を選択するのでしょうか、それとも学習済みではあるが非効率な方法をデフォルトで使用する場合があるのでしょうか?
ChatGPT の最後のハードルは、基本的なテキスト処理に関係していました。 ユーザー入力から余分なスペースを削除するという使命がありました。 最初の英語テストでは、ChatGPT のソリューションは的を射ていました。 しかし、クロアチアのテストでは変化球が投げられた。 AI は、効果的な単一入力ソリューションに固執する代わりに、何らかの理由で、複数の入力を要求する、より複雑なアプローチを選択しました。 しかし、研究者たちがこの課題を英語で再検討したところ、ChatGPT は以前の失敗から学び、より単純な方法に戻ったようです。
全体として、研究者らは、その反応が人間の新入生プログラミング学生の反応と多くの共通点があることを発見しました。 そのソリューションは、経験豊富なプログラマーの戦略を反映することがよくありましたが、他の学生と同様に、ChatGPT も絶対確実というわけではありませんでした。 輝かしい瞬間もありましたが、完全に的外れに見える場面もありました。
ここでの本当のポイントは、人間の新入生のような適応力です。単に適切な解決策を見つけるだけではありませんでした。 それは洗練し、学習し、反復することでした。
それで、ChattyG の最終成績は何ですか?
研究者からは:
「ChatGPT は非常に良い成績で試験に合格し、ソリューションの品質においてほとんどの学生を上回りました。 さらに、各タスクを 20 ~ 30 秒以内に解決し、追加の要求に応じてソリューションを適応または変更する一般的な能力を示します。 しかし、一部の、多くの場合は単純なタスクでは、何度かエラーについてのメッセージが表示された後でも、問題の論理的および数学的本質を理解できないことが示されました。」 ®
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://go.theregister.com/feed/www.theregister.com/2023/10/03/chatgpt_code_college/
- :は
- :not
- :どこ
- 20
- 30
- 7
- a
- 能力
- 私たちについて
- 従った
- アキレス
- 越えて
- 適応する
- NEW
- 付着
- 影響を及ぼす
- 後
- AI
- すべて
- また
- 常に
- an
- および
- どれか
- アプローチ
- です
- AS
- At
- 試み
- 試み
- 利用できます
- 平均
- ベース
- 基本
- BE
- になりました
- さ
- BEST
- の間に
- ボーナス
- ロボット
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- C + +
- 計算
- 缶
- 一定
- 挑戦する
- 挑戦した
- 課題
- 変化する
- チャットボット
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- 選択する
- CO
- コード
- カレッジ
- コマンドと
- 複雑な
- 理解する
- 計算
- 整合性のある
- 訂正さ
- 可能性
- クラフト
- 決定しました
- デフォルト
- 定義済みの
- 求め
- 厳しい
- 需要
- 実証
- 設計
- デスティネーション
- 決定
- 偏差
- DID
- しなかった
- 異なります
- ありません
- 各
- エコー
- 効果的な
- 英語
- 高めます
- 完全に
- エラー
- エラー
- 特に
- 本質
- さらに
- 明らか
- 試験
- 例
- 予想される
- 経験豊かな
- 余分な
- フィードバック
- filter
- ファイナル
- フィネス
- 名
- 焦点を当て
- 発見
- から
- function
- 機能性
- さらに
- 受け
- 与えられた
- 良い
- だ
- グレード
- 最大
- 持っていました
- 持ってる
- こちら
- 邪魔する
- ヒッティング
- 名誉
- 認定条件
- しかしながら
- HTTPS
- 人間
- ハムドラム
- 識別する
- 識別
- if
- 重要
- 改善
- in
- その他の
- できないこと
- 示す
- 非効率的な
- 初期
- 当初
- 入力
- を取得する必要がある者
- 興味深い
- に
- 関係する
- 問題
- IT
- ITS
- 旅
- JPG
- ただ
- 欠如
- 言語
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 後で
- LEARN
- 学んだ
- 学習
- ツェッペリン
- ような
- 制限
- ロジック
- 論理的な
- より長いです
- たくさん
- 製
- マーク
- 数学的
- 意味する
- 方法
- メソッド
- 最小
- ミス
- モーメント
- 他には?
- 最も
- の試合に
- 負
- 次の
- ノース
- 注目すべき
- 番号
- of
- 提供すること
- 頻繁に
- on
- ONE
- の
- 業務執行統括
- 最適化
- or
- その他
- 私たちの
- でる
- 成果
- 優れたパフォーマンス
- 見落とし
- 特定の
- 特に
- 渡された
- パス
- パフォーマンス
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポイント
- 練習
- 精度
- PLM platform.
- 前
- 問題
- 処理
- 作り出す
- 演奏曲目
- プログラマー
- プログラマ
- プログラミング
- 置きます
- 品質
- 質問
- 質問
- 提起
- 範囲
- リアル
- 理由
- 認識
- 洗練された
- 精錬
- 関係なく
- 関連する
- 除去
- 繰り返される
- の提出が必要です
- 研究
- 研究者
- 回答
- 結果
- 返す
- 明らかに
- 右
- ルート
- ルール
- s
- 同じ
- 格言
- 味付け
- 秒
- 見えた
- シリーズ
- セッションに
- いくつかの
- ショーケース
- 示されました
- 作品
- 同様の
- 簡単な拡張で
- 簡単な
- スキル
- 溶液
- ソリューション
- 解決する
- 一部
- スペース
- 特定の
- 特に
- Spot
- 標準
- 起動
- 統計的
- 統計
- 店舗
- 簡単な
- 作戦
- 戦略
- 奮闘
- 学生
- 生徒
- それに続きます
- タックル
- 取り
- ターゲット
- 仕事
- タスク
- チーム
- test
- テスト
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- それ
- アプリ環境に合わせて
- その後
- そこ。
- ボーマン
- 彼ら
- この
- それらの
- しかし?
- 介して
- <font style="vertical-align: inherit;">回数</font>
- 〜へ
- 取った
- に向かって
- 2
- UNI
- 大学
- 不要
- 中古
- ユーザー
- 値
- 価値観
- 変化する
- バージョン
- 非常に
- 、
- wanted
- ました
- だった
- した
- この試験は
- いつ
- while
- 以内
- 働いていました
- でしょう
- 年
- まだ
- ゼファーネット