ChatGPT は音声と画像機能を追加します

ChatGPT は音声と画像機能を追加します

タイラー・クロス タイラー・クロス
発行日: 2023 年 9 月 28 日
ChatGPT は音声と画像機能を追加します

人工知能企業である OpenAI は、ChatGPT AI モデルにいくつかの重要な新機能を導入しています。

OpenAI は、今年初めに爆発的に人気が高まった人工知能プログラムですが、その開始以来、テキストベースのコミュニケーションに限定されてきました。 大規模なアップデート (ChatGPT 3.5 から 4.0 への移行など) が続いていますが、これまでテキスト以外で通信する機能は提供されていませんでした。

OpenAIは最新のブログ投稿で「ChatGPTは目で見て、聞いて、話すことができるようになった」と述べた。

今後 XNUMX 週間にわたって、OpenAI は ChatGPT Plus および Enterprise ユーザー向けに音声と画像を展開します。 合成音声を使用して ChatGPT と完全な会話をしたり、チャット内で直接画像を送信したりできるようになりました。

「新しい音声機能は、新しいテキスト読み上げモデルを活用しており、テキストと数秒のサンプル音声だけから人間のような音声を生成できます」とOpenAIは書いている。

そのブログではサンプル音声が提供されています。まだ多少ロボットっぽいですが、それははるかに優れています。

多くのテキスト読み上げアプリケーションよりもリアルです。

画像をチャットに直接送信することもできるようになり、ChatGPT は送信内容を理解するために画像を分析します。 絵画から有益なグラフまで何でも送信でき、ChatGPT がそれを認識してチャットに組み込むことができます。

新しい音声機能がリリースされたら、設定メニューからオプトインできるようになります。

画像はすべてのプラットフォームで利用できますが、音声機能があるのは Android と iOS だけであることに注意してください。 ただし、まだいくつかの制限があります。 ChatGPT は依然として英語以外の言語の処理に問題があるため、リスクの高いアクティビティには依存すべきではありません。

OpenAI は、潜在的なリスクを回避するために、これらの機能を段階的に拡張する予定です。

「私たちは、ツールを段階的に利用できるようにすることで、時間をかけて改良を加えてリスク軽減を改善できると同時に、将来的にはより強力なシステムに向けて全員が準備できるようにすると信じています。」

タイムスタンプ:

より多くの 安全探偵