ChatGPT เพิ่มความสามารถด้านเสียงและรูปภาพ

ChatGPT เพิ่มความสามารถด้านเสียงและรูปภาพ

ไทเลอร์ ครอส ไทเลอร์ ครอส
เผยแพร่เมื่อ: September 28, 2023
ChatGPT เพิ่มความสามารถด้านเสียงและรูปภาพ

OpenAI บริษัทปัญญาประดิษฐ์ เปิดตัวฟีเจอร์ใหม่ที่สำคัญหลายประการให้กับโมเดล ChatGPT AI

OpenAI เป็นโปรแกรมปัญญาประดิษฐ์ที่ได้รับความนิยมอย่างล้นหลามเมื่อต้นปีนี้ แต่ถูกจำกัดอยู่เพียงการสื่อสารแบบข้อความนับตั้งแต่เปิดตัว แม้ว่าจะยังคงได้รับการอัปเดตจำนวนมาก (เช่น การเปลี่ยนจาก ChatGPT 3.5 เป็น 4.0) แต่ก็ยังไม่ได้รับฟีเจอร์ใดๆ ในการสื่อสารนอกข้อความจนกระทั่งบัดนี้

“ChatGPT สามารถมองเห็น ได้ยิน และพูดได้แล้ว” OpenAI กล่าวในบล็อกโพสต์ใหม่ล่าสุด

ในอีกสองสัปดาห์ข้างหน้า OpenAI กำลังเปิดตัวเสียงและรูปภาพสำหรับผู้ใช้ ChatGPT Plus และ Enterprise ตอนนี้คุณสามารถสนทนาได้เต็มรูปแบบด้วย ChatGPT โดยใช้เสียงสังเคราะห์ รวมถึงส่งรูปภาพในการแชทได้ทันที

“ความสามารถด้านเสียงใหม่ขับเคลื่อนโดยโมเดลการอ่านออกเสียงข้อความใหม่ ซึ่งสามารถสร้างเสียงเหมือนมนุษย์จากเพียงข้อความและคำพูดตัวอย่างเพียงไม่กี่วินาที” OpenAI เขียน

บล็อกมีตัวอย่างเสียง — แม้ว่าจะยังเป็นหุ่นยนต์อยู่บ้าง แต่ก็มีมากกว่านั้นมาก

เหมือนจริงมากกว่าแอปพลิเคชันแปลงข้อความเป็นคำพูดมากมาย

ขณะนี้สามารถส่งรูปภาพไปยังแชทได้ทันที และ ChatGPT จะวิเคราะห์รูปภาพเพื่อพยายามทำความเข้าใจสิ่งที่คุณส่งไป คุณสามารถส่งอะไรก็ได้ตั้งแต่ภาพวาดไปจนถึงกราฟที่ให้ข้อมูล จากนั้น ChatGPT จะจดจำและสามารถรวมเข้ากับแชทได้

คุณจะสามารถเลือกใช้ฟีเจอร์เสียงใหม่ได้ผ่านเมนูการตั้งค่าเมื่อเปิดตัวแล้ว

โปรดทราบว่าแม้รูปภาพจะพร้อมใช้งานบนทุกแพลตฟอร์ม แต่มีเพียง Android และ iOS เท่านั้นที่มีความสามารถด้านเสียง อย่างไรก็ตาม ยังมีข้อจำกัดอยู่บ้าง ChatGPT ยังคงมีปัญหาในการประมวลผลภาษานอกเหนือจากภาษาอังกฤษ และไม่ควรขึ้นอยู่กับกิจกรรมที่มีความเสี่ยงสูง

OpenAI วางแผนที่จะขยายฟีเจอร์เหล่านี้ทีละน้อย เพื่อหลีกเลี่ยงความเสี่ยงที่อาจเกิดขึ้น

“เราเชื่อในการทำให้เครื่องมือของเราพร้อมใช้งานทีละน้อย ซึ่งช่วยให้เราสามารถปรับปรุงและปรับแต่งการลดความเสี่ยงเมื่อเวลาผ่านไป ขณะเดียวกันก็เตรียมทุกคนให้พร้อมสำหรับระบบที่มีประสิทธิภาพมากขึ้นในอนาคต”

ประทับเวลา:

เพิ่มเติมจาก นักสืบความปลอดภัย