หลัก คิดค้น AI แปลงข้อความเป็นคำพูดใหม่ของ Google ดีมาก เราพนันได้เลยว่าคุณไม่สามารถบอกได้จากมนุษย์จริงๆ

AI แปลงข้อความเป็นคำพูดใหม่ของ Google ดีมาก เราพนันได้เลยว่าคุณไม่สามารถบอกได้จากมนุษย์จริงๆ

ดวงชะตาของคุณในวันพรุ่งนี้

คุณสามารถบอกความแตกต่างระหว่างคำพูดของคอมพิวเตอร์ที่สร้างโดย AI กับมนุษย์ที่มีชีวิตจริงได้หรือไม่? บางทีคุณอาจเคยคิดว่าคุณทำได้ บางทีคุณอาจชอบ Alexa และ Siri แต่เชื่อว่าคุณจะไม่มีวันสับสนระหว่างพวกเขากับผู้หญิงที่แท้จริง

สิ่งต่าง ๆ กำลังจะได้รับความสนใจมากขึ้น วิศวกรของ Google ทำงานอย่างหนักเพื่อสร้างระบบอ่านออกเสียงข้อความที่เรียกว่า ทาโคตรอน 2 . ตามที่ กระดาษ ที่เผยแพร่ในเดือนนี้ ระบบจะสร้างสเปกโตรแกรมของข้อความเป็นอันดับแรก การแสดงภาพว่าคำพูดควรออกมาเป็นอย่างไร รูปภาพนั้นใช้อัลกอริธึม WaveNet ที่มีอยู่ของ Google ซึ่งใช้รูปภาพเพื่อสร้างเสียงพูดของมนุษย์ที่เป็นธรรมชาติอย่างยิ่ง

เพอร์เนล โรเบิร์ตส์ อายุเมื่อตาย

โดยใช้วิธีนี้ นักวิจัยรายงานว่า 'แบบจำลองของเราได้คะแนนความคิดเห็นเฉลี่ย (MOS) 4.53 เทียบได้กับ MOS ที่ 4.58 สำหรับการพูดที่บันทึกไว้อย่างมืออาชีพ' (คะแนนความคิดเห็นเฉลี่ยคือคำศัพท์ด้านโทรคมนาคมที่วัดว่าเสียงบางอย่างดูสมจริงเพียงใด)

ตามที่ตัวอย่างเสียงของ Google แสดงให้เห็น Tacotron 2 สามารถตรวจจับความแตกต่างระหว่างคำนาม 'ทะเลทราย' และ 'ทะเลทราย' จากบริบท รวมถึงคำนาม 'ปัจจุบัน' และคำกริยา 'ปัจจุบัน' และปรับเปลี่ยนการออกเสียงตามนั้น มันสามารถเน้นคำที่เป็นตัวพิมพ์ใหญ่และใช้การผันที่เหมาะสมเมื่อถามคำถามแทนที่จะพูด

และสามารถสร้างข้อความที่ฟังดูคล้ายกับคำพูดของมนุษย์จนยากหรือเป็นไปไม่ได้ที่จะทราบความแตกต่าง ถ้าอยากรู้ว่ายากแค่ไหนเข้าไปที่ Google's หน้าตัวอย่างเสียง และเลื่อนลงไปที่ชุดตัวอย่างสุดท้ายที่ชื่อว่า 'Tacotron 2 or Human?' คุณจะพบกับ Tacotron 2 และคนจริง ๆ ที่พูดประโยคเช่น 'ผู้หญิงคนนั้นทำวิดีโอเกี่ยวกับลิปสติก Star Wars'

SPOILER ALERT: ในการทดสอบตัวเอง ให้ฟังตัวอย่างและเดาว่าอันไหนก่อนอ่านคอลัมน์ที่เหลือ

แล้วตัวอย่างใดที่เป็นข้อความเป็นคำพูดและตัวอย่างใดเป็นเสียงมนุษย์ที่แท้จริง วิศวกรของ Google ไม่ได้กล่าวไว้ แต่พวกเขาทิ้งเบาะแสที่ใหญ่มากไว้ ตัวอย่างไฟล์ .wav แต่ละรายการมีชื่อไฟล์ที่มีคำว่า 'gen' หรือ 'gt' จากรายงานดังกล่าว มีความเป็นไปได้สูงที่ 'gen' จะระบุคำพูดที่สร้างโดย Tacotron 2 และ 'gt' เป็นคำพูดของมนุษย์จริงๆ ('GT' น่าจะหมายถึง 'ความจริงพื้น' ซึ่งเป็นคำศัพท์การเรียนรู้ของเครื่องที่โดยทั่วไปหมายถึง 'ข้อตกลงที่แท้จริง')

สมมติว่าสิ่งนี้ถูกต้อง นี่คือคำตอบสำหรับการทดสอบ:

เจนนิเฟอร์ เน็ทเทิลส์ ราคาเท่าไหร่

'ผู้หญิงคนนั้นทำวิดีโอเกี่ยวกับลิปสติกของ Star Wars'

ตัวอย่างที่ 1: มนุษย์ที่แท้จริง

ตัวอย่างที่ 2: Tacotron 2

'เธอได้รับปริญญาเอกด้านสังคมวิทยาจากมหาวิทยาลัยโคลัมเบีย'

ตัวอย่างที่ 1: Tacotron 2

ตัวอย่างที่ 2: มนุษย์ที่แท้จริง

'จอร์จ วอชิงตันเป็นประธานาธิบดีคนแรกของสหรัฐอเมริกา'

ตัวอย่างที่ 1: Tacotron 2

ตัวอย่างที่ 2: มนุษย์ที่แท้จริง

evelyn lozada วันเดือนปีเกิด

'ฉันยุ่งเกินไปสำหรับเรื่องรัก ๆ ใคร่ ๆ'

ตัวอย่างที่ 1: มนุษย์ที่แท้จริง

ตัวอย่างที่ 2: Tacotron 2

ถูกกี่ข้อ? และคุณสามารถบอกความแตกต่างได้จริงๆ หรือคุณแค่ต้องเดา

บทความที่น่าสนใจ