คุณสามารถบอกความแตกต่างระหว่างคำพูดของคอมพิวเตอร์ที่สร้างโดย AI กับมนุษย์ที่มีชีวิตจริงได้หรือไม่? บางทีคุณอาจเคยคิดว่าคุณทำได้ บางทีคุณอาจชอบ Alexa และ Siri แต่เชื่อว่าคุณจะไม่มีวันสับสนระหว่างพวกเขากับผู้หญิงที่แท้จริง
สิ่งต่าง ๆ กำลังจะได้รับความสนใจมากขึ้น วิศวกรของ Google ทำงานอย่างหนักเพื่อสร้างระบบอ่านออกเสียงข้อความที่เรียกว่า ทาโคตรอน 2 . ตามที่ กระดาษ ที่เผยแพร่ในเดือนนี้ ระบบจะสร้างสเปกโตรแกรมของข้อความเป็นอันดับแรก การแสดงภาพว่าคำพูดควรออกมาเป็นอย่างไร รูปภาพนั้นใช้อัลกอริธึม WaveNet ที่มีอยู่ของ Google ซึ่งใช้รูปภาพเพื่อสร้างเสียงพูดของมนุษย์ที่เป็นธรรมชาติอย่างยิ่ง
เพอร์เนล โรเบิร์ตส์ อายุเมื่อตาย
โดยใช้วิธีนี้ นักวิจัยรายงานว่า 'แบบจำลองของเราได้คะแนนความคิดเห็นเฉลี่ย (MOS) 4.53 เทียบได้กับ MOS ที่ 4.58 สำหรับการพูดที่บันทึกไว้อย่างมืออาชีพ' (คะแนนความคิดเห็นเฉลี่ยคือคำศัพท์ด้านโทรคมนาคมที่วัดว่าเสียงบางอย่างดูสมจริงเพียงใด)
ตามที่ตัวอย่างเสียงของ Google แสดงให้เห็น Tacotron 2 สามารถตรวจจับความแตกต่างระหว่างคำนาม 'ทะเลทราย' และ 'ทะเลทราย' จากบริบท รวมถึงคำนาม 'ปัจจุบัน' และคำกริยา 'ปัจจุบัน' และปรับเปลี่ยนการออกเสียงตามนั้น มันสามารถเน้นคำที่เป็นตัวพิมพ์ใหญ่และใช้การผันที่เหมาะสมเมื่อถามคำถามแทนที่จะพูด
และสามารถสร้างข้อความที่ฟังดูคล้ายกับคำพูดของมนุษย์จนยากหรือเป็นไปไม่ได้ที่จะทราบความแตกต่าง ถ้าอยากรู้ว่ายากแค่ไหนเข้าไปที่ Google's หน้าตัวอย่างเสียง และเลื่อนลงไปที่ชุดตัวอย่างสุดท้ายที่ชื่อว่า 'Tacotron 2 or Human?' คุณจะพบกับ Tacotron 2 และคนจริง ๆ ที่พูดประโยคเช่น 'ผู้หญิงคนนั้นทำวิดีโอเกี่ยวกับลิปสติก Star Wars'
SPOILER ALERT: ในการทดสอบตัวเอง ให้ฟังตัวอย่างและเดาว่าอันไหนก่อนอ่านคอลัมน์ที่เหลือ
แล้วตัวอย่างใดที่เป็นข้อความเป็นคำพูดและตัวอย่างใดเป็นเสียงมนุษย์ที่แท้จริง วิศวกรของ Google ไม่ได้กล่าวไว้ แต่พวกเขาทิ้งเบาะแสที่ใหญ่มากไว้ ตัวอย่างไฟล์ .wav แต่ละรายการมีชื่อไฟล์ที่มีคำว่า 'gen' หรือ 'gt' จากรายงานดังกล่าว มีความเป็นไปได้สูงที่ 'gen' จะระบุคำพูดที่สร้างโดย Tacotron 2 และ 'gt' เป็นคำพูดของมนุษย์จริงๆ ('GT' น่าจะหมายถึง 'ความจริงพื้น' ซึ่งเป็นคำศัพท์การเรียนรู้ของเครื่องที่โดยทั่วไปหมายถึง 'ข้อตกลงที่แท้จริง')
สมมติว่าสิ่งนี้ถูกต้อง นี่คือคำตอบสำหรับการทดสอบ:
เจนนิเฟอร์ เน็ทเทิลส์ ราคาเท่าไหร่
'ผู้หญิงคนนั้นทำวิดีโอเกี่ยวกับลิปสติกของ Star Wars'
ตัวอย่างที่ 1: มนุษย์ที่แท้จริง
ตัวอย่างที่ 2: Tacotron 2
'เธอได้รับปริญญาเอกด้านสังคมวิทยาจากมหาวิทยาลัยโคลัมเบีย'
ตัวอย่างที่ 1: Tacotron 2
ตัวอย่างที่ 2: มนุษย์ที่แท้จริง
'จอร์จ วอชิงตันเป็นประธานาธิบดีคนแรกของสหรัฐอเมริกา'
ตัวอย่างที่ 1: Tacotron 2
ตัวอย่างที่ 2: มนุษย์ที่แท้จริง
evelyn lozada วันเดือนปีเกิด
'ฉันยุ่งเกินไปสำหรับเรื่องรัก ๆ ใคร่ ๆ'
ตัวอย่างที่ 1: มนุษย์ที่แท้จริง
ตัวอย่างที่ 2: Tacotron 2
ถูกกี่ข้อ? และคุณสามารถบอกความแตกต่างได้จริงๆ หรือคุณแค่ต้องเดา