Specetral Subtraction Technique

จาก ChulaPedia

การปรับปรุง เมื่อ 07:27, 27 กรกฎาคม 2556 โดย 54704379 (พูดคุย | เรื่องที่เขียน)
(ต่าง) ←รุ่นก่อนหน้า | รุ่นปัจจุบัน (ต่าง) | รุ่นถัดไป→ (ต่าง)
ข้ามไปที่: นำทาง, สืบค้น

ในสภาพแวดล้อมรถยนต์ สมรรถนะของการโทรศัพท์แบบไม่ใช้มือถูกรบกวนด้วยสัญญาณรบกวนต่างๆ ได้แก่ เสียงเครื่องยนต์ เสียงลม และเสียงพูดคุยจอแจ เป็นต้น เทคนิคการลดสัญญาณรบกวนจึงมีความจาเป็นต่ออุปกรณ์ของระบบการโทรศัพท์แบบไม่ใช้มือ เพื่อปรับปรุงคุณภาพของสัญญาณเสียงพูดและการสื่อสารทางเสียงที่มีความถูกต้อง

เทคนิคการลดสัญญาณรบกวนได้รับการพัฒนามาอย่างต่อเนื่อง จึงทำให้เกิดขั้นตอนวิธีต่าง ๆ ขึ้นเป็นจำนวนมาก จากการศึกษางานวิจัยที่เกี่ยวข้องพบว่า เทคนิคการลดสัญญาณรบกวนสามารถแบ่งย่อยตามการประมวลผลคือ การประมวลผลในโดเมนความถี่ และการประมวลผลในโดเมนเวลา โดยที่การลดเสียงรบกวนที่ประมวลผลในโดเมนเวลา เรียกว่าการกำจัดสัญญาณรบกวนโดยใช้ตัวกรองปรับตัว (Adaptive Noise Cancelation, ANC) ไม่เกิดความผิดเพี้ยนของสัญญาณเสียงแต่มีความซับซ้อนสูง และ การลดเสียงรบกวนที่ใช้ในโดเมนความถี่นั้นมีข้อดีคือมีความซับซ้อนต่ำแต่ก็อาจเกิดความผิดเพี้ยนของสัญญาณเสียงได้ ในบทความนี้จะกล่าวถึงการลดสัญญาณรบกวนที่ทำงานในโดเมนความถี่ ที่เรียกว่าเทคนิคการลบทางสเปกตรัม (Spectral Subtraction, SS)

เทคนิคการลดเสียงรบกวนที่ใช้ในโดเมนความถี่ สำหรับการลดสัญญาณรบกวนโดยอาศัยไมโครโฟน 1 ตัวที่ทำงานในโดเมนความถี่นั้น เทคนิคที่เป็นที่นิยมใช้กันมากคือเทคนิคการลบทางสเปกตรัม (Spectral subtraction technique, SS) วิธีนี้มีหลักการคือจะทำการประมาณสเปกตรัมของสัญญาณรบกวน (Noise spectrum) แล้วนำมาลบออกจากสเปกตรัมของสัญญาณเสียงพูดที่ปนด้วยสัญญาณรบกวน (Noisy Spectrum) ซึ่งสเปกตรัมของสัญญาณรบกวนนี้จะถูกประมาณจากช่วงที่ไม่มีกิจกรรมของเสียงพูด ซึ่งวิธี SS สามารถอธิบายได้ดังนี้

เทคนิคการลบสเปกตรัม (Spectral Subtraction Technique, SS) สำหรับการลดสัญญาณรบกวนเพื่อเพิ่มคุณภาพของสัญญาณเสียงพูดในระบบสนทนาหนึ่งๆ จะสามารถทำได้ โดยทำการประมาณสเปกตรัมของสัญญาณรบกวน แล้วลบออกจากสเปกตรัมของสัญญาณเสียงพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ทั้งนี้วิธีการ SS นี้จะขึ้นกับความแม่นยำของการประมาณค่าสเปกตรัมของสัญญาณรบกวน โดยถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมานั้นมีค่าใกล้เคียงกับสเปกตรัมของสัญญาณรบกวนจริง จะทำให้ระบบสามารถลบสัญญาณรบกวนออกได้อย่างมีประสิทธิภาพ แต่ถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมามีความผิดพลาด เช่นมีค่ามากเกินไป โดยเฉพาะอย่างยิ่งบางองค์ประกอบความถี่ จะมีผลกระทบกับสัญญาณเสียงพูดต้นฉบับ (Original signal) ณ ความถี่นั้นๆ กล่าวคือจะทำให้องค์ประกอบสัญญาณเสียงพูดบางความถี่ขาดหายไป แต่ในทางกลับกันถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมานั้น มีค่าน้อยเกินไปจะทำให้ระบบไม่สามารถลบสัญญาณรบกวนออกไปได้อย่างมีประสิทธิภาพ

ดังนั้นการประมาณสเปกตรัมของสัญญาณรบกวนให้เหมาะสมจึงมีความสำคัญมากเพื่อให้ได้สัญญาณเสียงพูดที่มีความเพี้ยนไปจากสัญญาณต้นฉบับน้อยที่สุด ซึ่งค่าประมาณสเปกตรัมของสัญญาณเสียงพูดจะหาได้จากการนำขนาดของค่าประมาณสเปกตรัมของสัญญาณรบกวนลบออกจากสเปกตรัมของสัญญาณพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ซึ่งวิธี SS จะพิจารณาเฉพาะขนาดของสเปกตรัมโดยไม่นำเฟสมาพิจารณา เนื่องจากหูมนุษย์มีความไวต่อขนาดมากกว่าเฟส

ขั้นตอนวิธีการลบสเปกตรัม ภาพรวมของวิธีการลบสเปกตรัม โดยเริ่มจากสัญญาณขาเข้าในที่นี้คือสัญญาณเสียงพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ผ่านวิธีการแปลงกลับของฟูริเยร์แบบไม่ต่อเนื่องผกผันในช่วงเวลาสั้นจะได้สเปกตรัมสัญญาณเสียงพูดที่ปนเปื้อนด้วยสัญญาณรบกวน จากนั้นหาค่าประมาณสเปกตรัมของสัญญาณรบกวนและนำไปหักออกจากสเปกตรัมของสัญญาณเสียงพูดขาเข้า สำหรับค่าประมาณสเปกตรัมของสัญญาณเสียงพูดที่ได้จากสมการที่ ในกรณีที่ถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้น ณ ความถี่ใดๆ มีค่ามากกว่าสเปกตรัมของสัญญาณเสียงที่ปนด้วยสัญญาณรบกวน เมื่อนำไปผ่านการลบทางสเปกตรัมตามสมการที่ อาจมีผลลัพธ์เป็นค่าลบได้ ซึ่งจะไม่เกิดขึ้นกับขนาดหรือสเปกตรัมกำลัง เพื่อแก้ปัญหานี้จึงต้องใช้ฟังก์ชันต่อไปนี้ ดังแสดงในรูป บล็อกหลังการลบ (Post Subtraction) เพื่อป้องกันการประมาณสเปกตรัมแล้วได้ขนาดเป็นลบ

จากนั้นหาค่าประมาณของสัญญาณเสียงพูดที่ถูกหักลบสเปกตรัมของสัญญาณรบกวนออกแล้วโดยใช้การแปลงกลับของฟูริเยร์แบบไม่ต่อเนื่องผกผันในช่วงเวลาสั้น (Inverse Short-Time Discrete Fourier Transform) ข้อดีของวิธี SS นี้คือ มีการทำงานที่ง่ายและราคาถูก แต่มีข้อจำกัดคือ ไม่เหมาะสมกับการลดสัญญาณรบกวนแบบไม่คงที่ เช่นเสียงพูดคุย

เครื่องมือส่วนตัว