Specetral Subtraction Technique
จาก ChulaPedia
แถว 1: | แถว 1: | ||
ในสภาพแวดล้อมรถยนต์ สมรรถนะของการโทรศัพท์แบบไม่ใช้มือถูกรบกวนด้วยสัญญาณรบกวนต่างๆ ได้แก่ เสียงเครื่องยนต์ เสียงลม และเสียงพูดคุยจอแจ เป็นต้น เทคนิคการลดสัญญาณรบกวนจึงมีความจาเป็นต่ออุปกรณ์ของระบบการโทรศัพท์แบบไม่ใช้มือ เพื่อปรับปรุงคุณภาพของสัญญาณเสียงพูดและการสื่อสารทางเสียงที่มีความถูกต้อง | ในสภาพแวดล้อมรถยนต์ สมรรถนะของการโทรศัพท์แบบไม่ใช้มือถูกรบกวนด้วยสัญญาณรบกวนต่างๆ ได้แก่ เสียงเครื่องยนต์ เสียงลม และเสียงพูดคุยจอแจ เป็นต้น เทคนิคการลดสัญญาณรบกวนจึงมีความจาเป็นต่ออุปกรณ์ของระบบการโทรศัพท์แบบไม่ใช้มือ เพื่อปรับปรุงคุณภาพของสัญญาณเสียงพูดและการสื่อสารทางเสียงที่มีความถูกต้อง | ||
- | เทคนิคการลดสัญญาณรบกวนได้รับการพัฒนามาอย่างต่อเนื่อง จึงทำให้เกิดขั้นตอนวิธีต่าง ๆ ขึ้นเป็นจำนวนมาก จากการศึกษางานวิจัยที่เกี่ยวข้องพบว่า เทคนิคการลดสัญญาณรบกวนสามารถแบ่งย่อยตามการประมวลผลคือ การประมวลผลในโดเมนความถี่ และการประมวลผลในโดเมนเวลา โดยที่การลดเสียงรบกวนที่ประมวลผลในโดเมนเวลา เรียกว่าการกำจัดสัญญาณรบกวนโดยใช้ตัวกรองปรับตัว (Adaptive Noise Cancelation, ANC) ไม่เกิดความผิดเพี้ยนของสัญญาณเสียงแต่มีความซับซ้อนสูง และ การลดเสียงรบกวนที่ใช้ในโดเมนความถี่นั้นมีข้อดีคือมีความซับซ้อนต่ำแต่ก็อาจเกิดความผิดเพี้ยนของสัญญาณเสียงได้ ในบทความนี้จะกล่าวถึงการลดสัญญาณรบกวนที่ทำงานในโดเมนความถี่ | + | |
+ | เทคนิคการลดสัญญาณรบกวนได้รับการพัฒนามาอย่างต่อเนื่อง จึงทำให้เกิดขั้นตอนวิธีต่าง ๆ ขึ้นเป็นจำนวนมาก จากการศึกษางานวิจัยที่เกี่ยวข้องพบว่า เทคนิคการลดสัญญาณรบกวนสามารถแบ่งย่อยตามการประมวลผลคือ การประมวลผลในโดเมนความถี่ และการประมวลผลในโดเมนเวลา โดยที่การลดเสียงรบกวนที่ประมวลผลในโดเมนเวลา เรียกว่าการกำจัดสัญญาณรบกวนโดยใช้ตัวกรองปรับตัว (Adaptive Noise Cancelation, ANC) ไม่เกิดความผิดเพี้ยนของสัญญาณเสียงแต่มีความซับซ้อนสูง และ การลดเสียงรบกวนที่ใช้ในโดเมนความถี่นั้นมีข้อดีคือมีความซับซ้อนต่ำแต่ก็อาจเกิดความผิดเพี้ยนของสัญญาณเสียงได้ ในบทความนี้จะกล่าวถึงการลดสัญญาณรบกวนที่ทำงานในโดเมนความถี่ ที่เรียกว่า''เทคนิคการลบทางสเปกตรัม (Spectral Subtraction, SS)'' | ||
+ | |||
'''เทคนิคการลดเสียงรบกวนที่ใช้ในโดเมนความถี่''' | '''เทคนิคการลดเสียงรบกวนที่ใช้ในโดเมนความถี่''' | ||
สำหรับการลดสัญญาณรบกวนโดยอาศัยไมโครโฟน 1 ตัวที่ทำงานในโดเมนความถี่นั้น เทคนิคที่เป็นที่นิยมใช้กันมากคือเทคนิคการลบทางสเปกตรัม (Spectral subtraction technique, SS) วิธีนี้มีหลักการคือจะทำการประมาณสเปกตรัมของสัญญาณรบกวน (Noise spectrum) แล้วนำมาลบออกจากสเปกตรัมของสัญญาณเสียงพูดที่ปนด้วยสัญญาณรบกวน (Noisy Spectrum) ซึ่งสเปกตรัมของสัญญาณรบกวนนี้จะถูกประมาณจากช่วงที่ไม่มีกิจกรรมของเสียงพูด ซึ่งวิธี SS สามารถอธิบายได้ดังนี้ | สำหรับการลดสัญญาณรบกวนโดยอาศัยไมโครโฟน 1 ตัวที่ทำงานในโดเมนความถี่นั้น เทคนิคที่เป็นที่นิยมใช้กันมากคือเทคนิคการลบทางสเปกตรัม (Spectral subtraction technique, SS) วิธีนี้มีหลักการคือจะทำการประมาณสเปกตรัมของสัญญาณรบกวน (Noise spectrum) แล้วนำมาลบออกจากสเปกตรัมของสัญญาณเสียงพูดที่ปนด้วยสัญญาณรบกวน (Noisy Spectrum) ซึ่งสเปกตรัมของสัญญาณรบกวนนี้จะถูกประมาณจากช่วงที่ไม่มีกิจกรรมของเสียงพูด ซึ่งวิธี SS สามารถอธิบายได้ดังนี้ | ||
+ | |||
'''เทคนิคการลบสเปกตรัม (Spectral Subtraction Technique, SS)''' | '''เทคนิคการลบสเปกตรัม (Spectral Subtraction Technique, SS)''' | ||
- | สำหรับการลดสัญญาณรบกวนเพื่อเพิ่มคุณภาพของสัญญาณเสียงพูดในระบบสนทนาหนึ่งๆ จะสามารถทำได้ โดยทำการประมาณสเปกตรัมของสัญญาณรบกวน แล้วลบออกจากสเปกตรัมของสัญญาณเสียงพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ทั้งนี้วิธีการ SS นี้จะขึ้นกับความแม่นยำของการประมาณค่าสเปกตรัมของสัญญาณรบกวน โดยถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมานั้นมีค่าใกล้เคียงกับสเปกตรัมของสัญญาณรบกวนจริง จะทำให้ระบบสามารถลบสัญญาณรบกวนออกได้อย่างมีประสิทธิภาพ แต่ถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมามีความผิดพลาด เช่นมีค่ามากเกินไป โดยเฉพาะอย่างยิ่งบางองค์ประกอบความถี่ จะมีผลกระทบกับสัญญาณเสียงพูดต้นฉบับ (Original signal) ณ ความถี่นั้นๆ กล่าวคือจะทำให้องค์ประกอบสัญญาณเสียงพูดบางความถี่ขาดหายไป แต่ในทางกลับกันถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมานั้น มีค่าน้อยเกินไปจะทำให้ระบบไม่สามารถลบสัญญาณรบกวนออกไปได้อย่างมีประสิทธิภาพ ดังนั้นการประมาณสเปกตรัมของสัญญาณรบกวนให้เหมาะสมจึงมีความสำคัญมากเพื่อให้ได้สัญญาณเสียงพูดที่มีความเพี้ยนไปจากสัญญาณต้นฉบับน้อยที่สุด ซึ่งค่าประมาณสเปกตรัมของสัญญาณเสียงพูดจะหาได้จากการนำขนาดของค่าประมาณสเปกตรัมของสัญญาณรบกวนลบออกจากสเปกตรัมของสัญญาณพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ซึ่งวิธี SS จะพิจารณาเฉพาะขนาดของสเปกตรัมโดยไม่นำเฟสมาพิจารณา เนื่องจากหูมนุษย์มีความไวต่อขนาดมากกว่าเฟส | + | สำหรับการลดสัญญาณรบกวนเพื่อเพิ่มคุณภาพของสัญญาณเสียงพูดในระบบสนทนาหนึ่งๆ จะสามารถทำได้ โดยทำการประมาณสเปกตรัมของสัญญาณรบกวน แล้วลบออกจากสเปกตรัมของสัญญาณเสียงพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ทั้งนี้วิธีการ SS นี้จะขึ้นกับความแม่นยำของการประมาณค่าสเปกตรัมของสัญญาณรบกวน โดยถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมานั้นมีค่าใกล้เคียงกับสเปกตรัมของสัญญาณรบกวนจริง จะทำให้ระบบสามารถลบสัญญาณรบกวนออกได้อย่างมีประสิทธิภาพ แต่ถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมามีความผิดพลาด เช่นมีค่ามากเกินไป โดยเฉพาะอย่างยิ่งบางองค์ประกอบความถี่ จะมีผลกระทบกับสัญญาณเสียงพูดต้นฉบับ (Original signal) ณ ความถี่นั้นๆ กล่าวคือจะทำให้องค์ประกอบสัญญาณเสียงพูดบางความถี่ขาดหายไป แต่ในทางกลับกันถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมานั้น มีค่าน้อยเกินไปจะทำให้ระบบไม่สามารถลบสัญญาณรบกวนออกไปได้อย่างมีประสิทธิภาพ |
+ | |||
+ | ดังนั้นการประมาณสเปกตรัมของสัญญาณรบกวนให้เหมาะสมจึงมีความสำคัญมากเพื่อให้ได้สัญญาณเสียงพูดที่มีความเพี้ยนไปจากสัญญาณต้นฉบับน้อยที่สุด ซึ่งค่าประมาณสเปกตรัมของสัญญาณเสียงพูดจะหาได้จากการนำขนาดของค่าประมาณสเปกตรัมของสัญญาณรบกวนลบออกจากสเปกตรัมของสัญญาณพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ซึ่งวิธี SS จะพิจารณาเฉพาะขนาดของสเปกตรัมโดยไม่นำเฟสมาพิจารณา เนื่องจากหูมนุษย์มีความไวต่อขนาดมากกว่าเฟส | ||
+ | |||
+ | '''ขั้นตอนวิธีการลบสเปกตรัม''' | ||
+ | ภาพรวมของวิธีการลบสเปกตรัม โดยเริ่มจากสัญญาณขาเข้าในที่นี้คือสัญญาณเสียงพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ผ่านวิธีการแปลงกลับของฟูริเยร์แบบไม่ต่อเนื่องผกผันในช่วงเวลาสั้นจะได้สเปกตรัมสัญญาณเสียงพูดที่ปนเปื้อนด้วยสัญญาณรบกวน จากนั้นหาค่าประมาณสเปกตรัมของสัญญาณรบกวนและนำไปหักออกจากสเปกตรัมของสัญญาณเสียงพูดขาเข้า สำหรับค่าประมาณสเปกตรัมของสัญญาณเสียงพูดที่ได้จากสมการที่ ในกรณีที่ถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้น ณ ความถี่ใดๆ มีค่ามากกว่าสเปกตรัมของสัญญาณเสียงที่ปนด้วยสัญญาณรบกวน เมื่อนำไปผ่านการลบทางสเปกตรัมตามสมการที่ อาจมีผลลัพธ์เป็นค่าลบได้ ซึ่งจะไม่เกิดขึ้นกับขนาดหรือสเปกตรัมกำลัง เพื่อแก้ปัญหานี้จึงต้องใช้ฟังก์ชันต่อไปนี้ ดังแสดงในรูป บล็อกหลังการลบ (Post Subtraction) เพื่อป้องกันการประมาณสเปกตรัมแล้วได้ขนาดเป็นลบ | ||
- | + | จากนั้นหาค่าประมาณของสัญญาณเสียงพูดที่ถูกหักลบสเปกตรัมของสัญญาณรบกวนออกแล้วโดยใช้การแปลงกลับของฟูริเยร์แบบไม่ต่อเนื่องผกผันในช่วงเวลาสั้น (Inverse Short-Time Discrete Fourier Transform) | |
ข้อดีของวิธี SS นี้คือ มีการทำงานที่ง่ายและราคาถูก แต่มีข้อจำกัดคือ ไม่เหมาะสมกับการลดสัญญาณรบกวนแบบไม่คงที่ เช่นเสียงพูดคุย | ข้อดีของวิธี SS นี้คือ มีการทำงานที่ง่ายและราคาถูก แต่มีข้อจำกัดคือ ไม่เหมาะสมกับการลดสัญญาณรบกวนแบบไม่คงที่ เช่นเสียงพูดคุย |
รุ่นปัจจุบันของ 07:27, 27 กรกฎาคม 2556
ในสภาพแวดล้อมรถยนต์ สมรรถนะของการโทรศัพท์แบบไม่ใช้มือถูกรบกวนด้วยสัญญาณรบกวนต่างๆ ได้แก่ เสียงเครื่องยนต์ เสียงลม และเสียงพูดคุยจอแจ เป็นต้น เทคนิคการลดสัญญาณรบกวนจึงมีความจาเป็นต่ออุปกรณ์ของระบบการโทรศัพท์แบบไม่ใช้มือ เพื่อปรับปรุงคุณภาพของสัญญาณเสียงพูดและการสื่อสารทางเสียงที่มีความถูกต้อง
เทคนิคการลดสัญญาณรบกวนได้รับการพัฒนามาอย่างต่อเนื่อง จึงทำให้เกิดขั้นตอนวิธีต่าง ๆ ขึ้นเป็นจำนวนมาก จากการศึกษางานวิจัยที่เกี่ยวข้องพบว่า เทคนิคการลดสัญญาณรบกวนสามารถแบ่งย่อยตามการประมวลผลคือ การประมวลผลในโดเมนความถี่ และการประมวลผลในโดเมนเวลา โดยที่การลดเสียงรบกวนที่ประมวลผลในโดเมนเวลา เรียกว่าการกำจัดสัญญาณรบกวนโดยใช้ตัวกรองปรับตัว (Adaptive Noise Cancelation, ANC) ไม่เกิดความผิดเพี้ยนของสัญญาณเสียงแต่มีความซับซ้อนสูง และ การลดเสียงรบกวนที่ใช้ในโดเมนความถี่นั้นมีข้อดีคือมีความซับซ้อนต่ำแต่ก็อาจเกิดความผิดเพี้ยนของสัญญาณเสียงได้ ในบทความนี้จะกล่าวถึงการลดสัญญาณรบกวนที่ทำงานในโดเมนความถี่ ที่เรียกว่าเทคนิคการลบทางสเปกตรัม (Spectral Subtraction, SS)
เทคนิคการลดเสียงรบกวนที่ใช้ในโดเมนความถี่ สำหรับการลดสัญญาณรบกวนโดยอาศัยไมโครโฟน 1 ตัวที่ทำงานในโดเมนความถี่นั้น เทคนิคที่เป็นที่นิยมใช้กันมากคือเทคนิคการลบทางสเปกตรัม (Spectral subtraction technique, SS) วิธีนี้มีหลักการคือจะทำการประมาณสเปกตรัมของสัญญาณรบกวน (Noise spectrum) แล้วนำมาลบออกจากสเปกตรัมของสัญญาณเสียงพูดที่ปนด้วยสัญญาณรบกวน (Noisy Spectrum) ซึ่งสเปกตรัมของสัญญาณรบกวนนี้จะถูกประมาณจากช่วงที่ไม่มีกิจกรรมของเสียงพูด ซึ่งวิธี SS สามารถอธิบายได้ดังนี้
เทคนิคการลบสเปกตรัม (Spectral Subtraction Technique, SS) สำหรับการลดสัญญาณรบกวนเพื่อเพิ่มคุณภาพของสัญญาณเสียงพูดในระบบสนทนาหนึ่งๆ จะสามารถทำได้ โดยทำการประมาณสเปกตรัมของสัญญาณรบกวน แล้วลบออกจากสเปกตรัมของสัญญาณเสียงพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ทั้งนี้วิธีการ SS นี้จะขึ้นกับความแม่นยำของการประมาณค่าสเปกตรัมของสัญญาณรบกวน โดยถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมานั้นมีค่าใกล้เคียงกับสเปกตรัมของสัญญาณรบกวนจริง จะทำให้ระบบสามารถลบสัญญาณรบกวนออกได้อย่างมีประสิทธิภาพ แต่ถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมามีความผิดพลาด เช่นมีค่ามากเกินไป โดยเฉพาะอย่างยิ่งบางองค์ประกอบความถี่ จะมีผลกระทบกับสัญญาณเสียงพูดต้นฉบับ (Original signal) ณ ความถี่นั้นๆ กล่าวคือจะทำให้องค์ประกอบสัญญาณเสียงพูดบางความถี่ขาดหายไป แต่ในทางกลับกันถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้นมานั้น มีค่าน้อยเกินไปจะทำให้ระบบไม่สามารถลบสัญญาณรบกวนออกไปได้อย่างมีประสิทธิภาพ
ดังนั้นการประมาณสเปกตรัมของสัญญาณรบกวนให้เหมาะสมจึงมีความสำคัญมากเพื่อให้ได้สัญญาณเสียงพูดที่มีความเพี้ยนไปจากสัญญาณต้นฉบับน้อยที่สุด ซึ่งค่าประมาณสเปกตรัมของสัญญาณเสียงพูดจะหาได้จากการนำขนาดของค่าประมาณสเปกตรัมของสัญญาณรบกวนลบออกจากสเปกตรัมของสัญญาณพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ซึ่งวิธี SS จะพิจารณาเฉพาะขนาดของสเปกตรัมโดยไม่นำเฟสมาพิจารณา เนื่องจากหูมนุษย์มีความไวต่อขนาดมากกว่าเฟส
ขั้นตอนวิธีการลบสเปกตรัม ภาพรวมของวิธีการลบสเปกตรัม โดยเริ่มจากสัญญาณขาเข้าในที่นี้คือสัญญาณเสียงพูดที่มีสัญญาณรบกวนปนเปื้อนอยู่ ผ่านวิธีการแปลงกลับของฟูริเยร์แบบไม่ต่อเนื่องผกผันในช่วงเวลาสั้นจะได้สเปกตรัมสัญญาณเสียงพูดที่ปนเปื้อนด้วยสัญญาณรบกวน จากนั้นหาค่าประมาณสเปกตรัมของสัญญาณรบกวนและนำไปหักออกจากสเปกตรัมของสัญญาณเสียงพูดขาเข้า สำหรับค่าประมาณสเปกตรัมของสัญญาณเสียงพูดที่ได้จากสมการที่ ในกรณีที่ถ้าสเปกตรัมของสัญญาณรบกวนที่ประมาณขึ้น ณ ความถี่ใดๆ มีค่ามากกว่าสเปกตรัมของสัญญาณเสียงที่ปนด้วยสัญญาณรบกวน เมื่อนำไปผ่านการลบทางสเปกตรัมตามสมการที่ อาจมีผลลัพธ์เป็นค่าลบได้ ซึ่งจะไม่เกิดขึ้นกับขนาดหรือสเปกตรัมกำลัง เพื่อแก้ปัญหานี้จึงต้องใช้ฟังก์ชันต่อไปนี้ ดังแสดงในรูป บล็อกหลังการลบ (Post Subtraction) เพื่อป้องกันการประมาณสเปกตรัมแล้วได้ขนาดเป็นลบ
จากนั้นหาค่าประมาณของสัญญาณเสียงพูดที่ถูกหักลบสเปกตรัมของสัญญาณรบกวนออกแล้วโดยใช้การแปลงกลับของฟูริเยร์แบบไม่ต่อเนื่องผกผันในช่วงเวลาสั้น (Inverse Short-Time Discrete Fourier Transform) ข้อดีของวิธี SS นี้คือ มีการทำงานที่ง่ายและราคาถูก แต่มีข้อจำกัดคือ ไม่เหมาะสมกับการลดสัญญาณรบกวนแบบไม่คงที่ เช่นเสียงพูดคุย