Nếu trong âm thanh có đoạn không phải giọng người, khi đồng bộ hóa môi sẽ được xử lý thành miệng đóng