Giới thiệu. Hệ thống dịch giọng nói thời gian thực sao chép đặc điểm giọng nói của người nói trong khi chuyển đổi lời nói sang 3 ngôn ngữ mục tiêu.