Em nghĩ nó sử dụng giọng người thật làm nền cơ bản, sau đó dùng phần mềm (AI hoặc gì đó) để điều chỉnh ngắt nghỉ, lên bổng xuống trầm.
Cá nhân em quan tâm đến Speech-to-text hơn, vì hay phải ngồi họp, ghi chép nhiều. Nhưng cái phần mềm viettel voice note vẫn đang rất kém, không đảm bảo mức độ...