Cỗ máy VODER ra đời cách đây 100 năm có thể nói bất kỳ ngôn ngữ nào, thậm chí cả tiếng bò và lợn kêu, nhưng đòi hỏi người vận hành phải có kỹ năng điều khiển cực tốt.
Thiết bị đầu tiên được coi là máy tổng hợp giọng nói thực sự là (Voice Operating Demonstrator) được phát triển bởi kỹ sư Homer Dudley ở phòng thí nghiệm Bell vào thập niên 1930. Đây là một cỗ máy khá phức tạp với 14 phím giống đàn piano, một thanh điều khiển bằng cổ tay, bàn đạp bằng chân mà người vận hành có thể thao tác để cỗ máy phát ra tiếng nói. Âm thanh của nó nghe rất máy móc, giống như "người ngoài hành tinh nói chuyện dưới nước", theo Amusing Planet. Trên thực tế, "giọng nói máy móc" mà chúng ta thường nghe trong các bộ phim khoa học viễn tưởng và phim truyền hình cũ có thể bắt nguồn từ VODER.
Để VODER hoạt động, người vận hành lựa chọn một trong hai âm thanh cơ bản bằng cách sử dụng thanh điều khiển bằng cổ tay: tiếng rì rầm và tiếng rít lên. Tiếng rì rầm là thành phần cơ bản của nguyên âm và âm mũi. Tiếng rít lên là thành phần cơ bản của những âm gắn liền với phụ âm. Các âm thanh này sau đó truyền qua một loạt bộ lọc do người sử dụng lựa chọn bằng cách chọn phím phù hợp trên bàn phím. Âm thanh được kết hợp và truyền qua loa.
Đối với nhiều âm không thể mô phỏng bằng tiếng rì rầm hoặc tiếng rít lên như "p", "d", "j", và "ch", có thể lựa chọn thêm bộ lọc. Những từ khác nhau có thể kết hợp thành câu dựa trên việc điều khiển bàn phím và âm. Người vận hành thậm chí có thể bổ sung độ diễn cảm và cao độ (thông qua bàn đạp) tùy theo loại câu hỏi.
Helen Harper, người vận hành chính của VODER trong buổi giới thiệu tại Hội chợ thế giới New York năm 1939 việc làm chủ cỗ máy khó khăn tới mức nào. "Để tạo ra từ 'tập trung' bằng VODER, tôi phải hình thành 13 âm khác nhau liên tiếp và di chuyển lên xuống thanh điều khiển bằng cổ tay 5 lần cũng như thay đổi vị trí bàn đạp từ 3 đến 5 lần theo độ diễn cảm mà tôi muốn VODER phát ra. Tất nhiên, tất cả quá trình cần phải tiến hành với sự căn giờ chuẩn xác", Harper mô tả.
Harper mất một năm luyện tập thường xuyên trước khi học được cách vận hành cỗ máy chính xác. Khoảng 300 cô gái tham gia tập huấn để trở thành người vận hành, nhưng có chưa đến 30 người thuần thục kỹ năng. Một người vận hành có kỹ năng như Harper có thể khiến VODER nói bất kỳ ngôn ngữ nào, thậm chí phát ra tiếng bò hoặc lợn kêu. Bà thậm chí có thể khiến cỗ máy phát ra tiếng hát.
Trước Dudley, năm 1779, giáo sư người Nga Christian Kratzenstein chế tạo một dụng cụ bao gồm một số ống rung tương tự như đường dẫn âm ở người. Thiết bị của ông có thể tạo ra 5 nguyên âm dài. Tiếp đó, năm 1791, một nhà phát minh tên Wolfgang von Kempelen phát triển cỗ máy chi tiết hơn phỏng theo nhiều cơ quan khác nhau của con người để tạo ra tiếng nói. Cỗ máy bao gồm một cặp ống thổi để mô phỏng phổi, ống rung đóng vai trò như dây thanh đới, ống da tượng trưng cho đường dẫn âm, hai lỗ mũi, lưỡi da và môi.
|