Công nghệ nhận diện giọng nói đã không còn chút xa lạ gì với những tín đồ công nghệ trên toàn thế giới. Những hệ điều hành di động đương đại đều có những công cụ hỗ trợ người sử dụng thông qua giọng nói của chính họ, ví như: Siri của iOS, Microsoft TellMe hay Google Now trên Android.
Thế nhưng, điểm chung của những hệ thống trợ giúp bằng giọng nói như vậy đó là chúng đều chỉ hỗ trợ một vài ngôn ngữ lớn, được phần đông dân số thế giới sử dụng như tiếng Anh, tiếng Pháp hay tiếng Trung. Vậy còn với người sử dụng Việt Nam? Đôi khi việc “kỳ cạch” gõ những cụm từ khóa tìm kiếm trên đường hay trong một số trường hợp là không mấy tiện dụng, do đó 1 bộ công cụ nhận diện ngôn ngữ tiếng Việt dành cho smartphone là rất cần thiết.
Và rồi, Nuance Communications, một tập đoàn truyền thông có trụ sở tại Massachusetts, Hoa Kỳ mới đây đã giới thiệu đến cộng đồng sử dụng iOS Việt Nam bộ đôi ứng dụng phục vụ việc tìm kiếm và nhập dữ liệu thông qua giọng nói với cái tên Dragon Search và Dragon Dictation. Hiện cả hai ứng dụng này đều được phân phối miễn phí thông qua hệ thống cửa hàng trực tuyến App Store của Apple.
Giao diện ứng dụng Dragon Dictation.
Điều đặc biệt của bộ đôi ứng dụng này, đó là chúng đều có hệ thống module nhận diện tiếng Việt tương đối hoàn chỉnh, có thể nhận diện hầu hết những câu chữ được nhập vào chiếc điện thoại, ngay cả khi nói bằng giọng nhiều vùng miền khác nhau.
Dragon Dictation
Kỳ thực, Dictation mới chỉ là mức “entrance” trong số những ứng dụng nhận diện giọng nói của Nuance Communications. Công việc chính của Dictation cực kỳ đơn giản: “Diễn xuôi” tất cả những gì người sử dụng nói vào điện thoại dưới dạng đoạn text. Sau đó, ứng dụng cho phép người dùng chia sẻ những gì mình vừa nói thông qua một vài giao thức như SMS, Email, hay thậm chí là chia sẻ lên cả Facebook hay Twitter.
Giao diện chính
Quá trình thực hiện nhận diện giọng nói.
Kết quả thu được sẽ hiển thị qua text.
Cá nhân tôi cho rằng với đặc điểm hoạt động hiệu quả với tỉ lệ thành công vào khoảng 85 đến 93% của Dragon Dictation, thì đây rõ ràng là một trải nghiệm cực kỳ hiệu quả cho bất kỳ ai có lối sống bận rộn, vì những gì bạn nói ra hoàn toàn có thể được gửi đi như một bức thư điện tử phục vụ cho nhu cầu công việc, hay thường xuyên chia sẻ những trạng thái mới nhất lên Facebook.
Trong thử nghiệm cụ thể, Dragon Dictation hoạt động rất tốt, với khả năng nhận diện chính xác mọi âm tiết tiếng Việt mà người thử nghiệm nói, trong điều kiện anh nói chậm rãi và rõ ràng từng tiếng. Ngay sau đó là những tính năng chia sẻ đi kèm cũng hoạt động tương đối hiệu quả.
Tuy nhiên, một điều cần ghi nhớ đó là ngay sau khi kết thúc đoạn nói, bạn cần chạm vào nút “Done” ngay phía dưới màn hình để báo cho điện thoại biết rằng bạn đã kết thúc việc nhập dữ liệu, tránh xảy ra tình trạng tạp âm bên ngoài lọt vào gây ảnh hưởng đến kết quả thu được.
Dragon Search
Về cơ bản thì Dragon Search của Nuance cũng có cơ chế hoạt động giống y hệt như Dragon Dictation trong mảng nhận diện giọng nói. Tuy nhiên điểm khác biệt lại đến từ những chức năng đi kèm của Dragon Search.
Giao diện Dragon Search.
Sauk hi diễn giải những cụm dữ liệu giọng nói người sử dụng nhập vào điện thoại, Dragon Search sử dụng chính đoạn dữ liệu này để tìm kiếm trên một số công cụ tìm kiếm hay trang web nổi tiếng như Google, Wikipedia hay YouTube. Đây chính là điểm tạo ra lợi thế cho Dragon Search. Thay vì nhập qua màn hình iPhone những cụm từ khóa dễ sai sót (màn hình iPhone tương đối bé, tôi đã có vài lần phát bực vì… gõ mãi không xong một cụm từ khóa), người sử dụng có thể tạo lệnh tìm kiếm ngay bằng giọng nói của chính mình.
Sử dụng công cụ của Google và một số nguồn dữ liệu khác, ví dụ như Youtube
Giao diện hoạt động
Thời gian tải trang cũng như xử lý thông tin âm thanh của Dragon Search cũng tương đối ấn tượng. Phụ thuộc tương đối nhiều vào tốc độ mạng 3G hoặc WiFi, tuy nhiên tốc độ xử lý của Dragon Search nhanh trong phần lớn trường hợp thử nghiệm của chúng tôi.
Lợi thế lớn
Ưu điểm của hai công cụ được giới thiệu ở trên chính là khả năng nhận diện được phát âm tiếng Việt nhiều vùng miền. Không phải ai cũng sở hữu giọng nói giống nhau, đó chính là thứ Nuance đã làm tương đối tốt với sản phẩm nhận diện giọng nói của mình. Trong khi đó việc tích hợp một số công cụ chia sẻ hay tìm kiếm cơ bản lại là ưu điểm thứ 2 của Dragon Search và Dictation.
Tuy nhiên một số lưu ý dành cho người sử dụng, đó là họ nên nói to và rõ ràng, ngắt nghỉ đúng để engine nhận diện làm việc với hiệu quả cao nhất.