221
2081
CNTT - Viễn thông
cntt
/cntt/
914450
Google hướng tới viễn cảnh "dịch phát ăn ngay"
1
Article
null
Google hướng tới viễn cảnh 'dịch phát ăn ngay'
,

Trong mắt nhìn của Google về tương lai, người dùng sẽ có thể phiên dịch mọi tài liệu sang tiếng Anh chỉ trong chớp mắt, và tất nhiên là không hề ngô nghê, word-by-word như hiện nay.

Nguồn: AP
Nguồn: AP
Được mang tên "Dịch máy thống kê", công nghệ này khác hẳn với những nỗ lực trước đây ở chỗ nó loại bỏ hoàn toàn vai trò của các chuyên gia ngôn ngữ, các quy tắc ngữ pháp và từ điển học.

Dựa vào tần suất

Thay vào đó, nó tổng hợp tất cả những tài liệu mà loài người đã từng phiên dịch ra ít nhất hai thứ tiếng, sau đó xây dựng một cơ sở dữ liệu khổng lồ để phân tách, đối chiếu và chuyển nghĩa.

Có thể chất lượng lúc đầu không thật hoàn hảo, song dù sao, "Dịch máy thống kê" vẫn là một bước cải tiến so với các công nghệ dịch máy trước đây, ông Franz Och, 35 tuổi, Giám đốc dự án cho biết.  Để minh chứng, Och đã cho phóng viên AP xem một trang tin tức bằng tiếng Ả rập được dịch sang thứ tiếng Anh khá "dễ tiêu hóa".

Hai nhân viên khác của Google ngồi bàn bên cạnh cho biết họ là người Nga, và phiên bản dịch từ tiếng Anh sang tiếng Nga của một trang tin khác cũng khá dễ hiểu, tuy đôi chỗ có "lạ tai" chút ít.

Nói thông thạo tiếng Đức, Anh và tiếng Ý, Och đã cần mẫn nhập hàng trăm triệu từ trong các văn bản tiếng Ả rập và Anh vào máy tính. Các nguồn tư liệu chủ yếu được lấy từ tài liệu của EU và Liên hợp quốc. "Càng nhập nhiều dữ liệu vào trong hệ thống, kết quả thu được càng chính xác", Och nói.

Chương trình của anh sử dụng kỹ thuật phân tích thống kê - một cách tiếp cận mà Och hy vọng sẽ tránh được những lỗi ngoại giao từng xảy ra trong quá khứ, chẳng hạn như phiên dịch của Tổng thống Nga Vladimir Putin đã làm phật ý Thủ tướng Đức Gerhard Schroeder khi gọi ông là "Fuehrer", một danh xưng mà bất cứ người Đức nào cũng gán ngay cho Hitler.

Khó thay thế con người

"Máy tính sẽ thống kê có bao nhiêu trường hợp văn bản người ta dùng từ Fuehrer Gerhard Schroeder. Nếu tần suất sử dụng danh xưng Bundeskanzler Gerhard Schroeder nhiều gấp 100 lần, máy sẽ lựa chọn phương án sau", Och giải thích.

Hiện tại, Google đang cung cấp công cụ dịch máy thống kê cho 3 thứ tiếng Arap, Trung Quốc và Nga sang/từ tiếng Anh tại địa chỉ http://www.google.com/language_tools. Giới phân tích tỏ ý khen ngợi nỗ lực của Google, nhưng không quên nhấn mạnh rằng công nghệ này vẫn còn nhiều hạn chế.

"Phần mềm không thể thay thế con người trong việc dịch thuật chuyên nghiệp được, cũng như khi thi đấu cờ vua vậy. Có thể dùng phần mềm để đọc hiểu một tài liệu, chứ không thể tung hứng với ngôn từ để đánh bóng tài liệu được", một giáo sư ngôn ngữ học tại Berlin nhận định.

Trọng Cầm (Theo AP)

,
Ý kiến của bạn
Ý kiến bạn đọc
,
,
,
,