Thứ Sáu, 10 tháng 2, 2017

S&T: Được Lời, Tìm Ý


Thân chào các Bê (*),
Hôm nay xin bắt đầu bài này bằng câu đố: "Mẹ thằng mù cõng thằng mù và dắt ba thằng mù qua đường. Hỏi có mấy người mù qua đường?"
Đây là câu đố mà cậu em vợ của Đệ bỏ vào Facebook và khá nhiều bạn bè của cậu ta trả lời sai! Bê trả lời là mấy? Lý do đây là câu đố mẹo vì nếu viết lại câu đố cho thật đúng văn phạm tiếng Việt thì cậu trả lời thật dễ dàng và chính xác.
Cái khó là ở chỗ văn nói có thể đi ra khỏi luật văn phạm mà vẫn được người nói/người nghe chấp nhận.
Theo thời gian văn "nói" xâm nhập vào văn "viết" tại nhiều quốc gia và đặc biệt là văn viết trong mạng xã hội như Facebook hoặc Twitter: Ngài Trump viết "unpresidented" thay vì "unprecedented" mà Ngài vẫn không thấy sai vì Ngài và một số người đọc "hiểu" ngay là Ngài muốn nói cái gì. Đặc biệt là tại những quốc gia không có viện Hàn Lâm Văn Học (phụ chú I). "Văn dĩ tải đạo" thôi mà xin đừng chấp con chữ mà làm gì! (1).

Câu đố này dẫn đến một vấn đề lớn hơn nhiều:

  • Người nói vẫn bất chấp văn phạm. Ngay cả khi các Bác Sĩ viết bài báo cáo, bài tóm lược/chi tiết kết quả nói chuyện với bệnh nhân và thành quả khám nghiệm, thì mỗi Bác Sĩ cũng viết tắt, viết tháu khác nhau. Bác Sĩ hiểu, Y Tá hiểu, con bệnh... hơi hiểu hiểu.
  • Người nghe có khi hiểu sai ý người nói vì không hiểu những điều người nói muốn nói vì người nói tưởng là người nghe đã biết nên không nói ra. Người học cao thường cứ tưởng ai cũng hiểu điều mình hiểu.
  • Máy điện tính thì lại còn tệ hơn người thật nhiều lần. Người thật có thể nhìn/hiểu "ngữ" thành "nghĩa" mà đâu đó trong văn bản có đề cập. Thí dụ trong văn bản có đề cập tới trường trung học JFK (Tổng Thống Hoa Kỳ John F. Kennedy) ở trong thành phố X mà chỉ nói là "JFK" vì người viết đã viết đâu đó là ở thành phố X có một trường trung học mang tên một Tổng Thống. Máy điện tính có thể không nhìn ra sự kiện là JFK là tên ngôi trường chứ không liên quan tới phi trường JFK ở New York. Vấn đề hiểu sự kiện "in context" (trong văn bản, trong nội dung) là rất khó với máy móc. Một thí dụ khác là khi hai người bạn trai đi đường nơi cảnh đẹp mà lại có một cô con gái đi ngang. Một người thốt lên: "Đẹp!" thì người kia có thể đoán trúng là anh chàng này nói về cô gái. Máy điện tính thì phân vân không biết là anh chàng này nói về cảnh vật chung quanh hay về người!
  • Trong phim Hàn “Hậu Duệ Mặt Trời” (Descendants of the Sun), vì phim lồng quảng cáo cho tiệm Subway (tiệm bán bánh mì kẹp thịt, sandwiches) nên có khá nhiều đoạn mà nhân vật phim đến tiệm Subway và đặt mua bánh mì. Phụ đề Việt ngữ dịch “Turkey Sandwich” thành “Bánh mì Thổ nhĩ Kỳ”. Thật ra Turkey có ít nhất hai nghĩa: một là nước Thổ nhĩ Kỳ, hai là con gà Tây (hay là thịt gà Tây). Turkey sandwich là bánh mì kẹp thịt gà Tây chứ không phải là bánh mì xuất xứ từ Thổ nhĩ Kỳ (mà cũng không phải là bánh mì kẹp nước Thổ!) 
  • "Swear in" tùy theo nội dung mà có nghĩa là "tuyên thệ" hay "(chửi) thề trong..."
  • Một thí dụ về động từ/danh từ kép có chữ "ăn" như "ăn mặc" thì chẳng phải ăn là chính mà mặc mới là chính. Cũng vậy, "ăn nói", "ăn chơi", "ăn năn", vân vân...
  • "Làm đi!" là làm hay là đi?
  • Tiếng Mỹ thì luôn có vấn đề với chủ từ "he" (hoặc "she") trong trường hợp đoạn văn nói tới hai người cùng phái. Thí dụ như đoạn văn có nói tới hai người phụ nữ và có câu: "...then she was outrage!" thì chữ "she" này chỉ người phụ nữ nào?

Phân tích và xác định ý nghĩa của ngôn ngữ tự nhiên (ngôn ngữ như tiếng Việt, tiếng Anh, vân vân...) là vấn đề rất lớn trong Khoa Học Điện Tính (Computer Science); ngành này có tên là Natural Language Processing (NLP) mà ở bễn gọi là "Xử Lý Ngôn Ngữ Tự Nhiên". Không biết Bê nghĩ sao chứ Đệ thì thích dùng chữ "phân tích" hơn là "xử lý". Tiện đây xin nhấn mạnh là viết lăng nhăng cho đầu óc làm việc mà thôi. Bê đọc cho vui, vậy thôi. Viết là thêm động lực cho Bê tìm hiểu vấn đề từ những nguồn khác, nếu muốn "nắm bắt" được "chân diện mục" của vấn đề.


Tại Sao NLP Lại Qúa Khó với Máy Tính?


Dù cho máy tính có là super computer thì "được lời, tìm ý" sẽ vẫn là nhiệm vụ rất khó khăn, trong tương lai gần. Cứ vào Internet và đặt câu hỏi "why nlp is hard" thì sẽ thấy chuyên gia từ những hãng lớn như IBM, Google, Microsoft, vân vân... nói về đề tài này khá nhiều (phụ chú D). Đương nhiên là đây chỉ là mặt nổi. Các trung tâm nghiên cứu, các đại học lớn của thế giới đều có nỗ lực trong việc phát triển NLP.
Có lẽ phải đưa Bê ngược về quá khứ thì mới thấy tại sao thành công trong NLP là một đột phá (breakthrough) quan trọng trong kỹ nghệ điện tính.
  • Structured data: Trước đây, khi bắt đầu có khoa học về cách tồn trữ dữ liệu trong computer database (cơ sở tồn trữ dữ liệu trong máy điện tính) thì sự thành công này đã là bước khởi đầu cho các ngân hàng chuyển kế toán dùng giấy mực/sổ sách sang kế toán bằng máy điện tính, từ đó đến nay việc tồn trữ dữ liệu thành “structured data” (dữ liệu đã được định loại (coded) được trữ trong computer ở những nơi nhất đinh mà khi cần con người có thể lệnh cho computer mang ra lại. Computer có thể tìm lại được là vì dữ liệu đã được coded trong những bảng (database tables). Trong chú thích (2), Đệ có nói về một ứng dụng của structured data trong ngành ngân hàng. Structured data đã đóng một vai trò rất rất là quan trọng trong mạng toàn cầu và giúp các cá nhân cũng như các hãng xưởng trao đổi dữ kiện và kết toán thanh khoản. Toàn cầu hóa (globalization) có được có thể nói là nhờ computer giữ được structured data. Structured data, như lý lịch cá nhân hoặc danh sách đồ phụ tùng của các loại xe, sẽ vẫn là rất quan trọng trong đời sống nhưng thật là chưa đủ để phân tích và hiểu ý những đoạn văn hoặc nguyên bản văn.
  • Unstructured data: Đối tượng của NLP thì đi xa hơn là nhìn vào structured data vì NLP nhìn vào “unstructured data” (dữ kiện ở thể tự do không định loại được thí dụ như một sắc lệnh với nhiều vấn đề với nhiều câu văn trong đó hoặc như một bài báo cáo khoa học). Gắn nhãn (tagging) cho các sắc lệnh, các bài báo, các bản văn ở thể tự do (free-form, unstructured) là một bước đi tới quan trọng. Cũng như việc ghi chú bên lề (annotating) bằng computer cũng là bước đi tới quan trọng; nhưng phải chờ đến khi NLP phát triển như ngày này và… ngày sau thì việc được lời, hiểu ý mới trở thành hiện thực hữu dụng.
    Nên nhớ là unstructured data có thể là phim ảnh chứ không cứ là văn bản. Người thật nhìn hình là có thể có ít khái niệm về tấm hình gần như tức thì. Máy tính phân tích tấm hình thường là khá lâu và kết quả không mấy chính xác, hiện nay. Fei-Fei Li: How we're teaching computers to understand pictures (Có thể chọn phụ đề tiếng Việt)
  • Machine learning: Cái hay của những chương trình điện tính này là khả năng tự học thêm (self learning; machine learning; deep learning) để ngày một chính xác hơn. Máy tính theo thời gian sẽ tự sửa chữa những sai lầm của máy khi có được nhiều "training data". Thí dụ như máy nhận càng nhiều hình con mèo thì khi đưa ra tấm hình và hỏi máy có phải hình con mèo không thì độ chính xác càng cao.  The Economist explainsHow machine learning works bài này giải thích "deep learning" và nói sơ qua Facebook's Deep Face. Đây là một đề tài nói một bài không hết; mà không khéo lại lạc đề!

Một Vài Ứng Dụng

  • Ok, Google!, Siri (Apple devices), Alexa, SmartWatch, SmartTV, vân vân... (phụ chú H) là những ứng dụng điện tính có khả năng phân tích mệnh lệnh nói ở dạng "free-form" (người bình thường nói) mà hiểu được người muốn máy làm gì. Đệ dùng Ok, Google! để viết bài blog với smartphone hoặc tablet thì thấy Ok, Google! chuyển đổi giọng nói tiếng Việt và tiếng Anh của Đệ thành văn bản khá là chính xác. Cuối cùng thì mình có thể gởi email tiếng Việt có dấu mà không phải đánh máy!!!Alexa có thể phân tích tiếng nói và thi hành ý của chủ nhân để đặt hàng trong Amazon hoặc đặt mua bánh pizza, vân vân...
  • Đổi ngôn ngữ tại chỗ: Một người Mỹ và một người Việt có thể nói chuyện với nhau (dù cả hai chỉ biết tiếng nước mình) qua sự trợ giúp của điện thoại thông minh/đồng hồ thông minh hay máy tính xách tay. Khi người Mỹ nói, máy có thể chuyển tiếng nói thành văn tự. Máy sẽ phân tích ý nghĩa câu nói và chuyển qua văn tự tiếng Việt rồi phát thanh câu nói bằng tiếng Việt. Hiện nay, chuyện này không mới lạ mà đã có thể thực hiện được gần như “realtime” (ngay lập tức).
  • Dùng khả năng phân tích văn tự để định ý câu văn và tổng hợp ý để tìm hiểu một vấn đề nào đó. Chuyện này hiện giờ đang được các hãng lớn như IBM, Google, vân vân phát triển mạnh và có rất nhiều ứng dụng cần thiết cho đời sống con người. Một thí dụ kinh điển là chương trình Watson (Watson project) mà hãng IBM đã dùng máy tính để đánh bại vô địch trong cuộc tranh tài Jeopardy! IBM’s Watson on Jeopardy!
    Ngày nay, IBM Watson đã đi vào hầu hết các ngành kỹ nghệ quan trọng: từ quốc phòng, an ninh, tài chính, giao thông (xe cộ, cầu thang máy, tàu hỏa, vân vân), cá nhân cho tới bệnh tật. Đặc biệt là Y khoa thì nhóm Watson Health (mà Đệ là một con chốt tí hon trong nhóm này) đã mang lại nhiều thành tích trong công cuộc khắc phục Ung Thư Here’s How IBM Watson Health Is Transforming the Health Care Industry

Chúc các Bê một cuối tuần vui vẻ bên gia đình và người thân.

Thân,

Chú thích:

(*) Bê là Bê 60: Từ chữ tắt B60 (Beyond 60 years young) để chỉ các bác trên 60 tuổi trẻ. Thời xưa ta cứ nói thời đại này là "thời nguyên tử". Thời nguyên tử, nay, đã là xưa quá rồi. Bây giờ Bê phải nói thời đại này là thời "thực tế ảo". Bê nào giải thích cho rõ ràng cụm từ này xin giơ tay lên!

(1) Đệ không cưỡng lại cái dã tâm của mình mà bóp méo ngữ nghĩa của "văn dĩ tải đạo"; xin các bậc tiền bối đại xá, cho!

(2) Thí dụ như ngân hàng A có dữ kiện về ông A (tên tuổi, số trương mục, số tiền trong trương mục, vân vân). Tương tự như vậy ngân hàng B có dữ kiện về bà B nên khi ông A ký một tấm check cho bà B thì vấn đề chuyển khoản này được hai ngân hàng thanh toán với nhau: tiền được khấu trừ trong trương mục của ông A VÀ tiền được cộng vào trương mục của bà B. Coi thì đơn giản nhưng chuyên gia phải bảo đảm là việc chuyển khoản này phải thành công mỹ mãn. Vì lý do nào đó mà lúc chuyển khoản máy tính của ngân hàng B bị trục trặc, thì ông A mất tiền (trong trương mục) mà bà B không nhận được tiền trong trương mục thì sao? Thật là dễ mất… lòng nhau! Dưới đây là thí dụ về giao dịch ngân hàng dùng "structured data" (Cột "Tên" thì chứa các tên, như vậy "Hòa" được coded là loại "Tên")

Bảng A: hồ sơ trương mục của Hòa
Bảng B: giao dịch chi thu của trương mục 

Trương mục của Hòa chuyển số tiền gần 300 triệu USD cho trương mục số 001 của BB ở ngân hàng BB-Bank.

Bảng C:  hồ sơ trương mục của BB và Bảng D: giao dịch chi thu của trương mụcbBB


Nếu BB mở trương mục ra coi mà không thấy số tiền Đệ chuyển thì... trên cả mất lòng nhau, ấy chứ lỵ!

Phụ chú:

A. Blogs Đã Viết--Theo Đề Tài

B. Wikipedia - Natural language processing

C. Wikipedia - Xử lý ngôn ngữ tự nhiên

D. Quora - What makes natural language processing difficult?

E. Bloomberg - IBM's Rometty: How Watson Stacks Up Against Competition

F. IBM Watson: How it Works

G. The IBM Chef Watson Project: A Metaphor for Discovery

H. 15 Voice-Controlled Gadgets

I. Académie française Pháp thì có lẽ là quá chặt chẽ trong việc kiểm soát việc dùng tiếng Pháp.







Không có nhận xét nào: