Tuesday, April 14, 2020

02. Hịch Dancesport 2007

(Đăng lại bài viết từ năm 2007)


Ta thường nghe: Thiết Cương nửa đêm còn làm sàn gỗ, cứu thoát cho mấy giải quốc gia; Vaio chìa lưng chịu giáo trên forum, che chở cho Vận động viên; Khánh Thi nuốt than, báo thù cho nước chủ nhà; The Lead chặt cơ may để cứu nạn cho Hải Dương. Phan Hiển một chàng tuổi trẻ, thân phò La-tin thoát khỏi vòng semi-final; Từ xưa các bậc vũ sư, vũ công hết mình vì nước, đời nào chẳng có? Ví thử mấy người đó cứ khư khư theo thói thường tình suốt ngày nhảy bằng mồm thì cũng đến chết hoài ở xó cửa, sao có thể lưu danh sử sách cùng trời đất muôn đời bất hủ được?

Các ngươi vốn dòng dancesport, không phải salon, nghe những chuyện ấy nửa tin nửa ngờ. Thôi việc đời nay hẵng tạm không bàn. Nay ta lấy chuyện standard, Latin đời xưa mà nói: Marcus Hilton là người thế nào ? Karen Hilton, tỳ thiếp của ông lại là người thế nào ? Vậy mà đem lại 9 lần danh hiệu vô địch thế giới mảng standard, nhiều nhất trong các công cuộc championship hàng năm, khiến cho sinh linh nhà Anh Quốc đến nay còn đội ơn sâu ! Donnie Burns là người thế nào ? Gaynor Fairweather, partner của ông lại là người thế nào ? Vậy mà xông vào chốn lam chướng xa xôi muôn dặm trần gian đánh quỵ các couples mảng Latin suốt 13 năm liền, khiến cho quân trưởng người Scotland đến nay còn lưu tiếng tốt ! Huống chi, ta cùng các ngươi sinh ra phải thời salon còn mạnh , lớn lên gặp buổi dancesport gian nan. Lén nhìn Vận động viên Thái Lan bay lượn nghênh ngang ngoài sàn sea games mấy vụ, cuỗm hết huy chương vàng, bạc, đồng , khiến cho quân ta đi thi thố chỉ là cọ sát, rồi thi xong xuôi tất cả lại về, mà căm. Ta thường tới bữa quên ăn, nửa đêm vỗ gối, ruột đau như cắt, nước mắt đầm đìa; chỉ giận chưa thể bay cao bay xa giật chút vàng, bạc, đồng, để lại chút danh thơm cho liệt tổ liệt tông nơi đất khách quê người; dẫu cho trăm thân ta phơi ngoài công viên nắng nôi luyện tập, nghìn thây ta lăn lộn nhễ nhại mồ hôi mồ kê trong trường múa, cũng nguyện xin làm.

Các ngươi ở lâu dưới trướng liên đoàn IDSF, nắm giữ choreography , không có video thì ta cho video; không có nhạc thì ta cho cả nhạc. Vận động viên cấp cao thì ta cho đi thi; cấp thấp hơn thì cho đi tập huấn. Thi trong nước thì ta cho đi tầu; thi ngoài nước thì ta cho chim sắt. Lâm thi đấu thì cùng nhau sống chết; được huy chương thì cùng nhau vui cười. So với Đại gia đãi kẻ chân dài, Viettel đãi người Thể Công, nào có kém gì?

Nay các ngươi ngồi nhìn nền Dancesport nước nhà yếu kém mà không biết lo; thân chịu quốc sỉ mà không biết thẹn. Làm Vận động viên triều đình đứng dưới quân Miên mà không biết tức; nghe nhạc quốc ca sứ khựa vang lên trong nhà mà không biết căm. Có kẻ lấy việc đánh bóng mặt sàn làm vui; có kẻ lấy việc dậy private làm thích. Có kẻ chăm lo Câu lạc bộ của riêng để cung phụng gia đình; có kẻ quyến luyến gái nhảy để thỏa lòng vị kỷ. Có kẻ tính đường sản nghiệp mà quên việc nước; có kẻ ham trò thi thố mà trễ việc basic. Có kẻ thích tinh tướng; có kẻ mê pi-a (PR) nhảm. Nếu bất chợt có sát hạch ISTD thì cựa giai nhẩy không đủ đi vài bước syllabus; mẹo trên sàn không đủ thi hành vài tổ hợp giản đơn. Còn thi thố nước người không chuộc nổi tấm huy chương đồng; sàn salon lắm không ích gì cho việc Dancesport. Tiền của dẫu lắm không mua được chứng chỉ; múa bụng tuy hay không làm được liên đoàn. Lúc bấy giờ chúa tôi nhà ta đều rặt bachata, đau xót biết chừng nào ! Chẳng những phong trào của ta không còn mà huy chương các ngươi cũng thuộc về tay kẻ khác; chẳng những gia quyến của ta chỉ biết đến Lăm-Vông mà vợ con các ngươi cũng bị Salsa bắt đi; chẳng những thân ta kiếp này chịu nhục đến trăm năm sau tiếng nhơ khôn rửa, tên xấu còn lưu, mà gia thanh các ngươi cũng không khỏi mang danh là vận động viên lởm. Lúc bấy giờ, dẫu các ngươi muốn vui chơi off-ẹp, phỏng có được chăng?

Nay ta bảo thật các ngươi: nên lấy việc "chân tuy dài nhưng gù dưới váy" làm nguy; nên lấy điều "bước tuy nhiều nhưng tuyền sai nhạc" làm sợ. Phải huấn luyện thiếu nhi, tập dượt back to basic, khiến cho ai nấy đều giỏi như Watson, mọi người đều tài như Alessia Betti, có thể bay lượn ở Blackpool, làm rối tinh rối mù lên vì tiếng vỗ tay ở Festival Nhật Bổn. Như thế chẳng những nền Dancesport của ta mãi mãi vững bền mà show diễn của các ngươi cũng vô tư mà tận hưởng; chẳng những liên đoàn sớm ra đời, mà hình ảnh của các người cũng được đăng đầy trên facebook; chẳng những tông miếu forum ta được hương khói nghìn thu mà thứ hạng của các ngươi cũng được bốn mùa thờ cúng; chẳng những thân ta kiếp này thỏa chí, mà đến các ngươi, trăm đời sau còn để tiếng thơm; chẳng những thụy hiệu ta không hề mai một, mà tên họ các ngươi cũng sử sách lưu truyền. Lúc bấy giờ, dẫu các ngươi không muốn đi sàn, phỏng có được không?
Nay ta chọn lọc binh pháp 10 quyển sách đỏ ISTD hợp thành một tuyển, gọi là dancesport Yếu Lược. Nếu các ngươi biết chuyên tập sách này, theo lời IDSF dạy bảo, thì trọn đời là Vận động viên Dancesport; nhược bằng khinh bỏ sách này, trái lời ta dạy bảo thì trọn đời là Salon nghịch tử.

Vì sao vậy? Đạo Salon với Dancesport ta là kẻ thù không đội trời chung, mà các ngươi cứ điềm nhiên không muốn phân biệt, không lo trừ hung, lại không dạy ISTD, chẳng khác nào quay mũi giầy mà xin đầu hàng, giơ tung váy mà chịu thua giặc. Nếu vậy, rồi đây, để thẹn muôn đời, há còn mặt mũi nào đứng trong cõi trời che đất chở này nữa? Cho nên ta viết bài hịch này để các ngươi hiểu rõ bụng ta.

Đặng (kuốk) Tuấn.
Share:

Monday, April 6, 2020

01. Phân tích đề xuất “Chữ Việt Nam song song 4.0” và tại sao không nên cải tiến chữ Việt

Phi lộ:  Qua thống kê sơ bộ trên Google đã có 57 tờ báo điện tử và 218.000 liên kết viết về “Chữ Việt Nam song song 4.0”. Trên Facebook đã có rất nhiều tranh luận về chủ đề này trong thời gian từ 1/4/2020 cho đến nay (6/4/2020), đa phần là các phản đối kịch liệt, thậm chí có nhiều ý kiến khá tiêu cực và có cả những bình luận dùng các từ ngữ mang tính chất thóa mạ tác giả. Các bình luận chủ yếu là: đề xuất mới của chữ Việt không đẹp, rắc rối và gây nhiều tốn kém khi chuyển đổi, rồi cả nước đang phải gồng mình chống giặc Covid-19, sao phải tốn nhiều giấy mực cho chủ đề không có tính thực tiễn như này...Trước đây người viết đã từng nói chuyện trên Facebook với tác giả Trần Tư Bình và nhận thấy anh là một người rất tâm huyết đối với tiếng Việt, qua truyền thông tôi cũng được biết hai tác giả vẫn rất kiên trì theo đuổi mục tiêu đưa đề xuất mới vào cuộc sống. Tiếc là chưa có ai chỉ ra cho các tác giả sự thiếu khoa học (cả về góc độ ngôn ngữ học lẫn chuẩn hóa trong Công nghệ thông tin) và tính không khả thi bằng các lập luận cụ thể và chi tiết. Bài viết này có mục đích nhằm phân tích về đề xuất mới trên các khía cạnh chuyên môn và khia cạnh bất khả thi dựa trên những kinh nghiệm thực tế liên quan đến tiếng Việt của người viết trong suốt thời gian từ năm 1990 đến nay (Bài đã được trích đăng trong Tạp chí Tia Sáng [4]).


I.Sơ lược về "Chữ Việt Nam song song 4.0"- CVNSS4.0


CVNSS4.0 là Bộ chữ Việt do hai tác giả Trần Tư Bình và Kiều Trường Lâm đề xuất, CVNSS4.0 đã được cấp bản quyền sở hữu trí tuệ [1]. CVNSS4.0 gồm 3 thành phần: Chữ quốc ngữ (CQN) hiện hành, Chữ viết nhanh và Ký hiệu dấu.

a. Chữ viết nhanh (CVN) - Tác giả Trần Tư Bình

Gồm 5 nhóm quy tắc: 
  1. Bỏ dấu sắc ở các từ có các phụ âm cuối c,p,t,ch. 
  2. Thay Y ->I và thay UY ->Y
  3. Đổi một số phụ âm đầu 2 ký tự bằng 1 ký tự như PH->F; KH->K; GH->G; NGH,NG->W...
  4. Đổi một số phụ âm cuối 2 ký tự bằng 1 ký tự: NG->G; CH->K. 
  5. Rút gọn 52 nguyên âm có 3-4 ký tự thành nhóm 2 ký tự: uyết->yd, uyên->yl...

b. Ký hiệu dấu (KHD) - Tác giả Kiều Trường Lâm

  1. Quy ước ký hiệu dấu sắc, huyền, hỏi, ngã, nặng->J, L, Z, S, R; khi có dấu mũ thì ký hiệu dấu đổi thành B,D,Q,G,H; khi có dấu trăng thì ký hiệu dấu đổi thành X, K, V, W, H.
  2. Ký hiệu cho dấu mũ trong /â, ê, ô/, là Y, dấu trăng và móc trong /ă, ơ, ư/ là O và không dấu là P.

c. Các khẳng định của các tác giả

  • c1: CVNSS4.0 ngắn gọn hơn chữ Việt hiện hành.
  • c2: CVNSS4.0 chỉ dùng 26 ký tự tiếng Anh để viết nên không cần bộ gõ chuyên dụng như Vietkey, Unikey mà dùng luôn bộ gõ tiếng Anh có sẵn.
  • c3: Gõ nhanh hơn 25-30% so với bộ gõ Telex hay VNI.
  • c4: Có độ chính xác cao.

II. Phân tích chuyên môn về CVNSS4.0


a. Phân tích ngữ âm học

Theo lý thuyết về ngữ âm học, có 2 hệ thống biểu hiện ngôn ngữ bằng chữ viết [3]:

  1.  Loại "Tượng ý":  trong đó từ được biểu hiện bằng một ký hiệu duy nhất không có liên quan gì đến những âm thanh cấu tạo thành từ. Ký hiệu này có quan hệ với cả từ, gián tiếp có quan hệ với ý niệm mà từ biểu hiện. Ví dụ của loại này là văn tự của chữ Hán. Chữ Việt không xếp vào nhóm này.
  2. Loại “Ngữ âm học”, là loại tái hiện chuỗi âm thanh nối tiếp nhau trong từ. Các hệ thống chữ viết ngữ âm học có thể ghi âm tiết hay ghi âm tố, nghĩa là căn cứ vào những yếu tố không chia nhỏ hơn được nữa trong lời nói. Tiếng Việt nằm trong nhóm này.
Có thể dễ dàng nhận thấy CVNSS4.0 không tuân thủ cấu trúc của tiếng Việt theo quy tắc ngữ âm học:
  1. CVNSS4.0 không tuân thủ các hệ thống âm vị của tiếng Việt: Gồm 22 hệ thống âm đầu, 1 âm đệm, 16 âm chính (13 nguyên âm đơn và 3 nguyên âm đôi), 8 âm cuối, 6 thanh điệu, CVNSS4.0 chính xác là phương pháp gõ tắt và quy ước đổi dấu thành ký tự latin. Ví dụ quy tắc CVN.1 loại bỏ luôn thành phần thanh điệu (không có).
  2. CVNSS4.0 không tuân thủ ký hiệu ngữ âm dùng để ký âm tiếng Việt và có khá nhiều nhập nhằng về ký hiệu ngữ âm. /i/ đứng riêng thì ký âm như chữ /i/ hiện hành, nhưng khi viết /id/ thì lại là /yêt/. Cùng là âm /t/ nhưng âm đầu vẫn ký hiệu là /t/ nhưng ở cuối nhiều chữ lúc là /t/ lúc khác lại là /d/.
  3. CVNSS4.0 sử dụng các ký hiệu không theo ký âm của ký âm thông lệ IPA quốc tế, ví dụ /w/ lại dùng để ký hiệu cho /ng/ hoặc /ngh/, ở phần bỏ dấu /w/ lại dùng để ký hiệu cho thanh điệu (dấu móc+ ngã).
  4. CVNSS4.0 không thể biểu diễn được dạng tổng hợp tiếng nói tiếng Việt ví dụ: bình thường chữ /tuyết/=/t/+/uyết/=/t/+/u/+/y/+/ế/+/t/, còn trong CVNSS4.0 thì /tuyết/=/tydb/.
Tóm lại CVNSS4.0 không tuân thủ cấu trúc của tiếng Việt và không thể sử dụng như là hệ thống ký âm tiếng Việt mà chỉ đơn thuần là hệ thống ký hiệu hay là quy tắc để viết tắt, gõ tắt, như vậy nó chỉ là là một phương pháp gõ chứ không thể là hệ thống chữ Việt có thể thay thế được hệ thống chữ Việt hiện hành.

b. Phân tích về phương diện Công nghệ thông tin

  1. Tính đơn trị: Một trong những nguyên tắc khi xây dựng hệ thống ký mã, hay một bộ tiêu chuẩn là phải bảo đảm tối đa tính đơn trị, và hàm số phải là song ánh giữa 2 tập, có nghĩa là hệ thống ký mã phải có tính một-một, ví dụ âm /a/ thì chỉ có mã duy nhất là 97, và 97 là mã duy nhất cho chữ /a/, cũng có nghĩa là chữ /a/ không thể lúc này là mã 97, lúc khác lại là mã 64, hay 97 không thể lúc này là chữ /a/ lúc khác lại là chữ /m/. Ở phương diện này CVNSS4.0 rất không tuân thủ tính đơn trị, riêng dấu thanh thì có đến 3 ký hiệu cho dấu sắc tùy theo nó đi với nguyên âm nào, lúc thì nó là /B/, lúc khác lại là /J/ lúc khác nữa lại là /X/, tương tự cho các dấu huyền, hỏi, ngã, nặng cũng có 3 ký hiệu khác nhau tùy khi nó kết hợp với chữ nào. Ở góc khác, ký hiệu /B/ lúc là phụ âm, lúc lại là dấu huyền. Tương tự cho rất nhiều ký hiệu khác nữa.
  2. Quá rắc rối, rối rắm, quá nhiều quy tắc cho những điều bất quy tắc: CVNSS4.0 vì không có tính đơn trị nên rắc rối và nhập nhằng trong ký hiệu, lúc ký hiệu có ý nghĩa này, lúc khác lại ý nghĩa khác tùy vào các trường hợp, tùy vị trí trong từ, tùy theo đi với chữ nào, buộc người dùng phải nhớ nhiều quy tắc và phải phân tích trong đầu trong khi gõ. Trong khi kiểu gõ Telex hay VNI thì chỉ cần 8 quy tắc đơn giản (5 cho dấu thanh, 3 cho các dấu mũ, trăng và đ) thì CVNSS4.0 cần đến 52 quy tắc, trong đó có nhiều quy tắc khá khó nhớ, buộc người dùng phải xử lý một thuật toán if-then khá lớn, tóm lại CVNSS4.0 khó nhớ, buộc tốn nhiều tài nguyên của trí não khi phải phân tích các trường hợp if-then...
  3. Tiết kiệm không gian lưu trữ và trên đường truyền: điều này đúng bởi CVNSS4.0 dùng quy tắc gõ tắt để giảm bớt 1 ký tự và trong 1 số ít trường hợp có thể giảm được 2 ký tự, ngoài ra do chỉ dùng 26 ký tự nên có thể dùng bộ mã 7-bit để mã hóa, không cần dùng đến bộ mã 16-Bit như tiếng Việt Unicode đang sử dụng. Tuy nhiên để tiết kiệm không gian nếu không tuân thủ các ký hiệu ký âm quốc tế thì có thể dùng mã Huffman thì sẽ tiết kiệm không gian triệt để hơn nhiều, trong thực tế người ta sẵn sàng trả giá về không gian lưu trữ để có tính dễ dàng cho người đọc hơn, vì thế người ta dùng ký hiệu chữ chứ không dùng các con số.
  4. CVNSS4.0 gõ năng suất và nhanh hơn: nếu không dùng các kỹ thuật nâng cao thì đúng là CVNSS4.0 gõ nhanh hơn vì sử dụng nhiều quy tắc gõ tắt (năng suất tăng 25-20% thì chưa có minh chứng), đổi lại người dùng phải trả giá: buộc phải nhớ nhiều quy tắc và phải liên tục phân tích các tình huống vị trí ký tự, kết hợp với ký tự trong từ...Trong thực tế có nhiều cách để nâng cao tốc độ gõ hơn rất nhiều, ví dụ Laban Key và các bộ gõ khác trên điện thoại di động có thể dùng AI hay thống kê xác suất để dự đoán và gợi ý từ thậm chí cả cụm từ mà CVNSS4.0 không thể nào so sánh được về tốc độ, tương tự với bộ gõ cho Desktop cũng có thể dùng kỹ thuật này để nâng cao tốc độ gõ văn bản. Ở một góc độ khác nếu không dùng các kỹ thuật thống kê và AI để dự đoán cả từ thì với một bộ luật gõ đơn giản người sử dụng có thể gõ với tốc độ rất nhanh (do não không phải xử lý thuật toán gõ tắt, if-then). 
  5. CVNSS4.0 chính xác hơn? Điều này cũng không đúng, vì CQN hiện hành nếu gõ đầy đủ dấu thì vẫn chính xác như thế, thậm chí có biểu đạt được nhiều phương ngữ vùng miền hơn, do CVNSS4.0 cũng giống như Bộ chữ của PGS. TS. Bùi Hiền đã cắt đi một số tổ hợp ký tự.
Theo các tác giả thì CVNSS4.0 có thành phần đầu tiên là Chữ Quốc ngữ (CQN) hiện hành và ngay chữ song song cũng có thể hiểu là CQN tồn tại song song với CVNSS4.0, như vậy mục tiêu của đề xuất chưa rõ ràng. Một mặt CQN được coi là tồn tại song song nhưng trong nhiều lập luận CVNSS4.0 lại có thể thay thế CQN vì các tác giả luôn so sánh CQN với CVNSS4.0 và khẳng định những ưu việt của CVNSS4.0, ngoài ra trong nhiều thể hiện chúng ta thấy có phiên bản CQN và phiên bản CVNSS4.0 tồn tại độc lập. Nếu tồn tại song song cả 2 hệ thống thì đó là một điều quá lãng phí, đã có bộ chữ tốt rồi lại thêm một bộ nữa làm gì để tốn kém tài nguyên của xã hội? Nếu không thay thế được thì không nên so sánh và cũng không thể gọi đề xuất là Bộ chữ Việt mới và không nên thể hiện là một phiên bản độc lập. Và như vậy đề xuất mới chỉ đơn thuần là một phương pháp gõ tắt mà thôi.

III. Phân tích về tính khả thi


Có thể khẳng định ngay CVNSS4.0 cũng như các cải tiến khác cho chữ Việt trong vòng hơn 100 năm trở lại đây đều không khả thi vì lợi ít-cập hại.

Đành rằng chữ Việt hiện tại có thể còn một số điểm chưa được tối ưu, còn một số điểm nhập nhằng (rất ít) ví dụ /c-k/, /d-gi/, một số chữ chưa phù hợp với ngữ âm quốc tế, nhưng nói cho cùng ngôn ngữ không phải là hệ thống định lý toán học mà nó là hệ thống quy ước xã hội, nhiều người dùng và nhiều người hiểu được thì đều chấp nhận được và sẽ trường tồn kể cả là chưa hợp lý hoặc kể cả là sai, điều này rất phổ biến trong hầu hết các ngôn ngữ khác trên thế giới.

Những đề xuất cải tiến nhằm tối ưu nhằm tăng năng suất đều mang lại lợi ích rất ít mà phá vỡ rất nhiều. Cải tiến và thay thế mới bộ chữ có thể tạo nên một đứt gãy về văn hóa, đặc biệt là con chữ theo thời gian sẽ trở thành biểu tượng, thành nét văn hóa, quốc hồn, quốc túy của cả một dân tộc. Tại sao các hệ thống chữ biểu ý vẫn tồn tại cho đến ngày nay mặc dù để viết và gõ nó tốn rất nhiều thời gian so với hệ thống chữ cái Latin? nhất là chữ Hán phồn thể, để viết 1 chữ có thể phải dùng tới hàng chục nét vẽ rất phức tạp. Đó là do chữ Hán trải qua hàng ngàn năm nó không chỉ bao hàm nét văn hóa lâu đời mà nó còn là biểu hiện cả tính nghệ thuật thư pháp, cả ý nghĩa triết học sâu sắc trong từng con chữ, vì thế để lưu giữ lại những điều này người ta sẵn sàng hi sinh sự tốn kém về không gian lưu trữ, sự phức tạp để viết-gõ nó.

Ngoài việc nếu sử dụng CVNSS4.0 thay thế CQN thì CVNSS4.0 sẽ không bảo tồn được các nét văn hóa của chữ Việt đã tồn tại hơn 100 năm qua thì giả sử nó có được triển khai thì cũng sẽ cực kỳ tốn kém. Tiết kiệm được một chút thời gian, một chút bộ nhớ lưu trữ thì lại tốn kém không thể kể xiết thời gian, công sức và tiền bạc để chuyển đổi hệ thống cũ sang hệ thống chữ viết mới. Phải thay đổi hoặc phải thêm toàn bộ hệ thống sách giáo khoa tất cả các cấp từ cấp 1 cho đến bậc đại học, phải đào tạo lại toàn bộ 97 triệu người Việt, phải thay đổi hoặc ban hành thêm hàng triệu văn bẳn pháp quy, giấy tờ, phải chuyển đổi hoặc lưu trữ thêm khối lượng cơ sở dữ liệu cực kỳ lớn tích lũy trong hàng chục năm qua, phải chuyển đổi hoặc in lại toàn bộ sách báo trong kho tàng tri thức của nước Việt. Đây chính là những lý do cốt tử mà các hệ thống cải tiến chữ Việt không thể triển khai được. Để có thể vượt qua được các rào cản như vậy thì chỉ có một chế độ độc tài muốn áp đặt với các mục tiêu chính trị, hoặc hệ thống mới phải cực kỳ ưu việt và có những lợi ích cũng cực kỳ to lớn mới có thể cân bằng được những tốn kém to lớn như vậy. Ngay tại Việt Nam mỗi lần đổi tên tỉnh, tách nhập tỉnh hay chỉ đơn thuần thêm chữ số hoặc thay đổi chữ số ở số điện thoại thôi là cũng gây nên đảo lộn rất nhiều vấn đề. Khi tiêu chuẩn về bộ mã ký tự tiếng Việt mới là TCVN 6909:2001 được ban hành thì tự nó vẫn chưa thể đi vào cuộc sống được và vẫn cần phải có văn bản có tính pháp lý cao có tính bắt buộc là Quyết định 72 của Thủ tướng chính phủ, yêu cầu từ ngày 1-1-2003 tất cả các cơ quan Nhà nước phải chuyển đổi sang dùng font chữ Unicode mà đến tận gần 10 năm, chúng ta mới cơ bản chuyển xong, mà đó chỉ là chuyển đổi mã, tất cả cách gõ và hình chữ đều như cũ, còn với CVNSS4.0 không chỉ thay đổi cách gõ, thay đổi dáng chữ mà còn thay đổi một thói quen hàng chục năm. Tóm lại nếu chuyển đổi và thay thế CQN thì CVNSS4.0 sẽ gây lãng phí rất lớn và bất khả thi, nếu nó chỉ là một phương pháp gõ tắt thì không cần phải dành quá nhiều tâm huyết đến như vậy, và sau khi gõ xong bắt buộc nó phải bung về CQN và như thế mọi lập luận về tính ưu việt của CVNSS4.0 không còn đúng nữa, và nếu đã là một cách gõ thì hãy để người dùng lựa chọn như cách họ lựa chọn giữa Telex và VNI vậy.


V. Không cải tiến chữ Việt thì có thể nghiên cứu vấn đề gì trong lĩnh vực ngôn ngữ?


Chữ Việt đã ổn định, các công cụ hỗ trợ tiếng Việt như font chữ, bộ gõ tiếng Việt cho đến nay đã được hầu hết các hãng sản xuất phần mềm và phần cứng tích hợp vào sản phẩm của mình như Windows, MacOS, Android, IOS cũng đều có sẵn bộ gõ tiếng Việt mà không cần phải cài đặt thêm phần mềm bộ gõ riêng (tuy nhiên với các bộ gõ riêng như Unikey, Vietkey thì sẽ có nhiều tính năng hơn: kiểm tra chính tả, chuyển mã, gõ tắt...).

Hiện nay ở Việt Nam có rất nhiều nhóm (viện, trường, doanh nghiệp) nghiên cứu các vấn đề về tiếng Việt và xử lý ngôn ngữ tiếng Việt, có thể liệt kê một vài bài toán cơ bản cho tiếng Việt: tách từ, phân loại tên thực thể từ, phân loại văn bản, tóm tắt văn bản, sinh văn bản, nhận dạng/tổng hợp tiếng Việt, nhận dạng chữ Việt, trích rút thông tin, chính tả tiếng Việt, dịch máy văn bản tiếng Việt sang các ngôn ngữ khác... Một số bài toán trong lĩnh vực tiếng Việt đã được giải quyết khá tốt và vẫn còn nhiều bài toán mới ở bước sơ khởi và còn nhiều thách thức: trích rút thông tin, tóm tắt văn bản, dịch máy...

 Vấn đề rất cần nghiên cứu hiện nay là gì?

Đó là các vấn đề liên quan đến việc giữ gìn và bảo tồn ngôn ngữ của đồng bào dân tộc thiểu số. "Tiếng nói, chữ viết là hồn cốt của một tộc người. Mất tiếng mẹ đẻ cũng tương tự với nguy cơ mất đi hồn cốt, bản sắc văn hóa của tộc người đó.." [2]. Nghị định số 82/2010/NÐ-CP của Chính phủ đã quy định việc dạy và học tiếng nói, chữ viết của dân tộc thiểu số trong các cơ sở giáo dục phổ thông, trung tâm giáo dục thường xuyên. Trong số 54 dân tộc thiểu số, có 24 dân tộc có chữ viết riêng của mình, còn lại nhiều dân tộc chưa có chữ viết. Trong số những dân tộc có chữ viết thì cũng nhiều dân tộc chưa được mã hóa, chưa có font chữ và bộ gõ trên máy tính. Không có chữ viết và font chữ thì rất khó để bảo tồn và duy trì ngôn ngữ đó. Không tạo được văn bản trên máy tính thì sẽ không quảng bá được trên Internet... Có một số đề tài khoa học trong nước đã tiến hành xây dựng cách viết cho một số ngôn ngữ chưa có chữ viết bằng việc sử dụng các ký tự Latin và sử dụng các tổ hợp ký tự tiếng Việt để tạo các ký tự chữ viết cho ngôn ngữ đó, nhằm hạn chế phải xây dựng font chữ và bộ gõ mới cho ngôn ngữ, tuy nhiên phương pháp này không tuân thủ theo ký mã ngữ âm quốc tế, rườm rà, và không bảo đảm tính đơn trị và tính nghệ thuật của chữ viết, cần phải có những nghiên cứu triệt để hơn nữa.

Vấn đề quan trọng nữa là các giải pháp xây dựng cách viết cho ngôn ngữ dân tộc thiểu số hiện nay thực hiện thiếu quy hoạch và đồng bộ, dẫn đến việc chồng lấn mã ký tự và chưa tương thích với nhau và chưa tương thích với tiêu chuẩn Unicode của thế giới. Thêm nữa các ký tự chữ viết dân tộc thiểu số dù đã được mã hóa hay chưa thì đa phần đều chưa được quy hoạch và chưa được đăng ký trong bản đồ ký tự Unicode thế giới, nếu không đăng ký, đề xuất sớm, kho ký tự Unicode càng ngày càng giảm và nếu có cũng phải sang các khu vực không thuận lợi, vì vậy việc làm cần thiết ngay trong việc bảo tồn ngôn ngữ của các đồng bào dân tộc thiểu số là quy hoạch tổng thể về chữ viết, xây dựng chữ mới cho các ngôn ngữ chưa có chữ viết và đăng ký bộ mã ký tự của các ngôn ngữ vào trong bảng mã Unicode.


VI. Kết luận


CVNSS4.0 có ưu điểm là ngắn gọn, chỉ dùng 7-Bit để ký mã, chỉ dùng các ký tự tiếng Anh không dấu và không cần bộ gõ riêng để gõ, tuy nhiên có nhiều điểm thiếu khoa học trong thiết kế, chưa tuân thủ cấu trúc ngôn ngữ tiếng Việt, không tuân thủ hệ thống ngữ âm quốc tế, không bảo đảm tính đơn trị, còn nhập nhằng và khó nhớ, phải xử lý nhiều tình huống theo vị trí trong từ, phụ thuốc vào việc kết hợp với các nguyên âm và cũng như các đề xuất khác có thể làm mất đi những giá trị văn hóa, quốc hồn quốc túy của con chữ đã được xây dựng hàng thế kỷ qua và cuối cùng là vô cùng tốn kém và làm đảo lộn đời sống văn hóa cũng như hệ thống pháp lý hiện hành. Nếu CVNSS4.0 không thể thay thế CQN và tồn tại song song thì giá trị của nó rất ít và nó chỉ đơn thuần là một phương pháp gõ tắt mà thôi.
Để phát huy tính sáng tạo trong lĩnh vực ngôn ngữ thì còn rất nhiều những vấn đề và thách thức đang chờ đợi những người có tâm huyết để giải quyết mà không nhất thiết phải đi cải tiến con chữ đã ổn định đã được cả dân tộc chấp nhận và yêu mến từ bao đời nay.


Thông tin trải nghiệm liên quan của người viếtTừ năm 1995 cho đến nay người viết đã được mời tham gia vào Tiểu ban kỹ thuật của Ban tiêu chuẩn Việt Nam trong lĩnh vực CNTT (Thuộc Tổng cục Đo lường Chất lượng), cũng là người dự thảo Tiêu chuẩn Việt Nam TCVN-6906:2001 Bộ mã ký tự 16-Bit tiếng Việt, và là một trong số những người có nhiều đóng góp trong việc đưa Unicode thành tiêu chuẩn Việt Nam và thống nhất bộ mã dùng chung trong toàn quốc (trước đó có đến 43 bộ mã, bộ font tiếng Việt khác nhau và không thể liên thông được với nhau). Gần như một mình đấu tranh trên truyền thông (trên Tạp chí PCWorld) để bảo vệ phương án ký tự dựng sẵn (mà chúng ta vẫn dùng từ 2002 đến nay) trước sự áp đặt mã tổ hợp từ phía Microsoft và các đối tác như Lạc Việt, VASC (nếu dùng phương án này chữ Việt tổ hợp sẽ chỉ dùng được trên nền tảng của Microsoft không tương thích với các hệ điều hành Linux, MacOS, Android, IOS). Từ năm 1991 người viết đã phát triển bộ gõ đầu tiên cho hệ điều DOS: TVNICP và bộ gõ cho chế bản điện tử TVENL (Dùng cho Ventura phiên bản DOS), sau đó năm 1994 phát triển bộ gõ Vietkey for Windows, năm 1998: Vietkey for Linux; năm 1999: Vietkey 4.0 là một trong các bộ gõ Unicode đầu tiên ở Việt Nam, năm 2000: Vietkey Office (chuyển mã tiếng Việt, kiểm tra chính tả và sắp xếp tiếng Việt tích hợp trong MS Word, Excel, Powerpoint; năm 2001: phát triển Vietkey4Palm (bộ gõ tiếng Việt đầu tiên cho hệ điều hành PalmOS). Người viết cũng đã từng tự vẽ và xây dựng 250 font truetype chữ Việt cho chế bản điện tử và font tiếng Việt cho PalmOS.

VII. Tài liệu tham khảo




Share:

Recent Posts

Definition List