Nguồn gốc của Tiếng Việt
Nguồn gốc của tiếng Việt là một vấn đề phức tạp, đã được đưa ra mổ xẻ, bàn thảo trong khoảng gần 200 năm gần đây. Cho tới thời điểm hiện tại, đa phần các nhà nghiên cứu Việt Nam và quốc tế đều ủng hộ giả thuyết tiếng Việt có nguồn gốc từ ngữ hệ Austroasiatic (Nam Á), nằm trong phân nhánh Mon-Khmer (tức là cùng nguồn gốc với các ngôn ngữ thuộc nhánh này, không phải là tập con của các ngôn ngữ Mon và Khmer). Nhưng vẫn còn rơi rớt những quan điểm trái ngược với quan niệm chung này, như có người cho rằng tiếng Việt là một nhánh con của tiếng Hán, hoặc cần được xếp vào hệ ngôn ngữ Tai-Kadai hay Austronesian.
Những giả thuyết cho rằng tiếng Việt liên quan tới tiếng Hán hoặc Tai-Kadai, Austronesian đa phần chỉ dựa vào một số biểu hiện bề ngoài, hoặc dựa trên những bằng chứng chưa được xác minh. Để có thể hiểu rõ được nguồn gốc của tiếng Việt, cần phải nghiên cứu toàn diện dựa trên những yếu tố cốt lõi thường dùng để đánh giá nguồn gốc của một ngôn ngữ, đây là mục tiêu mà phần này sẽ khái quát lại, dựa trên những nghiên cứu của Alves (M. Alves, 2006).
Vấn đề nguồn gốc của tiếng Việt bắt đầu được đề cập và bàn thảo từ thế kỷ 19, khi Giám mục Jean-Louis Taberd lần đầu tiên tuyên bố rằng tiếng Việt là một biến thể của tiếng Hán. Sau đó, vào năm 1856, James Logan đã suy đoán trên khối lượng dữ liệu hạn chế rằng “tiếng An-Nam” là một bộ phận của họ ngôn ngữ Mon-Khmer mà ông gọi là “cấu trúc Mon-An-Nam” (Gage, 1985). Năm 1912, Henri Maspéro đã viết một chuyên khảo trong đó ông khẳng định rằng tiếng Việt thuộc nhóm ngôn ngữ Tai (Maspero, 1912).
Phải tới giữa thế kỷ 20, André Haudricourt, một nhà nghiên cứu ngôn ngữ người Pháp khác đã xuất bản ba bài viết (Haudricourt, 1953, 1954, 1955) cung cấp căn cứ ngôn ngữ học theo đó tiếng Việt có thể được chứng minh một cách thuyết phục là có nguồn gốc thuộc hệ ngôn ngữ Austroasiatic (Nam Á) cả trên cơ sở dữ liệu về từ vựng và âm vị.
Từ đó, các nghiên cứu về đề tài này chủ yếu tập trung vào các mối quan hệ giữa tiếng Việt với ngữ hệ Nam Á nói chung và nhóm Mon-Khmer nói riêng. Michel Ferlus (Ferlus, 1975, 1981), Gage (Gage, 1985), Gerard Diffloth (Diffloth, 1989, 1990), Nguyễn Văn Lợi (Nguyễn, 1995) và Nguyên Tài Cẩn (Cẩn, 1995) đã đưa ra một số ấn phẩm quan trọng nhất về vấn đề này, và các công trình của nhiều học giả khác đã cung cấp thêm các bằng chứng hỗ trợ.
Ngành ngôn ngữ tiếp cận về nguồn gốc của ngôn ngữ dựa trên những dữ liệu về ngôn ngữ, văn hoá, lịch sử hiện có để đưa ra các giả định logic và loại trừ một số khả năng không có cơ sở. Sử dụng các thông tin như vậy, các nhà nghiên cứu có thể trình bày quan điểm về cơ cấu ngôn ngữ học của các ngôn ngữ trong quá khứ (được gọi là “phục nguyên”), tương tác giữa các ngôn ngữ và các nhóm ngôn ngữ (ví dụ sự vay mượn các thành tố từ vựng và cấu trúc ngôn ngữ), và các mối quan hệ phả hệ ngôn ngữ học (ví dụ mối quan hệ với một họ ngôn ngữ nhất định) (M. Alves, 2006).
Trong nghiên cứu phả hệ của ngôn ngữ, có hai thành tố cơ bản cho phép các nhà nghiên cứu xếp hai ngôn ngữ vào một họ ngôn ngữ là: (1) một bộ từ vựng cơ bản chung, (2) các bộ âm tương xứng lặp lại nhiều lần giữa hai ngôn ngữ (ví dụ một âm trong một ngôn ngữ giống hệt hay tương tự như một âm trong nhiều từ cùng gốc [tức là các từ có chung nguồn gốc] thuộc một ngôn ngữ khác, do đó tạo ra một mô hình tương xứng) (M. Alves, 2006).
Từ vựng cơ bản của một ngôn ngữ bao gồm các loại từ ít có khả năng mất đi trong thời gian hàng thế kỷ hay thiên niên kỷ, và loại từ này có nhiều khả năng tồn tại trong thời gian dài hơn các loại từ vựng không phải là cơ bản khác. Những từ có thể được xem là thực sự cơ bản bao gồm các, các bộ phận của cơ thể, các hiện tượng thiên nhiên và động vật thông thường, và các hành vi/hoạt động cơ bản, ngoài các loại ngữ nghĩa thông thường khác và các khía cạnh về sự tồn tại của con người. Đây chính xác là các từ mà chúng không chỉ liên kết các ngôn ngữ Austroasiatic thành một hệ ngôn ngữ, mà còn liên kết chúng với ngôn ngữ tiếng Việt (M. Alves, 2006).
Để xác định cùng nguồn gốc phả hệ của ngôn ngữ, sự tương xứng về âm vị giữa các bộ từ vựng cơ bản trong hai ngôn ngữ cần phải bao gồm các mục từ vựng được phục nguyên theo hệ thống văn hóa và cách sống dựa trên từ vựng cơ bản. Điều này cũng đòi hỏi phải so sánh với các giai đoạn trước đó đã được phục nguyên của ngôn ngữ chứ không phải dạng hiện đại của chúng. Có được các từ cùng gốc với sự tương xứng về âm vị trong nhiều ngôn ngữ khác nhau, kể cả các ngôn ngữ xa nhau về địa lý (do đó giảm bớt khả năng vay mượn), có thể củng cố thêm lập luận về cùng nguồn gốc phả hệ. Nếu không có loại bằng chứng này, các lập luận đó sẽ kém thuyết phục hơn (M. Alves, 2006).
Mark Alves trong bài nghiên cứu của mình, đã loại trừ những tiêu chí kém thuyết phục, và nhận diện các tiêu chí có tính thuyết phục để xác định nguồn gốc của tiếng Việt, trong đó bao gồm các tiêu chí:
1. Số lượng từ vựng cơ bản (toàn bộ)
2. Các mô hình tương xứng về âm vị của từ vựng cơ bản (toàn bộ)
3. Số lượng các ngôn ngữ trong một hệ ngôn ngữ có từ gốc chung (toàn bộ)
4. Các khả năng đa dạng trong các hệ ngôn ngữ khác nhau (loại trừ)
5. Tính chất tượng thanh (loại trừ)
Từ cơ sở đã được xác lập này, (M. Alves, 2006) đã tiến hành tìm hiểu dựa trên những tiêu chí này, đối chiếu với tất cả các giả thuyết liên quan để tìm ra kịch bản có cơ sở nhất về nguồn gốc của tiếng Việt.
1. Tiếng Hán:
Tiếng Việt và tiếng Hán đã có lịch sử giao thoa và ảnh hưởng trong khoảng 2000 năm, một nghìn năm đô hộ của các triều đại phương Bắc, cùng hơn 1000 năm chịu ảnh hưởng văn hóa, thời gian giao lưu lâu dài như vậy, đã làm cơ sở cho sự xuất hiện của những giả thiết cho rằng tiếng Việt là một bộ phận của tiếng Hán.
Giám mục Jean-Louis Taberd là người đầu tiên tuyên bố rằng tiếng Việt là một biến thể của tiếng Hán (Gage, 1985). Giả thuyết này vẫn còn rơi rớt ở hiện tại trong một số nhận định về nguồn gốc của tiếng Việt (thường là của những người không chuyên về ngôn ngữ học). Quan điểm này dựa vào số lượng từ mượn gốc Hán (được phỏng đoán là) rất lớn trong tiếng Việt, những nét giống nhau về loại hình ngôn ngữ và sự sử dụng chữ Hán trong tiếng Việt.
Tuy nhiên, những khía cạnh này đều có vấn đề, từ ngữ có thể được vay mượn ở bất cứ ngôn ngữ nào, để biết được về nguồn gốc ngôn ngữ, cần phải xem xét các loại từ dùng chung giữa các ngôn ngữ cũng như các khối lượng từ vựng cơ bản. Về thanh điệu, không chỉ tiếng Việt và tiếng Hán, mà các hệ ngôn ngữ xung quanh như Tai-Kadai và Hmong-Mien cũng có thanh điệu. Chữ viết dùng chung cũng không phải chỉ thị cho nguồn gốc ngôn ngữ. Một điều quan trọng nữa cần chú ý, đó là sự giống nhau của tiếng Việt và tiếng Hán không nhất thiết là kết quả của ảnh hưởng tiếng Hán, mà có thể là kết quả tiến hóa nội tại của tiếng Việt, tương tự như bất kỳ hệ ngôn ngữ nào khác trong vùng Đông Nam Á. (M. Alves, 2006)
Những điểm khác biệt giữa tiếng Việt và tiếng Hán cũng đóng vai trò quan trọng trong xác định nguồn gốc ngôn ngữ. Một số ví dụ có thể xác định, như: trừ một số trường hợp chuyên biệt, không một đại từ hay số từ nào trong tiếng Việt có nguồn gốc từ tiếng Hán; những từ biểu đạt các hiện tượng thiên nhiên thực sự cơ bản cũng không xuất phát từ tiếng Hán; về ngữ pháp, trật tự danh từ trong cụm từ tiếng Việt đặt danh từ trước từ bổ nghĩa là ngược lại với tiếng Hán từ bổ nghĩa đứng trước danh từ. Loại từ vựng mà tiếng Việt vay mượn từ tiếng Hán phần lớn chính là loại từ vựng mà các ngôn ngữ thường vay mượn nhau: đó là từ vựng chỉ các vật dụng mang tính văn hoá cụ thể và các biểu đạt về văn hoá (ví dụ các dụng cụ trong gia đình, các vật dụng hay khía cạnh về y tế, về cơ quan quản lý của chính phủ, và nghệ thuật), và không phải là từ vựng cơ bản là các từ tương đối có sức chống lại việc vay mượn (M. Alves, 2006).
2. Hệ ngôn ngữ Tai-Kadai:
Tuyên bố hùng hồn nhất về nguồn gốc Tai của tiếng Việt là do Maspéro đưa ra trong một bài viết dài 120 trang đăng trên tạp chí L’École Francoise d’Extrême – Orient (Maspero, 1912), trong bài viết này, Maspéro chỉ ra khoảng một trăm từ mà ông coi là có cùng nguồn gốc chung giữa tiếng Việt và tiếng Tai-Kadai.
Tuy nhiên, Haudricourt (Haudricourt, 1954) chỉ ra rằng một số lượng đáng kể hình thái mà người ta cho là ngôn ngữ Tai trong thực tế có nguồn gốc từ tiếng Hán. Hơn nữa, những dữ liệu của Maspéro bộc lộ nhiều trường hợp là bằng chứng kém thuyết phục về từ vựng và âm vị, như các trường hợp từ tượng thanh (ví dụ như “mèo”), hay các hình thái được thấy trong các ngôn ngữ ở khắp vùng Đông Nam Á.
Thêm một khả năng phức tạp khác ít được các học giả trong ngành ngôn ngữ học lịch sử Đông Nam Á thảo luận tới, đó là một số từ tiếng Tai trong lãnh thổ Việt Nam được vay mượn từ tiếng Việt. Trong tình hình như vậy, những từ Tai mượn từ tiếng Việt sẽ gây cảm tưởng sai lầm rằng đó là tiếng Việt mượn của ngôn ngữ Tai.
Cuối cùng, sự thiếu vắng vốn từ vựng cơ bản chung, như đại từ, số từ, từ chỉ các bộ phận của cơ thể, hay các danh từ và động từ cơ bản khác khá có sức thuyết phục trong việc không xếp tiếng Việt vào hệ ngôn ngữ Tai-Kadai.
3. Các nguồn gốc Thái Bình Dương - Nhóm Nam Đảo và tiếng Nhật:
Những công trình nghiên cứu ban đầu để chứng minh cho mối quan hệ giữa tiếng Việt với ngôn ngữ vùng Nam Đảo là của Nobuhiro Matsumoto, Bình Nguyên Lộc và Nguyễn Ngọc Bích (Bích, 1994; Lộc, 1971; Matsumoto, 1928). Matsumoto là người đi xa nhất, gợi ra mối quan hệ giữa tiếng Việt và cả tiếng Nhật lẫn tiếng Malay-Polynesian. Ông đã đưa ra hơn bảy mươi từ gốc có khả năng liên quan giữa tiếng Việt và tiếng Nhật, nhưng chỉ có 9 hình thái để bảo vệ cho quan điểm về mối liên kết giữa tiếng Việt và tiếng vùng Nam Đảo.
Bằng chứng này bao gồm một số từ vựng có vẻ là cơ bản nhưng không có các hình thái cơ bản hệ thống nào, và không có số đếm, đại từ, từ mô tả các bộ phận cơ thể hay các từ vựng thực sự là cơ bản khác. Một vấn đề khác rất dễ nhận thấy đối với danh mục các từ này là thiếu những tương ứng âm vị, nhất là về khía cạnh thanh điệu và không có sự giải thích hợp lý nào được đưa ra. Sự thiếu vắng một cơ sở chắc chắn về từ vựng cơ bản và các mô hình về sự tương ứng âm vị làm cho lập luận rằng tiếng Việt có nguồn gốc từ họ ngôn ngữ vùng Nam Đảo trở nên rất bấp bênh.
4. Ngữ hệ Nam Á và nhóm Mon-Khmer:
Bằng chứng về từ vựng và âm vị cho thấy một cách chắc chắn rằng có một mối quan hệ giữa tiếng Việt với liên họ ngôn ngữ Nam Á. Những nghiên cứu ban đầu về các khía cạnh này là của Maspéro (mặc dù ông ta lập luận nguồn gốc tiếng Việt là tiếng Tai), Gordon Luce, David Thomas với Robert Headley, và Franklin Huffman (Huffman, 1977; Luce, 129 C.E.; Maspero, 1912; Thomas & Headley, Jr, 1970). Sử dụng phương pháp luận thống kê từ vựng, Thomas và Headley cho thấy rằng tỷ lệ từ vựng cơ bản chung giữa tiếng Việt và tiếng Mon-Khmer là 25%, tương tự với tỷ lệ giữa các nhánh của ngôn ngữ Mon-Khmer (khoảng 25-35%). Các công trình nghiên cứu cung cấp bằng chứng về sự tương xứng về âm vị gồm cả tác phẩm của Haudricourt, Ferlus, Gage, Diffloth và Nguyễn Tài Cẩn (Cẩn, 1995; Diffloth, 1989; Ferlus, 1975; Gage, 1985; Haudricourt, 1954). Trong một cuốn sách dành toàn bộ cho đề tài này, Ferlus và Nguyễn Tài Cẩn chỉ ra rằng con đường phát triển âm vị của tiếng Việt đã trải qua hơn hai nghìn năm từ gốc Mon-Khmer của nó.
Cơ sở từ vựng học liên kết tiếng Việt với tiếng Mon-Khmer gồm vốn từ vựng cơ bản chung chung về mặt ngữ nghĩa, và điều quan trọng là đó chính là vốn từ vựng liên kết giữa các ngôn ngữ khác với các tiểu nhánh của các ngôn ngữ Mon-Khmer. Danh sách gồm một trăm từ mà Huffman đưa ra năm 1977 cho thấy vài chục từ có thể là từ cùng gốc Việt/Khmer với nhiều tương ứng về âm với hàng chục ngôn ngữ Mon-Khmer khác. Điều mà bằng chứng này cho thấy là (1) vốn từ cơ bản, (2) sự tương ứng về âm vị, và (3) sự lan toả của vốn từ vựng này trong nội tại các ngôn ngữ cũng như giữa các tiểu nhánh của ngôn ngữ Mon-Khmer.
Chất lượng của vốn từ vựng cơ bản của Mon-Khmer trong tiếng Việt cũng ở một mức độ cao, ví dụ như trong tiếng Việt, có các từ cơ bản như "chó", "cá", "rắn" là những từ thực sự cơ bản về động vật, ngược lại với những từ chỉ chủng loại cụ thể hơn của các loài vật này. Các từ cơ bản về bộ phận cơ thể như "chân", "tay", "tai", "mũi" là những từ có liên hệ trong toàn bộ hệ ngữ Mon-Khmer. Các động từ cơ bản như "ngồi", "mắng", "chết" cũng có gốc Mon-Khmer. David Thomas đã chỉ ra rằng tất cả số đếm từ một đến mười trong tiếng Việt đều thuộc họ Mon-Khmer.
Dữ liệu ngôn ngữ từ tiếng Chứt (Ferlus, 1977), một ngôn ngữ ở vùng cao Bắc Trung Bộ Việt Nam và biên giới Việt, Lào đã cung cấp các thông tin về thời điểm phát triển âm vị trong tiếng Việt. Sự tồn tại của các tiền âm tiết trong tiếng Chứt, vốn rất gần gũi với tiếng Việt, đã cho thấy, sự chấm dứt của các tiền âm tiết mới chỉ xảy ra cách đây vài thế kỷ hoặc sớm hơn.
Khi xem xét các giai đoạn xa xưa của âm vị tiếng Việt, sự giống nhau hiện tại giữa tiếng Việt với tiếng Tai hay tiếng Hán được xem xét theo một cách mới. Giai đoạn hiện đại của cấu trúc âm vị tiếng Việt chỉ là điểm kết thúc của một tiến trình đơn âm hoá kéo dài mà nguyên nhân của nó có thể là sự giảm bớt nội tại tiếp theo các xu hướng chữ viết cũng như sự hội nhập dần dần của hàng trăm từ đơn âm tiếng Hán trong hơn hai ngàn năm.
Có hai thông tin bổ sung chứng minh về nguồn gốc Mon-Khmer của tiếng Việt: thứ nhất, tiếng Việt có bằng chứng cả về các nhóm đầu từ và các tiếp đầu ngữ hay trung tố, mà một số tương ứng với các hình thể ngôn ngữ Mon-Khmer; thứ hai, các mô hình của các từ láy, trong đó một âm tiết đơn nhất được lặp lại một phần nhưng thường với một âm thay đổi, là một khía cạnh gợi ra sự giống nhau về chữ viết với các ngôn ngữ Mon-Khmer, trường hợp này đúng hơn với các ngôn ngữ Mon-Khmer gần gũi về mặt địa lý với tiếng Việt (Ferlus, 1975).
Trong chủng loại này có hai thông tin bổ sung có thể làm nổi bật nguồn gốc Mon-Khmer của tiếng Việt. Thứ nhất, tiếng Việt có bằng chứng cả về các nhóm đầu từ và các tiếp đầu ngữ hay trung tố, mà một số tương ứng với các hình thể ngôn ngữ Mon-Khmer. Những bằng chứng như vậy gần như bị thất thoát trong quá trình đơn âm hoá. Thứ hai, các mô hình của các từ láy, trong đó một âm tiết đơn nhất được lặp lại một phần nhưng thường với một âm thay đổi, là một khía cạnh gợi ra sự giống nhau về chữ viết với các ngôn ngữ Mon-Khmer. Đúng ra, trường hợp này xảy ra với các ngôn ngữ Mon-Khmer được sử dụng để nói bên trong hay sát với lãnh thổ tiếng Việt nhiều hơn là các vùng xa về địa lý, và điều đó gợi ra một loại ảnh hưởng vùng và không nhất thiết là nguồn gốc ngôn ngữ (Davidson, 1975). Có lẽ hiện tượng láy nhiều từ có âm vị tách biệt, một đặc điểm có trong tiếng Việt và tiếng Pacoh, một đặc tính ngôn ngữ học khác thường và nổi bật, là có sức thuyết phục hơn.
5. Kết luận:
Qua so sánh với tất cả các hệ ngôn ngữ, chỉ có ngôn ngữ Mon-Khmer được chứng minh là có chung kho từ vựng nòng cốt cơ bản với tiếng Việt, với lượng tương ứng âm vị bất qui tắc đáng kể, trong khi với các nhóm ngôn ngữ khác thì không có hiện tượng như vậy.
Về những vấn đề liên quan đến âm vị và chữ viết nói chung, giữa tất cả các nhóm ngôn ngữ đều có sự trùng lặp, và có lẽ đây là nguồn gốc lớn nhất của tình trạng nhầm lẫn trong quá trình nghiên cứu này. Có lẽ tốt hơn là coi các đặc điểm ngôn ngữ này ở vùng ngôn ngữ Đông Nam Á là kết quả của quá trình giao lưu ngôn ngữ lâu dài chứ không phải là có chung nguồn gốc ngôn ngữ.
Có thể kết luận lại, kịch bản về nguồn gốc Austroasiatic hay Mon-Khmer của tiếng Việt có cơ sở vững chắc nhất, không hệ ngôn ngữ nào khác có kho từ vựng nòng cốt cơ bản chung với tiếng Việt, cùng với sự tồn tại của lượng âm vị bất qui tắc đáng kể, khiến các giả thuyết khác về nguồn gốc của tiếng Việt trở nên có cơ sở rất yếu hoặc không có cơ sở.
Viết lại từ bài của Mark Alves: https://www.researchgate.net/profile/Mark-Alves/publication/242720787_Khai_quat_cac_nghien_cuu_ngon_ngu_hoc_ve_nguon_goc_cua_tieng_Viet/links/59e7e868a6fdccfe7f8b081d/Khai-quat-cac-nghien-cuu-ngon-ngu-hoc-ve-nguon-goc-cua-tieng-Viet.pdf?fbclid=IwAR2LXWFm5rVX6YSb4r4kUgHIMgoCnkJ5MNkcDp_bVq6o5IsPVUrVHC7ggVU
Tác giả: Lược Sử Tộc Việt