Về mối quan hệ giữa tiếng Việt và tiếng Hán và nguồn gốc dân tộc Việt Nam

Tác giả: Nguyễn Hải Hoành

Tiếng Việt là tiếng nói của dân tộc Kinh Việt Nam; tiếng Hán là tiếng nói của dân tộc Hán Trung Quốc. Mối quan hệ giữa hai thứ tiếng này xưa nay vẫn là mối quan tâm lớn của người Việt, cũng là đối tượng nghiên cứu của các nhà ngôn ngữ học Việt Nam và quốc tế; trong gần 150 năm nay họ đã công bố nhiều kết quả nghiên cứu, trong đó tác phẩm xuất bản gần đây nhất là cuốn “Lịch sử ngôn ngữ người Việt[1] dầy hơn 600 trang, ghi lại kết quả ngót 50 năm nghiên cứu vấn đề trên của giáo sư, tiến sĩ ngôn ngữ học Trần Trí Dõi, Chủ nhiệm Bộ môn “Ngôn ngữ và Văn hoá các dân tộc thiểu số Việt Nam”, Khoa Ngôn ngữ học, Trường Đại học Khoa học xã hội và Nhân văn (Đại học Quốc gia Hà Nội). Tác giả đưa ra một số quan điểm đáng chú ý về nguồn gốc tiếng Việt và nguồn gốc dân tộc ta, là những vấn đề ai cũng quan tâm. Vì vậy, tuy là kẻ ngoại đạo với ngôn ngữ học, chúng tôi vẫn đánh bạo bày tỏ ý kiến về các vấn đề đó; nếu có sai sót xin quý vị chỉ bảo.

Khi xem xét nguồn gốc của một ngôn ngữ, trước hết các nhà nghiên cứu đều định vị ngôn ngữ ấy thuộc vào nhóm ngôn ngữ nào, nhánh ngôn ngữ nào trong ngữ hệ nào. Ở đây ngữ hệ (họ ngôn ngữ, language family) là tên gọi chung một tập hợp các ngôn ngữ có cùng nguồn gốc; như vậy các ngôn ngữ khác ngữ hệ thì không chung nguồn gốc.

Sách “Lịch sử ngôn ngữ người Việt” có nêu vấn đề: trong cuốn Dictionarium Anamitico Latinum (Từ điển Annam-Latin) ấn hành tại Kẻ Sở năm 1877, tác giả sách là cha cố J. S. Theurel từng đưa ra nhận xét “tiếng Việt phần lớn bắt nguồn từ tiếng Hán”.[2] Nhận xét đó dựa trên chứng cớ hiển nhiên là trong tiếng Việt có rất nhiều từ gốc Hán và có một số hiện tượng ngữ pháp rất giống tiếng Hán, vì thế ý kiến của Theurel được một số người tán đồng, hình thành quan điểm cho rằng ngôn ngữ của người Việt có nguồn gốc ở tiếng Hán, tiếng Việt là một ngôn ngữ thuộc nhóm tiếng Hán của ngữ hệ Hán-Tạng (Sino-Tibetan), nghĩa là tiếng Việt, tiếng Hán có chung ngữ hệ, tức chung nguồn gốc. Từ đó suy ra người Việt có nguồn gốc ở phương Bắc, về sau di cư xuống miền Nam. Rốt cuộc, nguồn gốc ngôn ngữ có liên quan tới nguồn gốc dân tộc. Đây là một vấn đề hệ trọng được nhiều người quan tâm.

Năm 1912, Henri Maspéro (1883-1945) nhà khoa học người Pháp ở Viện Viễn đông Bác cổ nhận định tiếng Việt có nguồn gốc nhóm tiếng Thái (Taic). Căn cứ vào những chứng cớ mới rất chi tiết và có tính hệ thống chủ yếu về ngữ âm, dựa trên lập luận chặt chẽ, Maspéro đưa ra những kết luận thuyết phục được giới ngôn ngữ học suốt nửa thế kỷ sau đó, thậm chí sang thế kỷ 21 vẫn có người ủng hộ. Vì tiếng Thái thuộc ngữ hệ Tai-Kadai, khác với ngữ hệ của Hán ngữ, như vậy nghĩa là Maspésro cho rằng tiếng Việt không cùng nguồn gốc với tiếng Hán.

Nhưng đến các năm 1953, 1954 và 1966, một nhà ngôn ngữ học người Pháp rất nổi tiếng là Andre-Georges Haudricourt (1911-1996) công bố mấy bài báo phản bác quan điểm trên, cho rằng tiếng Việt có nguồn gốc Môn-Khmer, thuộc ngữ hệ Nam Á (Austroasiatic), nghĩa là không cùng nguồn gốc với tiếng Thái hoặc tiếng Hán. Lập luận của Haudricourt rất vững chắc và có nhiều chứng minh đầy sức thuyết phục, được nhiều nhà ngôn ngữ học Việt Nam và nước ngoài tán thành.

Trong nghiên cứu, các học giả đều xem xét mối quan hệ đối ứng từ vựng giữa tiếng Việt với các ngôn ngữ đối chiếu và chia từ vựng làm hai lớp: từ cơ bản và từ văn hoá. “Từ cơ bản” là những từ vựng thông dụng nhất, như từ mô tả các bộ phận cơ thể con người (chân, tay, mắt, mũi), từ nhân xưng (bố, mẹ, con, tao, mày), tên các vật xung quanh (nhà, cửa, trời, đất, trăng, sao), số đếm (một, hai, ba), tên gia súc (chó, mèo, trâu, bò, lợn), nhu cầu sống (ăn, uống, bú, ỉa, đái), cảm nhận (đau, giận, vui, buồn), v.v…, là những từ liên quan tới nguồn gốc con người, nguồn gốc ngôn ngữ, những từ người Việt sử dụng trong suốt thời kỳ khi tiếng Việt chưa bị ảnh hưởng của ngôn ngữ khác. Từ thuần Việt trong tiếng Việt hoặc từ thuần Hán trong tiếng Hán đều thuộc loại từ cơ bản.

Những từ ngữ phát sinh sau khi tiếp xúc một nền văn hoá khác thì thuộc lớp “Từ văn hoá”, thường là những từ có tính chất khái niệm thuộc lĩnh vực văn hoá, ví dụ: đông, tây, đạo, lý. Từ văn hoá xuất hiện sau từ cơ bản rất lâu, vì thế không liên quan đến nguồn gốc ngôn ngữ. Khi xác định nguồn gốc ngôn ngữ phải dựa vào từ cơ bản, không dựa vào từ văn hoá.

Sau khi phân loại từ vựng, Haudricourt nhận thấy số lượng từ thuần Việt tương ứng với từ trong ngôn ngữ Môn-Khmer nhiều hơn số lượng từ thuần Việt tương ứng với từ trong tiếng Thái, từ đó ông kết luận tiếng Việt có nguồn gốc Môn-Khmer chứ không có nguồn gốc Thái. Khi nghiên cứu vấn đề thanh điệu của tiếng Việt, ông cũng đi tới kết luận như vậy.

Từ vựng tiếng Việt hiện đại gồm từ thuần Việt, từ Việt gốc Hán, và từ ngoại lai. Từ thuần Việt ra đời cùng với tiếng Việt, có số lượng lớn và bền vững, gắn chặt với nguồn gốc dân tộc, thể hiện tính cội nguồn của ngôn ngữ, thuộc vào lớp từ cơ bản. Từ Việt gốc Hán ra đời sau khi nước ta tiếp xúc văn hoá Trung Hoa, cho nên thuộc lớp từ văn hoá. Từ ngoại lai ra đời sau khi Việt Nam tiếp xúc văn hoá Âu Mỹ, ví dụ các từ pho mát, ô tô, ga, ây-ai (AI).

Từ Việt gốc Hán, tức tHán-Việt là loại từ vựng do tổ tiên ta sáng tạo ra trong quá trình tiếp nhận chữ Hán. Thông thường người học chữ Hán đều phải đọc chữ theo âm tiếng Hán. Nhưng chữ Hán vốn dĩ khó học, khó nhớ, khó viết, khó dùng, lại không có phát âm thống nhất trong toàn Trung Quốc, mà mỗi vùng phát âm theo cách riêng gọi là phương ngữ (tiếng địa phương). Dân Trung Quốc nói nhiều phương ngữ, người Việt học chữ Hán từ người Trung Quốc sẽ không biết nên đọc chữ Hán theo phương ngữ nào, đây là một khó khăn lớn. Ngoài ra, phát âm theo phương ngữ nào cũng là điều rất khó đối với người Việt. Hơn nữa, học được một phương ngữ này thì cũng không thể giao tiếp bằng lời nói với người dùng phương ngữ khác, mà vẫn phải viết ra chữ Hán.

Để vượt qua các khó khăn trên, tổ tiên ta đã sáng tạo ra cách đọc chữ Hán bằng từ Hán-Việt, tức đọc theo âm tiếng Việt mà không đọc theo âm Hán. Nói cách khác, là thực hiện phiên âm mỗi chữ Hán thành một từ vựng tiếng Việt — gọi là từ Hán-Việt; từ này có âm đọc thống nhất trong toàn dân Việt. Âm đọc ấy được chọn gần giống âm đọc trong tiếng Hán, vì thế hầu hết từ Hán-Việt đọc lên nghe gần giống từ tiếng Hán. Ví dụ chữ  文 tiếng Hán đọc “uấn”, ta đọc tiếng Việt là “văn”. Bằng việc thực hiện phiên âm toàn bộ chữ Hán sang tiếng Việt, tổ tiên ta đã mượn được toàn bộ chữ Hán về dùng, nhưng không mượn tiếng Hán. Chú ý là những chữ Hán đa âm khi phiên âm sang tiếng Việt cũng được từ Hán-Việt đa âm. Ví dụ chữ 好 có hai âm tiếng Hán là [hǎo] và [hào] thì từ Hán-Việt cũng có hai âm tiếng Việt là “hảo” và “hiếu”.

Do tiếng Hán và tiếng Việt đều là ngôn ngữ đơn lập (đơn âm tiết, monosyllabic) nên việc phiên âm một đối một tương đối thuận tiện. Từ Hán-Việt là kết quả phiên âm chữ Hán, và chữ Hán trở thành ký tự ghi từ Hán-Việt, ví dụ chữ Hán 文化 ghi từ Hán-Việt “văn hoá”. Nhưng chữ Hán không ghi được từ thuần Việt, do đó không ghi được tiếng Việt – đây là lý do sau này tổ tiên ta sáng tạo chữ Nôm. Dù sao, chữ Hán được Việt Nam hoá phần âm đọc đã tạo thuận lợi cho việc học chữ Hán. Khi toàn bộ quá trình dạy chữ Hán đều dùng tiếng Việt, lẽ tự nhiên người Việt học chữ Hán sẽ dễ nhận biết, dễ nhớ, dễ đọc, dễ hiểu chữ Hán so với khi dạy bằng tiếng Hán, mang lại cảm giác đây là chữ viết của người mình. Có điều như vậy người Việt chỉ học được chữ viết mà không học tiếng Hán.

Từ Hán-Việt chỉ là từ vay mượn Hán ngữ. Các ngôn ngữ trên thế giới thường vay mượn từ vựng. Ví dụ Hán ngữ hiện đại có khoảng 70% từ khoa học xã hội-nhân văn là từ vay mượn tiếng Nhật. Đó là những từ vựng người Nhật chuyển ngữ từ tiếng Anh, Pháp,… sang chữ Kanji, ví dụ government, people, economy chuyển ngữ thành chính phủ, nhân dân, kinh tế. Ngôn ngữ học cho rằng từ văn hoá thường dễ vay mượn, từ cơ bản thì hiếm vay mượn. Có thể suy ra thời cổ dân ta chỉ nói từ thuần Việt, sau khi tiếp nhận chữ Hán thì bắt đầu nói thêm từ Hán-Việt, và ngày càng nói nhiều, nhất là khi nói hoặc viết về đề tài xã hội, thời sự, nghị luận, pháp lý, khoa học kỹ thuật. Như trong Hiến pháp Việt Nam, tỷ lệ từ Hán-Việt lên tới 90%.

Nhờ có thêm từ vay mượn nên kho từ vựng tiếng Việt tăng lên nhiều và ngày càng tăng. Năm 1912 Maspéro nói từ Hán-Việt chiếm 60% tổng số từ tiếng Việt. Năm 2001 Cao Xuân Hạo nói tỷ lệ này là 70%. Nghĩa là chữ Hán phiên âm đã làm số lượng từ tiếng Việt tăng đáng kể. Trong thực tế, người Việt dùng từ Hán-Việt rất linh hoạt, như ghép với từ thuần Việt (tái đàn, cận nghèo) hoặc ghép với nhau không theo quy tắc giữ gốc Hán (bán dẫn, giải ngân), thường xuyên tạo ra từ Hán-Việt mới, kết quả làm cho số lượng từ vựng tiếng Việt có khả năng tăng vô hạn. Vì thế rất khó xác định chính xác tỷ lệ của từ Hán-Việt trong tiếng Việt.

Từ Hán-Việt còn giúp người Việt thuận lợi chuyển ngữ các từ ngoại văn: khi ấy chỉ cần đọc âm Hán-Việt của từ Hán hoặc từ Kanji mà người Trung Quốc hoặc người Nhật chuyển ngữ từ vựng ngoại văn đó, là được kết quả. Ví dụ từ tiếng Anh “pragmatism”, người Nhật chuyển sang chữ Kanji là 實用主義, ta đọc Hán-Việt là “chủ nghĩa thực dụng”, được ngay kết quả cần tìm.

Tóm lại cách đọc chữ Hán bằng từ Hán-Việt, tức phiên âm chữ Hán thành tiếng Việt, đã giúp người Việt học được chữ Hán mà hoàn toàn không học nói tiếng Hán, qua đó bớt được nhiều khó khăn khi học thứ chữ ngoại văn này, đồng thời làm cho kho từ vựng tiếng Việt có khả năng phát triển vô hạn, cuối cùng giúp cho người Việt giữ được nguyên vẹn tiếng mẹ đẻ. Điều đó chống lại chính sách đồng hoá ngôn ngữ của phong kiến Trung Quốc. Bởi thế dĩ nhiên chỉ người Việt mới nghĩ ra cách đọc chữ Hán bằng từ Hán-Việt, và đây là một sáng tạo kiệt xuất về ngôn ngữ học của tổ tiên ta.

Nhưng không thể vì tiếng Việt có nhiều từ gốc Hán mà cho rằng tiếng Việt có nguồn gốc ở tiếng Hán, bởi lẽ từ Hán-Việt không phải là từ cơ bản, mà thuộc lớp từ văn hoá, chỉ xuất hiện sau khi nước ta tiếp xúc văn hoá Trung Hoa, tức khi bị Triệu Đà thôn tính và bắt đầu học Hán ngữ, nghĩa là sau từ thuần Việt nhiều nghìn năm. Do đó từ Hán-Việtnhiều đến đâu cũng không ảnh hưởng gì đến nguồn gốc tiếng Việt, không làm tiếng Việt trở thành một phương ngữ của Hán ngữ.

Khi so sánh các từ cơ bản với nhau, cũng không thấy từ thuần Việt nào có âm đọc giống từ thuần Hán tương ứng. Sự khác nhau ấy chứng tỏ tiếng Việt không cùng nguồn gốc với tiếng Hán. Điều đó còn được chứng tỏ ở chỗ tiếng Việt có ngữ âm phong phú gấp nhiều lần tiếng Hán và ngữ pháp khác tiếng Hán. Từ Hán-Việt có âm đọc giống tiếng Hán nhưng người Trung Quốc nghe đọc từ Hán-Việt thì không hiểu, tuy rằng nhìn chữ thì hiểu.

Hiện nay giới ngôn ngữ học chính thống Việt Nam và thế giới xếp tiếng Việt vào ngữ hệ Nam Á, nhánh Môn-Khmer, nhóm tiếng Việt (Vietic, Việt-Mường); Hán ngữ được xếp vào ngữ hệ Hán-Tạng. Sự việc tiếng Việt, tiếng Hán thuộc hai ngữ hệ khác nhau chứng tỏ ngôn ngữ Việt không cùng nguồn gốc với ngôn ngữ Hán. Đây là kết luận chủ yếu thu được sau 150 năm nghiên cứu vấn đề nguồn gốc tiếng Việt. Trên cơ sở đó giáo sư Trần Trí Dõi viết: Như vậy văn hoá Việt Nam cũng không thể chung nguồn gốc với văn hoá Hán. Thiển nghĩ, vì tiếng Việt khác ngữ hệ với các ngôn ngữ Bách Việt nên tiếng Việt cũng không cùng nguồn gốc với các ngôn ngữ Bách Việt, như với Tráng ngữ được học giả Trung Quốc Lương Đình Vọng coi là hậu duệ của ngôn ngữ Lạc Việt, thuộc ngữ hệ Tai-Kadai, các ngôn ngữ Bách Việt khác đều thuộc ngữ hệ Hán-Tạng.[3]

Tác giả sách “Lịch sử ngôn ngữ người Việt” còn đưa ra một nhận định quan trọng: Về mặt ngôn ngữ, đã có đủ cơ sở để cho rằng cộng đồng người nói tiếng Việt thực sự là một trong những cộng đồng cư dân bản địa chính từ thời tiền sử của vùng Đông Nam Á văn hoá, hoàn toàn không phải là những cư dân di cư từ phương Bắc tới. Quan điểm này là kết quả nghiên cứu dựa trên sự tìm hiểu nguồn gốc ngôn ngữ của người Việt trong sự so sánh với ngôn ngữ các dân tộc ở gần, tức dựa trên các nguyên tắc có căn cứ khoa học tin cậy của ngôn ngữ học lịch sử và so sánh (Historical-Comparative Linguistics), cho nên là quan điểm đúng đắn về lịch sử dân tộc Việt.

Từ đó suy ra dân tộc Việt có thể đã hình thành trên mảnh đất này từ hàng chục nghìn năm trước; theo thuyết “Đi khỏi châu Phi” (Out of Africa), thoạt tiên tổ tiên ta từ châu Phi di cư tới đây. Năm 1923, nhà khảo cổ Madeleine Coloni từng phát hiện di cốt người Việt cùng nền văn hoá của họ trong hang đá tỉnh Hoà Bình, các di vật có niên đại 18.000 năm trước Công nguyên. Hiện nay Trung tâm Nghiên cứu Tiền sử Đông Nam Á của Tiến sĩ Nguyễn Việt vẫn khai quật các di vật nền Văn hoá Hoà Bình.[4]

Lịch sử lâu đời giúp cho người Việt có đủ thời gian tạo được một ngôn ngữ chín muồi, giàu âm tiết nhất vùng Đông Á. So với Hán ngữ, tiếng Việt có số âm tiết cơ bản nhiều gấp 10 lần, số âm tiết chi tiết gấp 14 lần.[5] Ưu thế giàu ngữ âm làm cho tiếng Việt vững bền không dễ bị đồng hoá bởi các ngôn ngữ nghèo ngữ âm (như Hán ngữ). Thời Bắc thuộc có nhiều người Bách Việt, chủ yếu là binh lính, sang Việt Nam định cư, ngôn ngữ của họ có tác động đến kết quả phiên âm chữ Hán, tức từ Hán-Việt. Ví dụ chữ Hán 学习 tiếng Quảng Đông đọc “hoọc chập”, từ Hán-Việt là “học tập”, tuy rằng tiếng Bắc Kinh đọc “xuế xí”. Vì họ nhanh chóng bị Việt Nam hoá (do lấy vợ Việt, nói tiếng Việt) cho nên ảnh hưởng của ngôn ngữ Bách Việt đối với tiếng Việt hầu như không đáng kể.

Thiển nghĩ, kết luận người Việt “hoàn toàn không phải là cư dân di cư từ phương Bắc tới” cho thấy dân tộc ta thời cổ không có quan hệ gần gũi với các dân tộc ở phía Bắc biên giới Trung-Việt, với nhóm bộ tộc gọi là “Bách Việt”, chẳng những về địa lý ở xa cách họ mà về ngôn ngữ hoàn toàn không chung nguồn gốc. Có thể phỏng đoán người Việt nguyên thuỷ sống ở vùng núi Sơn La-Hoà Bình-Thanh Hoá, về sau các bộ tộc người Kinh di chuyển dần xuống vùng trung du Yên Bái, Phú Thọ, trong khoảng 2000 năm gần đây dần dần di chuyển xuống đồng bằng sông Hồng – vùng đất hình thành bởi sự bồi đắp của con sông này, như quan điểm của các học giả Lê Bá Thảo, Trần Trí Dõi…[6] Riêng người Mường anh em gần nhất của người Kinh thì vẫn ở lại vùng núi.

Cần nhấn mạnh, việc người Việt học và dùng chữ Hán nhưng không nói tiếng Hán trong hơn 1000 năm Bắc thuộc đã mang lại kết quả tất nhiên là tiếng Hán không thể đồng hoá được ngôn ngữ của người Việt. Rốt cuộc, nhờ giữ được nguyên vẹn tiếng mẹ đẻdân tộc ta, tổ quốc ta tồn tại đến ngày nay — đây là thắng lợi vĩ đại nhất trong lịch sử dân tộc Việt Nam. Ai cũng biết văn hoá Hán có sức đồng hoá rất mạnh. Ví dụ, dân tộc Mãn từng cai trị Trung Quốc 276 năm, mới đầu họ ra sức Mãn hoá ngôn ngữ và văn hoá của người Hán, nhưng chỉ sau một thế kỷ, chính họ lại bị Hán hoá, cuối cùng toàn bộ dân tộc Mãn chỉ nói tiếng Hán, dùng chữ Hán.

Tóm lại, tiếng Việt tuy là ngôn ngữ gần gũi nhất với Hán ngữ và chịu ảnh hưởng lớn của Hán ngữ nhưng lại không cùng nguồn gốc với Hán ngữ và không bị Hán ngữ đồng hoá, cho dù Việt Nam từng là quận huyện của Trung Quốc trong hơn 1000 năm liền. Không biết còn có dân tộc nào khác trên thế giới làm được điều kỳ diệu tương tự?

Một phiên bản của bài viết đã đăng trên tạp chí Tia Sáng, số 20, ngày 20/10/2023.

———————–

[1] Trần Trí Dõi: “Lịch sử ngôn ngữ người Việt – Góp phần tìm hiểu văn hoá Việt Nam”, Nxb ĐHQG Hà Nội, 2022.

[2] Joseph Simon Theurel, 1829-1868, người Pháp, Giám mục Giáo phận Hà Nội 1859-1868. Nhà thờ Kẻ Sở (thuộc Giáo phận Hà Nội) toạ lạc tại Hà Nam, được gọi là “Vương cung Thánh đường”.

[3] 梁庭望: 《骆越方国研究》民族出版社, 2017年. Tác giả là người dân tộc Tráng.

[4]Văn hoá Hoà Bình: Nền văn hoá tiền sử độc đáo”. Báo Điện tử Chính phủ, 30/8/2023.

[5] Xem: Nguyễn Quang Hồng: “Âm tiết và loại hình ngôn ngữ”, Nxb ĐHQG Hà Nội, 1995;  苏培成: “二十世纪的现代汉字研究”, 书海出版社, 2001年; Nguyễn Hải Hoành: “Một vài tìm tòi về ngôn ngữ”, tạp chí Tia Sáng số 11/2020.

[6] Li Tana: “A Historical Sketch of the Landscape of the Red River Delta” Cambridge University Press, 2016.

Tiếng Việt kỳ diệu: Hành trình từ chữ Nho, chữ Nôm đến chữ Quốc ngữ