语言学,这个是博主一直以来都很想聊的话题,由于实在是过于博大精深,涉及的内容极为广泛,今天斗胆班门弄斧这篇文章,还请各路大神指正。

—— 综述 ——

根据各类文献记载,目前地球上已知的活跃语言已超过7000种,每种语言根据其起源、使用地域、构词方法、发音等特点,分为了各个不同的家族,家族内部又进一步细分为多个分支。从大到小分别为:

语系 → 语族 → 语支 → 语言 → 方言

有点儿类似于生物学里对物种划分为“界门纲目科属种”,这5级里后两级大家比较熟悉,比如倒数第二级“语言”就是我们日常所说的“汉语”、“英语”、“法语”,也叫“语种”,而诸如“广东话”、“河南话”、“北京话”属于最后一级方言。但是语系、语族、语支这三个概念,大家日常接触的比较少。

什么是语系?

19世纪,欧洲的历史比较语言学派研究了世界上近一百种语言,发现有些语言的某些语音、词汇、语法规则之间有对应关系,有相似之处,便归为一类,称为同族语言;由于有的族与族之间又有些对应关系,又归为同系语言,这就是语言的谱系关系。

PS:历史比较语言学(historical comparative linguistics),它以历史比较法为基础,研究语言的亲属关系。历史比较语言学是语言学的重要组成部分,它为现代语言学的建立奠定了坚实的基础,是语言学走上独立发展道路的标志。

语系是语言谱系分类的最大单元。语系,是语言谱系分类的最大单元。由一个共同的原始母语分化的若干亲属语言组成。一般在语法、语音和词汇方面,都在不同程度上具有共同特性。凡是有亲属关系的语言,组成一个语系。

语族是语言谱系分类的二级单元,是同一语系中若干更加亲近的语言群。一般分为若干语支,也有的语族因为语言种类较少,不再划分语支。

语支,是语言谱系分类的三级单元,通常在语支之间的各语言,相近性非常大。

语种,就是我们平常所说的“语言”, 是语言谱系里的最小单元,可以继续划分为不同的方言。

在语系的分类上,世界不同的研究机构有较大的分歧,比如北京大学将世界语言分成了13大语系,而麻省理工则分成了6类,本文将在北大的基础上,挑选最常见的7个来展开,即:

印欧语系

汉藏语系

阿尔泰诸语

闪含语系

乌拉尔语系

高加索语系

南岛语系

南亚语系

达罗毗荼语系

特别提示:

(1)语言学的分类更多参考的是“语言”(比如发音、构词方法、语法)而不是“文字,比如英语中使用的字母,也就是拉丁字母,同时也在被众多其它语言使用,所以文字并不能很好地对不同语言进行区分。

(2)有些语言学家认为在语系之上还存在更大的一层叫做“超语系”,即很多语系的起源相同,可以进一步合并,但这种观点存在较大争议,本文不进行展开。

(3)在方言下,还可以继续细分为次方言,比如中国人都很熟悉,很多地方隔座山,隔条河,大家的口音就明显不同甚至听不懂,这就是同一个方言下的再次细分,由于其适用范围较窄且数量众多,本文也不再展开。

(4)不是所有语言都有其所属语系的,比如最常见的日语、韩语,主流学界认为二者是孤立语言,并不属于任一语系。(这点儿博主也比较惊讶)

(5)并不是每个语系都有完整四级分支,比如非洲、太平洋的很多小语系,项下只有几种语言,而印欧语系中的罗曼语族,就包含了法语、意大利语、西班牙语、葡萄牙语等众多语言。

—— 印欧语系 ——

印欧语系,Indo-European Languages,世界第一大语系,按照母语使用人口排名的话,约占世界人口的42%。印欧语系是十八世纪英国人威廉·琼斯提出的一个概念,他认为印度和欧洲的大部分语言都是从“原始印欧语”分化出来的,这些语言彼此之间具有亲属关系和相似性。

主要分支

历史发展

早在16世纪,当欧洲的传教士、商人、探险者到达东方开始学习梵语后,就逐渐认识到印度的梵语与欧洲的拉丁语、希腊语等语言之间有着广泛的相似性。

18世纪,英国的东方学学者威廉·琼斯爵士针对亚欧各种不同的语言,首先提出“原始印欧语”的存在,他提出了著名的“印欧语假说”来解释上述语言之间的相似性。他发现当时欧洲人已知的4种最古老语言,也就是拉丁语、希腊语、梵语、波斯语,之间有相似之处。

1786年,琼斯在印度的一次演讲中指出,梵语跟希腊语和拉丁语以及古英语之间,无论是在动词词根还是在语法形式方面都有系统性的相似点,而这种现象绝不是偶然的。任何语文学家都不能不承认这些语言衍生自同一原始母语。这种原始母语就是后来人们所说的原始印欧语(简称 PIE)。

19世纪初,德国的弗朗兹·保朴对此理论进行了系统的论证。此时,学者们通常将这系语言称为“印度-日耳曼语系”,有时候也叫“雅利安语系”。但后来人们逐渐发现欧洲大多数语言与此都有关联,名称也转变为印欧语系。

印欧语系的地域分布非常广泛,使用者几乎遍及整个欧洲、美洲、澳大利亚、新西兰,还有非洲和亚洲的部分地区。从15世纪开始,随着欧洲殖民势力不断扩张,一些欧洲语言陆续传到世界其他许多地区,这是印欧语系分布如此之广的直接原因。今天,以某一种印欧语系的语言为母语的人,约占世界人口的42%。需要指出的是,欧洲的巴斯克语、匈牙利语、芬兰语、爱沙尼亚语、萨米语、马耳他语,以及印度南部的达罗毗荼语等诸多语言虽然也分布于欧洲或印度,但并不属印欧语系。

语言特点

1、大多是屈折语:词形会发生变化,通过词形变化来表示各类语法关系。屈折语的屈折变化有两种形式。一种是外屈折,即通过加后缀的方式改变词形;一种是内屈折,即词根内部是有语音变化的,比如foot→feet;

2、名词有性、数、格:德语、法语、俄语名词有阴性阳性中性;名词有单复数;主格、宾格、所有格;

3、动词有时态、语态:比如现在时、过去时、将来时、完成时、进行时、被动语态、虚拟语气等;

4、主谓一致:当主语发生变化,谓语需要保持一致,英语举例:I love China. → He loves China.

文字展示

虽然再三强调,语言和文字是俩东西,但上表可以看出,相同语族内部的文字形式也较为相近。

—— 汉藏语系 ——

汉藏语系,Sino-Tibetan languages,世界第二大语系,约占世界人口的20%,包括互相有亲属关系的约457种语言。中国学者一般认为这个语系主要包含汉语族、藏缅语族、苗瑶语族以及壮侗语族这4大语族,但一些西方学者则否认苗瑶语族和壮侗语族属于汉藏语系,而把它们看作是各自单独的语系,本文还是以我国的学者思路为准。汉藏语族的起源是原始汉藏语,最早有文字记录的原始汉藏语就是甲骨文。

汉藏语系的假说于1924年首次提出,主要分布在中国、越南、老挝、柬埔寨、缅甸、泰国、印度东北部、尼泊尔、不丹、锡金、马来西亚、新加坡、印尼、中亚五国等亚洲各地。

主要分支

语言特点

1、大多是分析语。分析语,又称词根语、孤立语(孤立语和孤立语言是两回事),这类语言的特点在于其一般不是通过词形变化(即词的内部形态变化,又称作屈折变化)来表达语法的作用,而是通过独立的虚词和固定的词序来表达语法意义,而且一般而言,分析语没有性、数、格的变化,没有主谓一致,却有丰富的意境变化。

2、语序大多是主宾谓(SOV)。但是现代汉语除外,现代汉语是主谓宾(SVO)结构,其他汉藏语系语言大多是主宾谓结构。

3、固定声调。每个音节有固定的声调是汉藏语系在语音上的重要特点,声调能区别词汇意义,寒(二声)和汉(四声)都是【han】的发音,在二声和四声表意不同。在有些语言里,声调还能区别语法意义,如彝语凉山话的单数人称代词用声调区别主格、宾格、所有格,水语用声调区别动词、名词词性。

4、汉藏语系以词序虚词为表达语法意义的重要手段。词序比较固定,虚词种类较多。汉藏语系词类上的一个特点是有量词,量词的作用主要表示事物的单位和动作行为的量。此外,许多量词还兼表事物的类别、形状、性别、级别等特征。汉藏语系语言有词的重叠形式,在许多语言里具有共同的特点,表重叠的范围、作用、形式等方面。其次,各语言还有一批表示不同句式和语气的助词,一般都用于句子末尾。

5、中国少数民族语言并非都属于汉藏语系,比如维吾尔族语属于阿尔泰语系,部分回族使用的是印欧语系中的波斯语,满语也是阿尔泰语系。

中国的方言

作为中国人,不得不专门提一句我国的方言,这也是大家津津乐道的话题。

首先要明确一点,方言是汉语的分支,也就是说少数民族语言和少数民族的方言并不属于我们通常说的方言的范畴。

中国地域广阔,汉语的方言众多,它们分布的区域广泛。现代汉语各方言之间的差异表现在语音、词汇、语法等各个方面,语音尤为突出。一些国内学者认为多数方言之间在语音上都有一定的对应规律,词汇、语法方面也有许多相同之处,因此它们不是独立的语种。

当前中国语言学界对现代汉语方言划分的意见还未完全一致,根据教育部2019年《中国语言文字概况》介绍,汉语方言通常分为十大方言:官话方言、晋方言、吴方言、闽方言、客家方言、粤方言、湘方言、赣方言、徽方言、平话土话。各方言区内又分布着若干次方言和许多种“土语”。其中使用人数最多的官话方言,又可继续细分为东北官话、北京官话、冀鲁官话、胶辽官话、中原官话、兰银官话、江淮官话、西南官话八种次方言。

以下借用横山岛主的图来直观地展示各方言的地域分布。

—— 阿尔泰诸语 ——

阿尔泰语系,Altaic languages,取名于西西伯利亚平原之南的阿尔泰山脉,最先由芬兰学者马蒂亚斯·卡斯特伦提出,包含了60多种语言,主要分布于中亚及其临近地区。自20世纪60年代起,语言学术界内因其各语族之间缺乏同源词,普遍开始否定“阿尔泰语系”一说,即认为这类语言是互相接触而非同源的,它们虽然在语法和词汇上有相同之处,但更多是相互交流、借用而来的,并非源自同一个祖语。因此阿尔泰语系的说法在专业学者中已鲜有支持者,所以本文也将其称之为阿尔泰诸语,旗下主要有3个语族:突厥语族、蒙古语族和通古斯语族。

主要分支

语言特点

1、大多是黏着语。

黏着语是一种语言的语法类型,通过在词根的前中后粘贴不同的词尾来实现语法功能。语法意义主要由加在词根的词缀来表示的,词缀分为前缀、中缀、后缀,常见的有前缀、后缀。很多时候,黏着语和屈折语之间的界限不明显。日语是典型的黏着语。

黏着语也是有词形变化的,但二者之间最大的区别在于屈折语的词根词缀相对更为固定(如复数的“-s”、过去式的“-ed”),而黏著语的词缀更复杂,独立性更强(如“爱する”的可能态是“爱できる”、“来”的可能态是“来られる”;“爱する”的命令形是“爱しろ”、“来”的命令形是“来い”……等。根据词尾的不同,每个词的变形都会千差万别,较之英语的变形复杂得多,这也是日语初学者最头疼的瓶颈,一般人学不下去日语都是因为这个)。

2、主要语序是主宾谓(SOV)

元因以单元音为主,有“元音和谐”的现象元因以单元音为主,有“元音和谐”的现象元音和谐简单地理解就是连续两个词,或一个词的词根和前后缀中的元音必须保持一致,以英语举例,the book中的the读音是/ə/,the apple中的the读音是/i/。

4、名词有格的区分。

5、有主谓一致。

文字展示

蒙古语
维吾尔语
满语
土耳其语

—— 闪含语系(亚非语系) ——

闪-含语系,全称闪米特-含米特语系,Semito-Hamitic Languages,又称亚非语系,Afro-asiatic Languages,是375种语言的统称。主要分布在阿拉伯半岛和北非,使用人口近2亿。通常分为以下5个语族:闪米特语族、埃及-科普特语族、柏柏尔语族、库施特语族和乍得语族。代表语言是阿拉伯语。

闪含语系的命名来源于《圣经·旧约》,《圣经》说诺亚的儿子闪米特是希伯来人的祖先,另一个儿子含米特是亚述人和非洲人的祖先。

主要分支

语言特点

1、大多是屈折语。

2、各种语序都有,最特殊的是谓主宾(VSO),几乎只有在闪含语系和一些孤立语言中才存在。

3、名词有格和性的区分。

4、动词有人称变化和人称前缀。

5、大部分词根仅有辅音组成。

文字展示

阿拉伯语
希伯来语
索马里语

—— 乌拉尔语系 ——

乌拉尔语系,Uralic Languages,分布于从斯堪的纳维亚往东经乌拉尔山脉到亚洲西北部的广大地区 。主要包含芬兰-乌戈尔语族和萨莫耶德语族。芬兰-乌戈尔语族包括芬兰语支和乌戈尔语支,共约15种语言。萨莫耶德语族分南、北两个语支,有4种语言。

主要分支

语言特点

1、大多是黏着语。

2、存在各式各样复杂的后缀。

3、名词有很多种格的变化,比如芬兰语有15种格(部分格、属格、宾格、内格、出格、入格、所格、离格、向格、样格、变格、欠格、共格和具格),匈牙利语有18种格,非常复杂。

文字展示

芬兰语
爱沙尼亚语(左)
匈牙利语

—— 高加索语系 ——

高加索语系,Caucasian Languages,分布于黑海和里海之间的高加索山脉及其周边地区,使用人口超过一千万。

高加索语系的分类争议较大,比如有学者认为可以分为三个语族:拥有约520万使用人口的南高加索语系(Kartvelian languages)、拥有约380万使用人口的东北高加索语系(Northeast Caucasian languages)和拥有约250万使用人口的西北高加索语系(Northwest Caucasian languages)。然而,有学者认为这三个语族互相之间并没有内在联系,反而试图把他们和高加索地区以外的语言联系起来,比如和安纳托利亚和美索不达米亚北部相联系。

高加索语系的代表语言是格鲁吉亚语。

语言特点

1、辅音系统复杂,广泛存在复辅音。

2、原因系统相对简单。

文字展示

格鲁吉亚语

—— 南岛语系 ——

南岛语系,Austronesian Languages,也叫马来-波利尼西亚语系,是世界上仅有的主要分布在岛屿上的语系,它主要分布于西起马达加斯加,东到复活节岛,北起台湾岛和夏威夷群岛,南抵新西兰的广阔海域内的岛屿上。南岛语系包括1262种语言,使用人口约2.7亿,其中印度尼西亚语使用最多,大概有2.5亿人,但大部分说印尼语的人并不是印度尼西亚人。

主要分支

语言特点

1、大多是黏着语

2、名词有格的区分,但是没有性的区分

3、动词有时态的变化。

4、有主谓一致。

文字展示

—— 南亚语系 ——

南亚语系,Austroasiatic Languages,主要分布于南亚半岛和中南半岛,使用人口约9500万人,约占亚洲总人口的2.48%。南亚语系包括4个语族,孟高棉语族、越芒语族、蒙达语族、尼科巴语族。使用国家主要为越南、柬埔寨、老挝、孟加拉国、印度等国。我国境内的南亚语系语言涉及孟高棉语族和越芒语族,使用人群主要分布在广西、云南两地。

主要分支

语言特点

1、词的构成为一个弱化的次要音节+重音音节。

2、有大量的前缀、中缀,几乎没有后缀。

3、元音数量丰富。

4、有元音和谐现象。

文字展示

柬埔寨语
越南语

—— 达罗毗荼语系 ——

达罗毗荼(tu)语系,Dravidian Languages,又译德拉维达语系,主要分布在印度南部和东南部,其次在斯里兰卡北部和巴基斯坦等地。达罗毗荼诸语言跟印度其他语言没有亲属关系,而且是黏着语。达罗毗荼语系通常分为南部、中部和北部3个语族。达罗毗荼语系的语言主要是南印度的语言,其包括泰米尔语、泰卢固语、马拉雅拉姆语和坎纳达语等。

语言特点

1、大多是黏着语。

2、语序是主谓宾结构。

3、元音分为长元音和短元音。

文字展示

泰米尔语

—— 孤立语言 ——

孤立语言是指与任何其它语言不存在亲属关系的独立语言。由于该语言的孤立性,它无法被划分到任何语系中。全世界使用孤立语言的人口超过2亿,大约是世界总人口的近3%。

孤立语言不一定是冷门、使用人群较少的语言,比如日语、朝鲜语(韩语);当然也有哪些犄角旮旯地区的语言或者消亡语言,比如苏美尔语(Sumerian)、埃兰语(Elamtie)、巴斯克语(Basque)、米诺斯语(Minoan)等。

需要注意的是,“孤立语言”与“孤立语”(又称分析语或词根语)不同,前者是从语言分类的角度上来描述一种语言,而后者则是指没有时态和格变化的语言,是语言本身的一种特性,两者不应混淆。

文字展示

日语
朝鲜语(韩语)
苏美尔语(楔形文字)

—— 全文完 ——

总#15期

#探秘硬核知识#