图书介绍

古籍文本数据格式化比较研究PDF|Epub|txt|kindle电子书版本网盘下载

古籍文本数据格式化比较研究
  • 陈红彦 著
  • 出版社: 上海:上海远东出版社
  • ISBN:9787547612446
  • 出版时间:2017
  • 标注页数:509页
  • 文件大小:127MB
  • 文件页数:525页
  • 主题词:古籍-数字化-研究-中国

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

古籍文本数据格式化比较研究PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一章 绪论1

一、引言1

(一)古籍数字化1

1.概念3

2.层级6

3.问题与对策7

4.标准规范9

(二)古籍数字化与学术研究13

1.数字人文14

2.知识遮蔽15

二、古籍文本化17

(一)数据17

(二)加工过程17

三、古籍文本化理念18

(一)面向应用18

(二)服务学术18

(三)利用技术19

(四)工程项目19

(五)保存信息21

(六)标准规范21

第二章 古籍文本模型23

第一节 简单对象23

一、文字23

(一)文字类型24

1.字符集24

(1)Unicode25

(2)中华字库32

2.集外字33

(1)集外字问题34

(2)集外字处理方法35

(二)文字属性36

1.字体36

2.字号37

3.文字位置38

4.文字颜色38

5.文字变形38

6.文字旋转38

二、符号39

(一)符号类型42

1.标点符号43

2.校对符号43

3.版式符号44

4.专类符号46

(二)符号属性47

三、图形47

(一)图形类型47

1.线段48

2.圆弧48

3.圆形49

4.矩形49

(二)图形属性49

四、图像50

(一)图像类型50

1.版框内插图50

2.书叶内插图52

3.其他插图52

(二)图像属性54

1.图像尺寸54

2.分辨率54

3.颜色模式54

第二节 复杂对象54

一、大小字54

二、墨围56

三、墨盖子57

四、表格58

五、图形组合60

六、特殊图像60

(一)牌记60

(二)印章61

七、版式61

(一)普通版式62

(二)特殊版式63

1.无版式63

2.不规则版框64

3.格抄本64

4.多截板64

5.图文混排65

第三节 结构对象66

一、古籍的物理结构66

(一)古籍装帧形式66

(二)古籍图像67

二、古籍的逻辑结构67

第三章 纯文本69

第一节 纯文本格式69

一、源起69

二、现状70

(一)汉籍电子文献资料库70

(二)CBETA电子佛典集成72

(三)中国基本古籍库74

(四)古籍电子定本工程75

(五)《汉籍全文数字化工作流程指南》76

三、数据模型78

(一)结构对象78

(二)简单对象81

1.文字81

2.符号84

3.图像85

4.图形85

(三)复杂对象86

1.大小字86

2.墨围87

3.墨盖子87

4.表格88

5.图形组合89

6.特殊图像89

第二节 纯文本格式描述89

一、纯文本XML结构89

(一)文件头89

(二)书目元数据90

(三)文本数据91

(四)集外字数据92

二、纯文本XML Schema93

第三节 纯文本XML示例105

一、示例1105

二、示例2107

第四章 位置文本110

第一节 位置文本格式110

一、源起111

二、现状112

三、数据模型112

(一)结构对象112

(二)简单对象115

1.文字115

2.符号117

3.图像117

4.图形119

(三)复杂对象119

1.大小字119

2.墨围121

3.墨盖子122

4.表格123

5.图形组合125

6.特殊图像125

第二节 位置文本格式描述125

一、位置文本XML结构125

(一)文件头126

(二)书目元数据126

(三)卷目数据126

(四)文本数据127

(五)集外字数据128

二、位置文本XML Schema128

第三节 位置文本XML示例140

一、示例1140

二、示例2146

第五章 版式文本153

第一节 版式文本格式153

一、源起153

二、现状154

(一)文渊阁四库全书电子版155

(二)爱如生大型古代数据库161

(三)数字方志166

(四)《中文文献全文版式还原与全文输入XML规范》173

三、数据模型175

(一)结构对象175

(二)简单对象180

1.文字180

2.符号183

3.图形184

4.图像186

(三)复杂对象187

1.大小字187

2.墨围189

3.墨盖子191

4.表格192

5.图形组合199

6.特殊图像201

7.版式202

第二节 版式文本格式描述202

一、头文件XML结构202

(一)文件头203

(二)书目元数据203

(三)卷目数据203

(四)默认版式数据203

(五)集外字数据204

二、叶文件XML结构204

(一)文件头205

(二)叶文本206

(三)集外字数据206

三、版式文本XML Schema206

(一)头文件XML Schema206

(二)叶文件XML Schema220

第三节 版式文本XML示例232

一、示例1232

二、示例2237

第六章 语义文本245

第一节 语义文本格式245

一、源起245

(一)语料库245

(二)内容标注247

(三)数据抽取248

二、现状249

(一)台湾地区“中研院古汉语语料库”249

(二)北大CCL古代汉语语料库251

(三)国家语委古籍语料库252

(四)中华古籍语料库252

(五)“汉语史语料库建设研究”项目252

三、数据模型253

(一)结构对象254

(二)内容对象256

1.图像256

2.图形257

3.表格257

(三)标注对象261

1.文本碎片属性261

2.句型262

3.词类263

第二节 语义文本格式描述266

一、语义文本XML结构266

(一)文件头266

(二)书目元数据267

(三)来源文本属性267

(四)卷目数据268

(五)标注集合268

(六)文本数据269

(七)集外字数据269

二、语义文本XML Schema269

第三节 语义文本XML示例289

第七章 部分文本304

第一节 谱系文本格式304

一、源起304

二、现状305

(一)GEDCOM305

(二)浙江图书馆家谱全文数据库308

(三)中华寻根网309

(四)家谱世系数据规范311

(五)GEDCOMX314

(六)“家谱谱系数字化模型研究”项目318

三、数据模型318

(一)实体319

(二)实体间关系321

第二节 谱系文本格式描述325

一、谱系文本XML结构325

(一)文件头325

(二)书目元数据326

(三)卷目数据326

(四)实体间关系数据326

(五)实体数据327

(六)集外字数据328

二、谱系XML Schema328

第三节 谱系文本XML示例346

一、宗族模式示例346

二、家庭模式示例359

第八章 文本格式比较379

第一节 文本格式分析380

一、全文文本380

(一)格式比较380

(二)格式简化382

1.数据模型简化382

2.数据描述简化383

(三)格式转换384

1.版式文本转换为纯文本384

2.纯文本转换为版式文本385

(四)语义文本387

二、部分文本387

第二节 复合文本格式387

一、复合文本388

二、复合文本示例388

(一)XML Schema389

(二)XML415

1.示例1415

2.示例2421

参考文献432

一、专著432

二、标准433

三、论文434

四、电子和网络文献443

附录450

一、古籍元数据规范(CDLS-S05-013)450

二、中文文献全文版式还原规范453

三、中文文献全文版式还原规范XML Schema464

(一)头文件XML Schema464

(二)叶文件XML Schema480

四、家谱谱系数据规范495

(一)结构说明495

(二)标签及属性说明495

五、家谱世系数据规范XML Schema498

六、“中研院”上古汉语语料库词类与特征标记表500

(一)词类标记表500

(二)词类标记说明表501

(三)特征标记表502

七、GEDCOM 5.5标签与GEDCOM XML对应关系503

热门推荐