腾讯建全球最大甲骨文单字数据库:一个“牛”有3500种写法

12月10日消息,2016年,中国文字博物馆曾向公众发出悬赏令,承诺每破译一个甲骨文字便奖励10万元人民币。然而直到2023年前,仅有一位学者凭借对“蠢”字的研究获得了这份奖金。

截至目前,已发现的甲骨数量接近16万片,其中包含约4500个不同的甲骨文字符。但遗憾的是,这些字符中只有大约1500个被成功解读出来。

造成这一现象的主要原因包括:许多甲骨上的文字模糊不清、相似字形难以区分以及人工查找效率低下等挑战。

为了加快甲骨文的解码速度,腾讯公司构建了一个包含超过143万个单字记录的世界最大甲骨文数据库,并利用数字技术实现了相似形状和相关甲骨之间的匹配与关联功能。该数据库已于近期开源。

腾讯建全球最大甲骨文单字数据库:一个“牛”有3500种写法-第1张-科技-土特城网

通过这个平台,用户可以快速检索到相关信息。例如,在搜索栏输入“牛”,系统将返回3504种与之形态相近或相关的甲骨文样本及其对应的原始材料。

除此之外,腾讯还发布了首个多模态甲骨文数据集(涵盖一万份甲骨拓片及摹本),详细标注了每个单字的具体位置及其所属类别等信息,这一系列举措有助于加速甲骨文被考释的进程。

腾讯建全球最大甲骨文单字数据库:一个“牛”有3500种写法-第2张-科技-土特城网

免责声明:本文章由会员“极目新闻”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系