AI从开罗的Geniza揭露了中世纪犹太人的宝藏文件
据外媒报道,以色列研究人员利用人工智能(AI)研究了超过40万份来自开罗Geniza的古籍——世界上最大的中世纪犹太文件集。
这些手动研究了100多年的集合终于可以以前所未有的速度和深度进行分析。
开罗的杰尼扎藏品来自开罗的本埃兹拉犹太教堂,保存着各种各样的文件,从行政记录到私人信件,拉比的反应,到迈蒙尼德等伟大哲学家的著作。淹没在碎片堆中,许多文件被分散,未分类,从未被转录,尽管整个收藏品已以图像形式数字化。
在MiDRASH项目的帮助下 - 一个由欧盟支持并与多所大学合作的倡议 - 研究人员现在正在训练AI模型来阅读,识别和复制希伯来语,阿拉伯语,亚美尼亚语和意第绪语文本,这些文本以各种古代手写风格书写。这项工作使得以前难以破译的文件得以重建,并加速了对中世纪犹太人的生活的最新发现。
巴黎高等研究院的丹尼尔·斯托克·本·埃兹拉是该项目的主要研究人员之一,他解释说,这项技术越来越擅长分析古代文字,而这些文字以前只能由资深抄写员分析。
他说,这项新功能为研究人员开辟了一条道路,可以代表,条款或事件在数十万片段中快速搜索,并把分散了几个世纪的文件碎片聚集在一起。
尽管人工智能可以生成初始的转录,但人类研究人员仍然需要验证文本的准确性,因此每个校正都帮助模型学习并提高其阅读质量。 “现代翻译的可能性现在已经发展到如此先进的水平,将所有这些结合起来使这些文件更容易访问,即使对于初级读者也是如此,”Ben Ezra说。
其中一个有趣的文档是16世纪的意第绪语信件,由耶路撒冷的一位寡妇写给埃及的儿子。在它的边缘,儿子写下了关于他在开罗瘟疫中生存的斗争的答案。
本杰西纳本身就是犹太教堂的神圣存放处,用于将重要的文件放在仪式上埋葬之前。本杰西纳位于开罗干旱的地区,允许数千本手稿在相对良好的条件下保存。
在中世纪的鼎盛时期,开罗成为中东最大的贸易和科学中心,与巴格达和大马士革相媲美。这座城市是繁荣的犹太社区的所在地,包括从基督徒手中夺走的西班牙难民。正是在这座犹太教堂,伟大的犹太哲学家兼苏丹萨拉丁家族医生的迈蒙尼德曾经敬拜过。
埃及开罗图书馆藏品最早由学者在 19 世纪末发现,但文件数量之大使得其大部分内容至今仍是一个谜。随着人工智能的出现,研究人员希望能够映射犹太社区数百年来社会、经济、法律和精神生活。“重建一切的能力 - 就像创建中世纪的Facebook一样 - 现在就在我们眼前,”本·埃兹拉说。