“真讨厌,德瑞克大人这个世界上不是只有一个吗?”
“嗯……嗯。”
感觉像是被贾丝汀娜戳中了本质,一瞬间感到困惑。
文本差异分析
那么,开始比较《爱恩斯沃思交友录》的两个版本吧。
虽然两者都是手写的文件,但在作为文本阅读时,AI会检查其作为文章的妥当性,因此不会出现文字错误识别的大问题。不过,像专有名词的拼法是否正确这种地方就无可奈何了。人类进行比较也是一样的。
《交友录》基本上是日记,所以记录日期的顺序应该不会改变吧。如果是这样的话,要调查哪里不同,就从一方调查另一方被追加、变更、删除的地方就可以了。
这很简单,因为有几个工具可以比较和合并程序的源代码。
抱着这样的想法开始着手,没想到却陷入了苦战。
首先,工具指出的变更地方非常多。而且,由于使用了整个文档的行号,以“文本#1的第813行中删除了5行”的方式显示,所以没有计算机也不知道哪里发生了变化。另一方面,也有使用GUI进行文本比较的工具,但整体的显示长得令人绝望。
研究的结果是,不再把整个文件作为一个文件来比较,而是根据不同的日期制作很多小文件来进行比较。
因为是日记,日期写在当天记述的最前面。用这个切就行了。但是,日期的写法有一些变化,为了识别使用正则表达式吧。正则表达式是用来表示特定字符串模式的记法,例如“行开头的*月*日”。使用它,我编写了一个脚本,从一个巨大的原始文本文件中剪切一个日期在前面的小文件。
如果按照日期建立小文件,就会产生数千个文件。嗯。20多年来,虽然不是每天,但孜孜不倦地写日记,也不过如此吧。
如果对两者都进行相同的处理,生成的文件个数明显不同。从原版中删除了好几天的记述。
将它们分别存储在不同的目录中,比较每个目录,就会发现哪个文件(即日期)只存在于某一个目录中,并且,在相同日期的内容中存在删除、添加等情况。
变更的地方集中在特定日期的记述上,只要注意这一点,就能知道被视为问题的事件和人名。哎呀,这个方法是正确的。
但是,结果本身确实是计算机输出的枯燥无味的内容,所以请AI将其修改成人类记录的内容。……这样的想法很简单,但要将其记述得接近我们模糊描绘的“人类笔记”的形象就很困难了,会反复出现很多错误。
顺便让AI来推测一下这两篇日记的修改意图。
处理出乎意料地简单结束。AI的推理如下。
(1)某些人名、家名几乎被彻底去除。家族名有孟福德、杜哈迪和斯芬莱克。特别是亚历克西娅·斯芬莱克这个个人名字被彻底删除了。
(2)斯芬莱克家族被认为是比较有势力的贵族的名字。据推测,孟福德和杜哈尔迪可能是他们的亲戚或有力的家臣。
(3)亚历克西娅斯芬莱克这个人被认为是有地位的人物。
(4)其他一些被认为是人名或地名的专有名词也被删除或改变了,但如果你认为它们与孟福德、杜哈迪和斯芬莱克有某种关系,你可以解释超过50%的情况。看。
哦。
总觉得解析就这样结束了吧?之类的想法。
相反,如果有人问我这是怎么调查出来的,我觉得这远远超出了个人几个月就能做到的范围。
算了。让赛拉想想借口吧。
走到书房,坐在沙发上休息,娜塔莉就来了。
“有什么事吗?”
“没什么特别的……对了对了,听说哥拉姆商店的历史很悠久?”
golam商店是娜塔莉的家。
“啊,是的。虽然不知道是否正确,但听说500多年前就开始做生意了。”
娜塔莉,坐在我左边。
“也就是说,会留下记录吧?”
“是的,合同和买卖记录好像没有丢掉,一直保存着。”
“看来苏特里亚的女王陛下发现了它的历史价值,正在调查呢。”
“啊,是吗?不过,只留下某年某月在哪里卖了多少小麦之类的记录吧?”
娜塔莉,看起来很接近。味道好香。
“历史书或官方记录的时候,如果有想从历史上抹去的人物,大概会删除或改写关于那个人物的记述吧?但是,单纯把小麦卖给谁之类的账簿,是不会特意找出来改写的。”
“原来如此,的确如此。”
娜塔莉,一边说话一边拿起我的左手,用双手温柔地包起来。好暖和啊。
“你听说过月亮福德、迪哈尔迪、史芬莱克这些贵族的名字吗?我觉得很少见。”
嗯,是啊,我好像在哪里听说过moonford和duhardi,不过我想他们并不是贵族。”
“有这样的人是有的。”
嗯,佐尔特布尔我想是国内的。”
对话突然中断,娜塔莉看着我。表情一如既往的美丽啊。
“过段时间也可以,我想回家看看父母,你看怎么样?”
“是啊,自从那件事发生以后,我们就一直没见过面了,差不多该直接见个面,告诉他你平安无事了。”
“我一个人去当然也没有问题,不过,如果可以的话,德瑞克也一起去好吗?”
“什么?我?”
是的,我想只要告诉他,我在一个有可靠丈夫的房子里工作,他就会安心。”
“也许吧,不过我直接去的话,不会有人问‘这是谁?’吧?”
“那么……您将来会去夏蒂尔男爵家拜访吗?”
“那倒是有可能。真想去祝贺你恢复名誉呢。”
我想我可以陪他一起去那里,到时候再回娘家报告。”
“原来如此,这或许是个不错的提议。”
娜塔莉,脸颊微微泛红地说。
“好的,如果有这样的机会,请多多关照。”
“嗯,好啊。”
吃完晚饭,转移到赛拉那里。
把做好的解析结果打印出来交给他们。
“给,这个。”
赛拉,他翻了翻打印输出,最后盯着某个AI生成的推理部分。
“……好厉害啊。”
“嗯,很厉害。”
“不过,这几乎已经接近结论了吧?”
“那么,就这样交给梅罗娜女王?”
“糟透了。结果是很好,但没办法跟梅罗娜解释清楚。这种事,就算几个人一起调查也得花上一个月吧?”
“想个借口吧……”
“嗯,印刷得这么漂亮的时候就很可疑了。”
第712章