5000年前の「くさび形文字」解読にAIが挑む
一方でグザーズは「とてもよくできた翻訳もあれば、手作業での修正が必要なレベルのもの、さらには、完全に『幻覚』(註:AIが原文からかけ離れた、無関係の訳文を生成してしまうこと)と言えるものもありました」と認める。
いま開発者らが直面している第一の問題は、利用可能なテキストの量が限られていることだ。もっとも大規模なデータベースでも、デジタル化された石板は数万枚にとどまる。それではAIに学習させるには少なすぎるのだ。
第二に、アッカド語が存在した3000年間に文字自体が大きく進歩し、初期の石板に書かれたものと後期の石板のものとではまったく異なるくさび形文字なのだという。
さらに、言語の構造も英語とは根本的に異なる。これは、一語ごとの翻訳を不可能にし、翻訳ソフトはわかりやすい表現をするために、文のさまざまな要素を再構築しなくてはならない。そのため「詩や祈りの文、神話的な物語などの、より文学的で形式張らない文章」の翻訳にはある程度解釈の幅が生まれてしまう。
エルサレム・ヘブライ大学のアッシリア学教授ネイサン・ワッサーマンによると、AIは特に、デジタル化された大量の石板をスキャンし、共通点を見つけることに有用だという。
「たとえば、ある司祭や王の名前が何の繋がりもない二つの板から見つかったとすれば、それらがたとえ異なる場所で見つかり、異なる場所に収蔵されていたとしても、新たな発見につながる可能性があります」