« 函館の路面電車 | メイン | くるくる:第38回新発田紀行 »

モーツァルト全曲目録作成の経過

かなり進みました。
前回(6/16)の報告の時点では、全曲のケッヘル番号/曲名リストまでを作成しました。
この連休で、「CD解説目録のPDFファイル」から収録ケッヘル番号を抽出しました。

これがきわめて手数のかかる作業で、PDFファイルの内容は約130に分割されていました。
解説には、CD個別のものと数枚のCDをまとめたものがあります。
そのため、約130のCD/CDグループとなリます。

◆作業
分割された解説をテキスト・ファイルに書き込み、プリグラムでケッヘル番号を抽出します。
ただし、解説の部分によってケッヘル番号の表記方法が異なります。
「K123」あり、「K.123」あり、「KV123」あり、数字の前に空白があったり、なかったり。

複数の番号の先頭だけに「KV 」などが付いていて、以下は省略されているのもあり、
プログラムでは、どうにも他の単語と分離できないない表記もあり、
そういう場合は、手作業でテキスト表記を修正して、プログラムが処理できるようにしました。

解説の中にケッヘル番号が出てこないのもいくつかあって、これはお手上げ。
そのCDには収録されていない番号が、参照で含まれているのもあります。
そんなデータと、数時間のバトルを何回も繰り返して、ともかく一段落。

◆成果
成果物は、約430曲のCD/CDグループ別収録リストです。
まだ、約200曲が収録先不明です。
しかし、こうした作業では、まあまあのレベルの成果です。

残りの約200曲には、偽作や他人の作品などもあり、また断片などもあります。
実際には、160曲位がCDに収録されていると予想しています。
残りの大半は、アリア、カノン、教会ソナタ、舞曲などです。

交響曲、協奏曲、ソナタ、オペラなどの大物は、ほとんど全て、CDが決定できています。
これらを見やすい一覧表に印刷しました。
これでも、もう立派な「全曲CDの収録リスト」(暫定版)です。

◆次作業
収録先不明の曲は、CD側からチェックすることになります。
各CDのジャケットに印刷されている、収録ケッヘル番号を調べればよいわけです。
対象となるCDは約40枚に限定されます。

二人で読み合わせて、各CDに漏れているケッヘル番号を「収録リスト」に追記すればOK。
気合を入れてやれば、2時間で終わるでしょう。結果のデータをMozartデータベースに入力。
収録リストを作成すれば、ほぼ完成。新発田へ行ったりして、あと一ヶ月とみています。

 ◇ ◇ ◇

社会保険庁の5000万件の行方不明年金問題も、規模はケタが違いますが、同じです。
どんなにコンピュータのプログラムを駆使しても、解決できるのはせいぜい半分。
2500万件以上を、人の判断と手作業で処理することになるでしょう。
2,3年かけて、緻密な作業を積み上げていくしかにように思います。■