ディズニー データベース 別館

「ディズニー データベース」(https://w.atwiki.jp/wrtb/)の別館です。日本の誰か一人にでも響けばOKな記事を書いていきます。

DDBの軌跡(2)~ディズニー データベースができてから~

前編では、「ディズニー データベース」(以下、DDB)ができるまでをご紹介しました。後編では、DDBがデータベースっぽくなるまでをお伝えします。前編を未読の方はぜひそちらからどうぞ!

disneydb23.hatenablog.com

初期のDDB

2009年、ライフワークとしてディズニーの情報を集めるDDBを開設しました。最初のDDBはデータベースという名を冠してはいるものの、言うなればテキストサイトでした。

ここでDDBの編集方法をご紹介しましょう。

たとえば、「ミッキーマウス」の記事に手を加えたい場合、

まず、「ミッキーマウス」のページを開き、

編集画面を開き…

本文を書き換えて保存するだけ。ね、簡単でしょ?

前編で自分用に書き始めたと述べましたが、ネット上に公開されていますから、出先でふと読みたくなったら検索して閲覧することもできます。DDBの全テキストはアットウィキさんが責任を持ってお預かりしてくれますからね。

2017年の「事件」

そんな能天気なDDBですが、2017年にとある危機に見舞われます。



ある日、とあるTwitterアカウントがbotのごとくDDBの記事URLを片っ端から凄い勢いでツイートしているのを目撃しました。普段は自己満足用にデータベースを作成しているDDBさんですが、チョロいのでこうしたレスポンスがあると喜びます。



一体誰が何の目的でこんなツイートをしてくれているのでしょう。



その真実はツイートに記載されていたURLにアクセスしてすぐに明らかになります。



いえ、すぐと言うのは少し盛りました。



気付くのに10分くらい掛かったと思います。



その呟かれていたURLがDDBのものではなかったことに。



だって、自分のDDBとそっくりなサイトだったのですから。



つまり、その犯人はDDBの記事のソース(当時は一般公開されていた)を片っ端からコピペして偽のDDBを作りあげていたのです。先ほどのURL連発ツイートはアットウィキで記事を新規作成した時に連携したTwitterアカウントから自動送信される通知ツイートの類いだったのです。本家さまも把握していない機能を使いこなすとは………



師匠と呼んでもいいですか?!



アットウィキには通報フォームがありまして、自分のDDBと偽のDDBのURLを記載し、まぁ端的に言うとパクられましたと冷静に根拠を添えて通報しました。DDBの存在すら知らない人からしたらどっちがパクりか分からないでしょうから、そこは慎重に書きました。最悪、運営さんに対応してもらえなかったら場所を移ろうとも考えていました。特にアットウィキ運営から連絡は無かったのですが、半日後に偽DDBを覗きに行ったら「このWikiは凍結されました」といったメッセージが表示されていました。



こうしてアットウィキさんの寛大なお裁きによってDDBは今も元気に活動できているのです。



めでたしめでたし。






……で、ここからが今回の本題です。

事件から教訓を得る

この偽DDB事件、当時は結構ゾッとしました。



「最悪、運営さんに対応してもらえなかったら場所を移ろうとも考えていました。」なんて言っていた頃から、頭はフル回転していました。「移るにしても、この8年間で書き溜めたテキストをどうやって回収すれば良いんだ?」と。こちらは偽DDBを告発して勝てたからいいものの、もし負けていたら?または喧嘩両成敗で両方とも凍結されていたら?はたまた、偽DDBが先にうちをパクり呼ばわりしてこっちが凍結を喰らっていたら?「クラウドにデータを預ける時はアテにしすぎるな」なんて頭では分かっていますが、本気で「ヤバいかも?」と思ったのはこの時でした。



DDB事件が終わり、すぐさまDDB上に眠る数千件のテキストを回収するためのツール開発が行われました。Webスクレイピングのツールなど作ったことはありませんでしたが、偽DDBの犯人が凍結翌日に手を打ってきても不思議ではありませんから、とにかく焦って作成した記憶があります。



一日ほどかけて作成したツールは、DDBのすべてのページの編集画面からテキストを抜き出し、txt保存しExcelに取り込む大活躍を見せてくれました。



これでいつサイトが災害に見舞われても大丈夫です。よかったよかった!



これがDDB管理ツール誕生の瞬間でした。これはゴールではなく新たなスタートでした。このツールはさらに改良を重ねていくのです。

読み取りだけでなく更新もイケる

DDBからローカルのtxtファイルにテキスト本文を保存するために開発されたこのバックアップツールですが、お察しの良い方ならお分かりの通り、逆にtxtファイルからDDBを更新することだってできてしまうのです。



最初に作ったツールのバックアップ機能はその時点のDDBをテキストに逃がす機能です。つまり、前回ツールを回してから差分のあったページのバックアップをこまめに取らなくてはならないのです。しかし、txtファイルを編集してそれをDDBに流し込めば、その手間が省略できます。ツールからtxtファイルを呼び出し、編集してDDBに送信、という新たな編集方式が生まれました。


ツールだとつながりがよく見える

このツールにはDDBでは確認できない便利機能も追加されました。Wikipediaを編集したことのある方ならピンと来ると思いますが、DDBの本文中でリンクを貼る時、ミッキーマウスというように二重括弧でくくります。このツールでは「ミッキーマウス」の記事内で[[]]で囲まれている部分のみを抽出、すなわちミッキーマウスから行けるリンクの記事名を閲覧することができます。さらにその中から未作成記事名のみを抽出することもできます。ミッキーマウスの記事を充実させたい時にミッキーのことを直接調べるのも手ですが、未作成リンクの記事を作ることで新たなミッキーの気付きを得ることもできます。



さらにフィルタを掛けてやれば、ミッキーマウスリンク元、すなわちミッキーマウスの記事へリンクを貼っている記事の一覧も確認することができます。このリンク元一覧は、14年前はアットウィキの標準機能だったのですが早々に廃止されたため、現在は自前のツールで補っています。



また未作成記事の一覧と、そのページにリンクを貼っている記事数も確認することができます。つまり多くの記事からリンクされている未作成記事ほど早く作ってあげると望ましいということ。



あっ……。案の定手強い面々でした。


未作成リンク一覧はほかにも、まだ作られていない記事名の微妙な表記揺れを感知し是正するのにも役立ちます。


記事の編集・管理だけでなくキャラクターのテーブルなんてのも保持していまして。前回、いずれはウサギのキャラクターの一覧化して閲覧したいと話していたとおりDDB未実装ではありますが、ツール自体には既にその機能が備わっていまして、属性をウサギでフィルタしてあげるとウサギのキャラクターを一覧として閲覧できます。



ウサギだけでなく、ウサギのぬいぐるみのような複合型や、魔法などで一時的にウサギに姿を変えるキャラクターの情報も入力すれば管理可能です。


※この記事で言及しているテーブルとはExcelの表のことです。データベースではないです。

テーブルから記事に自動反映するという考え方

また、キャラクター別登場作品のテーブルというのがありまして、この表を更新して反映実行してあげると、キャラクターの記事の登場作品の項に自動的に反映してくれる機能もあります。キャラクター名と登場作品を記載すれば、キャラクターの記事URL参照と作品公開順ソートが自動的に動きます。これはキャラクターの登場作品のページの編集効率を大幅に上げてくれました。

例えば、私が『キングダム ハーツ』という作品を知らなかったとします。すると『キングダム ハーツ』に登場するキャラクター約100記事を一つ一つ開いて登場作品の項に「2002年 キングダム ハーツ」と記載する作業が必要になります。しかもそのキャラクターが同じ2002年の別作品に出ていた場合、どの順序で公開されたのかも都度調べなくてはならない。でもこのツールを使えば、表に『キングダム ハーツ』のキャラクター一覧を追記して反映実行すれば後は自動で記事のほうに反映してくれます。


短編映画の収録ソフト表も自動で作成しています。


最近では新しく映画の記事を作る際に、キャラクターの記事のテンプレートもツールに作ってもらい、あくまで自分は本文の準備に専念することも多いです。


今後の野望

ツールには今後の展望を見据えた次なる改良の準備も進められています。

西暦・月日の記事化計画

現在、「1928年」「11月18日」といった日付を表す言葉にリンクを貼っていません。しかし、1928年にディズニー的に何があったか、という括りでものを見るのもきっと楽しいことでしょう。現在ツール内の作品テーブルで公開日を管理していますが、他にも日付で管理できる情報はありますから新たなテーブルの設計が必要となります。さらに既存記事の「○○年」「○月○日」もすべて[[]]で括ってあげる作業またはその自動化の検討も必要です。

東京のショーとパレード

最近は滞り気味ですが、昨年から東京ディズニーリゾートのショーとパレードに登場するキャラクターと楽曲の情報収集を始めています。こちらもテーブルへ記載して反映実行すれば各キャラクターの記事に自動反映させるしくみを考えていますが、こちらも元データを準備するところで詰まっています。2010年くらいで止まっていたような…。

スタッフ情報の管理

記事の土台作りを優先してきたDDBが後回しにしてきたのが、映画スタッフ情報の管理です。ディズニーのデータベースを名乗っている割にナイン・オールド・メンの記事はひとつもありません。でもこれは安易に数名記事を作ってしまうとテーブルの管理や自動反映のしくみを総入れ替えする時に大変になってしまうからです。きちんと腰を据えて準備したいところですね。


このように新しい機能を追加するということは、既存の何百何千もの記事にも手を加える必要があるということ。キャラクターの登場作品を自動反映させる機能を実装した時も既存のキャラクター記事すべてに手を入れました。気の遠くなる作業ではありますが、実装をやり遂げた時の達成感もまたひとしおです。


2021年7月、海外の役者さんのページ1,371名分に吹替声優を追記する大改修を行ったのですが、こちらもこのツールが無ければ上手く回っていなかったと思います。



DDBの管理って「テンプレ作ってはい終わり」ではないのです。登場作品自動反映できたら便利だな、とかショーパレの登場履歴も見られたらいいな、と少しずつ育てていくものなんです。作業量は大変ですが、多人数のwikiだと急にテンプレ変えると顰蹙買いそうですしある意味個人経営の強みなのかも…?


アップデートを実施するにもデータの準備に途方もない時間がかかるので、今日のお話は話半分で捉えておいてくださいね。それではまた良い報告をお届けできることを祈って…!