1. はじめに
本仕様は、帯文データベース(以下、本DB)が「何を記録するか/しないか」「データの最小単位は何か」「最低限何が必要か」、 および外部からの参照・引用の単位を定める。
2. 記録するもの/しないもの
2.1 記録するもの
本DBが記録するのは、次の2つがセットになったものである。
- 帯に印刷された帯文本文(
obi_text) - 帯に記載された名義/署名(
endorser)
例:帯に本文と推薦者名が印刷されている → 採録する。
2.2 記録しないもの
次のようなことは本DBの記録対象外とする。
- 制作過程(AIか人間かを含む執筆者、依頼、選考、草稿など)
- 帯文本文の評価(文章の価値、政治的適否など)
- 制作の意図や背景
3. データの最小単位
- 帯文1つ=レコード1件。
- 1件ごとに固定URL(パーマリンク)を付与する。
- 同一の書籍でも、帯文が違えば別件として扱う。
- 異なる書籍に同一の帯文が使用された場合(同一作品の単行本・文庫本など)、それぞれ別件として扱う。
- 同一の帯文本文(
obi_text)に対して名義(endorser)が複数者として並記されている場合、名義ごとに別レコードとして採録する(詳細は採録手順に従う)。
4. 最小成立条件
4.1 帯文(テキスト実体)の最小成立条件
本DBにおける「帯文」の最小成立条件は、次の2つである。いずれかが欠ける場合、帯文として成立しないため採録しない。title(書名)は運用上の重要ラベルだが、帯文そのものの構成要件ではない。
endorser(名義/署名)obi_text(本文)
4.2 レコード(参照単位)の成立条件と2型運用
本DBは、外部から参照・引用できる単位として、帯文をレコード化し固定URLを付与する。このとき、title の有無により、レコードを次の2型に分けて運用する。
4.2.1 同定レコード(書名あり)
次の項目が揃うものを、同定レコードとして採録する。
title(書名)endorser(名義/署名)obi_text(本文)
4.2.2 未同定レコード(書名欠落)title が欠ける場合でも、帯文(テキスト実体)が成立し、かつ次の追跡情報を付与できる場合は、未同定レコードとして採録する。
endorser(名義/署名)obi_text(本文)verification_method(確認方法)collected_at(採録日)notes(同定状況・根拠)
5. 曖昧さの扱い
帯文には境界が曖昧な例がある。本DBは、曖昧さを直して正規化せず、曖昧なまま採録する。
- 曖昧でもレコード1件として成立するなら記録し、必要に応じて
ambiguity_levelで補足する(詳細はデータ辞書を参照)。 - 判読不能などで1件として成立できないものは採録しない。
6. obi_type(帯文タイプ)の基本ルール
帯文の種類は固定の選択肢から選ぶ(選択肢はデータ辞書を参照)。
- 推測が必要なら
obi_type=判別不能(分類保留)。 - 他媒体の推薦文が帯に転載されていても、帯で推薦文として提示されているなら「推薦文」とする。
- 必要なら
notesに補足する(obi_typeでは区別しない)。
7. データの管理と公開(内部正本と公開CSV)
7.1 内部正本(マスターデータ)
- 本DBは、内部正本を内部で管理する。
- 内部正本は非公開であり、Webから直接参照できない。
7.2 公開・配布CSV(カテゴリー別)
- 公開・配布するのは、カテゴリー別CSV(
obibun1~obibun5)である。 - 公開CSVは全件を対象とするが、更新は不定期であり、内部正本に対してタイムラグがある。
- 公開CSVの固定URLは
/csv/obibunN.csv(Nは1~5の整数)である。 - 公開・配布CSVはメタデータを対象とし、帯文本文(
obi_text)は含めない。
7.3 obibun番号とカテゴリーの対応
obibun1:文芸obibun2:文化・学問obibun3:芸能・大衆文化obibun4:政治・経済obibun5:書店員・読者
8. 参照・引用の単位
- 参照・引用の基本単位は、各レコードの固定URLである。
- 固定URLは
/records/{id}形式で、{id}はレコード識別子(id)である。 idは検索一覧および詳細画面で表示される。- 公開CSVにはレコードID(
id)列および帯文本文(obi_text)列を含めないため、外部からの参照は固定URLによって行う。
9. 例外時の扱い(参照の継続性)
9.1 データの重複が判明した場合
データの重複が判明した場合、片方を削除せず、notes で相互参照を付ける。
あわせて、どちらを主とするかを notes に記す。
9.2 非公開(tombstone)の扱い
致命的な誤り、または権利上の理由等により公開できない場合でも、レコードのURL(/records/{id})は維持する。
該当レコードは「非公開」ページ(tombstone)として表示する。内部正本の扱い等の運用詳細は採録手順に従う。