参照仕様(Reference Spec)

1. はじめに

本仕様は、帯文データベース(以下、本DB)が「何を記録するか/しないか」「データの最小単位は何か」「最低限何が必要か」、 および外部からの参照・引用の単位を定める。

2. 記録するもの/しないもの

2.1 記録するもの

本DBが記録するのは、次の2つがセットになったものである。

  • 帯に印刷された帯文本文(obi_text
  • 帯に記載された名義/署名(endorser

:帯に本文と推薦者名が印刷されている → 採録する。

2.2 記録しないもの

次のようなことは本DBの記録対象外とする。

  • 制作過程(AIか人間かを含む執筆者、依頼、選考、草稿など)
  • 帯文本文の評価(文章の価値、政治的適否など)
  • 制作の意図や背景

3. データの最小単位

  • 帯文1つ=レコード1件。
  • 1件ごとに固定URL(パーマリンク)を付与する。
  • 同一の書籍でも、帯文が違えば別件として扱う。
  • 異なる書籍に同一の帯文が使用された場合(同一作品の単行本・文庫本など)、それぞれ別件として扱う。
  • 同一の帯文本文(obi_text)に対して名義(endorser)が複数者として並記されている場合、名義ごとに別レコードとして採録する(詳細は採録手順に従う)。

4. 最小成立条件

4.1 帯文(テキスト実体)の最小成立条件

本DBにおける「帯文」の最小成立条件は、次の2つである。いずれかが欠ける場合、帯文として成立しないため採録しない。title(書名)は運用上の重要ラベルだが、帯文そのものの構成要件ではない。

  • endorser(名義/署名)
  • obi_text(本文)

4.2 レコード(参照単位)の成立条件と2型運用

本DBは、外部から参照・引用できる単位として、帯文をレコード化し固定URLを付与する。このとき、title の有無により、レコードを次の2型に分けて運用する。

4.2.1 同定レコード(書名あり)
次の項目が揃うものを、同定レコードとして採録する。

  • title(書名)
  • endorser(名義/署名)
  • obi_text(本文)

4.2.2 未同定レコード(書名欠落)
title が欠ける場合でも、帯文(テキスト実体)が成立し、かつ次の追跡情報を付与できる場合は、未同定レコードとして採録する。

  • endorser(名義/署名)
  • obi_text(本文)
  • verification_method(確認方法)
  • collected_at(採録日)
  • notes(同定状況・根拠)

5. 曖昧さの扱い

帯文には境界が曖昧な例がある。本DBは、曖昧さを直して正規化せず、曖昧なまま採録する。

  • 曖昧でもレコード1件として成立するなら記録し、必要に応じて ambiguity_level で補足する(詳細はデータ辞書を参照)。
  • 判読不能などで1件として成立できないものは採録しない。

6. obi_type(帯文タイプ)の基本ルール

帯文の種類は固定の選択肢から選ぶ(選択肢はデータ辞書を参照)。

  • 推測が必要なら obi_type=判別不能(分類保留)。
  • 他媒体の推薦文が帯に転載されていても、帯で推薦文として提示されているなら「推薦文」とする。
  • 必要なら notes に補足する(obi_typeでは区別しない)。

7. データの管理と公開(内部正本と公開CSV)

7.1 内部正本(マスターデータ)

  • 本DBは、内部正本を内部で管理する。
  • 内部正本は非公開であり、Webから直接参照できない。

7.2 公開・配布CSV(カテゴリー別)

  • 公開・配布するのは、カテゴリー別CSV(obibun1obibun5)である。
  • 公開CSVは全件を対象とするが、更新は不定期であり、内部正本に対してタイムラグがある
  • 公開CSVの固定URLは /csv/obibunN.csv(Nは1~5の整数)である。
  • 公開・配布CSVはメタデータを対象とし、帯文本文(obi_text)は含めない。

7.3 obibun番号とカテゴリーの対応

  • obibun1:文芸
  • obibun2:文化・学問
  • obibun3:芸能・大衆文化
  • obibun4:政治・経済
  • obibun5:書店員・読者

8. 参照・引用の単位

  • 参照・引用の基本単位は、各レコードの固定URLである。
  • 固定URLは /records/{id} 形式で、{id} はレコード識別子(id)である。
  • id は検索一覧および詳細画面で表示される。
  • 公開CSVにはレコードID(id)列および帯文本文(obi_text)列を含めないため、外部からの参照は固定URLによって行う。

9. 例外時の扱い(参照の継続性)

9.1 データの重複が判明した場合

データの重複が判明した場合、片方を削除せず、notes で相互参照を付ける。 あわせて、どちらを主とするかを notes に記す。

9.2 非公開(tombstone)の扱い

致命的な誤り、または権利上の理由等により公開できない場合でも、レコードのURL(/records/{id})は維持する。 該当レコードは「非公開」ページ(tombstone)として表示する。内部正本の扱い等の運用詳細は採録手順に従う。

関連ドキュメント

Docs へ戻る →
トップページへ戻る →