sorane の静的サイトは 単一オリジンのデータカタログ として機能します。全国ポータル(data.europa.eu)や CKAN インスタンスへ載せるには、ビルド成果物を 外部ハーベスターが取り込める形 にしておきます。

sorane が出すファイル#

ファイル用途
catalog.jsonldschema.org カタログ(全ページ)
catalog-dcat.jsonldDCAT-AP 形状の JSON-LD(type: dataset のみ、opt-in)
*.html / *.md人間・エージェント向けランディング
llms.txtサイト全体の機械可読ガイド

DCAT カタログを有効にする:

site:
  open_data:
    dcat_catalog: true

例: examples/open-data

CKAN への手動取り込み#

sorane は CKAN API や Solr を実装しません。運用者が CKAN のデータセット UI でメタデータを登録し、distributions[].accessURL を sorane の静的ファイル URL に合わせます。

CKAN フィールドsorane OKF / ビルド
Titlefrontmatter title
Descriptiondescription
Licenselicense(SPDX 推奨)
Tagstags + theme:(dataset 検索タグ)
Organizationpublisher.name(サイト単位; CKAN Organization は手動で対応付け)
Resource namedistributions[].title
Resource formatdistributions[].formattext/csv 等)
Resource URLdistributions[].accessURLstatic/ 配下の絶対 URL)

手順(概要)

  1. sorane builddist/ を公開(HTTPS 必須)。
  2. catalog-dcat.jsonld を開き、対象 dataset の dct:title / dct:description / dcat:distribution を確認。
  3. CKAN で新規 Dataset を作成し、上表どおりフィールドを転記。
  4. 各 Resource の URL を accessURL と一致させる(CSV は static/data/… など)。
  5. 更新時は updated frontmatter と catalog-dcat.jsonlddct:modified を揃え、CKAN 側も再公開。

data.europa.eu 品質チェックリスト(対応表)#

data.europa.eu のハーベストは DCAT-AP カタログフィード を前提とします。sorane 単体はポータル準拠の RDF ストアではありませんが、catalog-dcat.jsonld とランディングページで次の項目を満たしやすくします。

品質観点sorane での対応
データセットの発見可能性catalog-dcat.jsonld + llms.txt + サイト内検索
タイトル・説明OKF title / description → DCAT dct:title / dct:description
ライセンスlicensedct:license(URI 推奨)
配布形式の明示distributions[].formatdcat:mediaType
ダウンロード URLdistributions[].accessURLdcat:downloadURL
発行・更新日timestamp / updateddct:issued / dct:modified
テーマ分類themedct:subject
機械可読メタデータDCAT-AP JSON-LD(ハーベスターが RDF に変換)
複数言語site.i18n + translation_key(ランディングはロケール別 HTML)
API エンドポイントsorane 範囲外(リンクのみ accessURL で記載可)

運用上の注意

  • 全国ポータルは通常 組織の DCAT-AP フィード URL を登録します。sorane サイトの catalog-dcat.jsonld を組織の既存カタログにマージするか、中継パイプラインで RDF カタログに変換してください。
  • SHACL 完全準拠や Dataset Series は OKF 0.3 設計 の explicit non-goals です。

関連ドキュメント#