sorane の静的サイトは 単一オリジンのデータカタログ として機能します。全国ポータル(data.europa.eu)や CKAN インスタンスへ載せるには、ビルド成果物を 外部ハーベスターが取り込める形 にしておきます。
sorane が出すファイル#
| ファイル | 用途 |
|---|---|
catalog.jsonld | schema.org カタログ(全ページ) |
catalog-dcat.jsonld | DCAT-AP 形状の JSON-LD(type: dataset のみ、opt-in) |
*.html / *.md | 人間・エージェント向けランディング |
llms.txt | サイト全体の機械可読ガイド |
DCAT カタログを有効にする:
site:
open_data:
dcat_catalog: true
CKAN への手動取り込み#
sorane は CKAN API や Solr を実装しません。運用者が CKAN のデータセット UI でメタデータを登録し、distributions[].accessURL を sorane の静的ファイル URL に合わせます。
| CKAN フィールド | sorane OKF / ビルド |
|---|---|
| Title | frontmatter title |
| Description | description |
| License | license(SPDX 推奨) |
| Tags | tags + theme:(dataset 検索タグ) |
| Organization | publisher.name(サイト単位; CKAN Organization は手動で対応付け) |
| Resource name | distributions[].title |
| Resource format | distributions[].format(text/csv 等) |
| Resource URL | distributions[].accessURL(static/ 配下の絶対 URL) |
手順(概要)
sorane buildでdist/を公開(HTTPS 必須)。catalog-dcat.jsonldを開き、対象 dataset のdct:title/dct:description/dcat:distributionを確認。- CKAN で新規 Dataset を作成し、上表どおりフィールドを転記。
- 各 Resource の URL を
accessURLと一致させる(CSV はstatic/data/…など)。 - 更新時は
updatedfrontmatter とcatalog-dcat.jsonldのdct:modifiedを揃え、CKAN 側も再公開。
data.europa.eu 品質チェックリスト(対応表)#
data.europa.eu のハーベストは DCAT-AP カタログフィード を前提とします。sorane 単体はポータル準拠の RDF ストアではありませんが、catalog-dcat.jsonld とランディングページで次の項目を満たしやすくします。
| 品質観点 | sorane での対応 |
|---|---|
| データセットの発見可能性 | catalog-dcat.jsonld + llms.txt + サイト内検索 |
| タイトル・説明 | OKF title / description → DCAT dct:title / dct:description |
| ライセンス | license → dct:license(URI 推奨) |
| 配布形式の明示 | distributions[].format → dcat:mediaType |
| ダウンロード URL | distributions[].accessURL → dcat:downloadURL |
| 発行・更新日 | timestamp / updated → dct:issued / dct:modified |
| テーマ分類 | theme → dct:subject |
| 機械可読メタデータ | DCAT-AP JSON-LD(ハーベスターが RDF に変換) |
| 複数言語 | site.i18n + translation_key(ランディングはロケール別 HTML) |
| API エンドポイント | sorane 範囲外(リンクのみ accessURL で記載可) |
運用上の注意
- 全国ポータルは通常 組織の DCAT-AP フィード URL を登録します。sorane サイトの
catalog-dcat.jsonldを組織の既存カタログにマージするか、中継パイプラインで RDF カタログに変換してください。 - SHACL 完全準拠や Dataset Series は OKF 0.3 設計 の explicit non-goals です。
関連ドキュメント#
- OKF プロファイル —
type: datasetとビルド出力 - 設定(YAML) —
site.open_data - CLI リファレンス —
sorane build/sorane validate