Data Provenance
Signal Foundry の source、evidence、coverage、ユーザー持ち込み data の境界を確認します。
このページの内容8項目
このページは、Signal Foundry の data provenance contract です。
Signal Foundry は source -> row -> column -> evidence -> run を保存します。v0 は company-first ですが、プロダクト定義は company API ではありません。agent は、出力された source と evidence を読み、coverage が弱い場合は silent 0 件にしません。
まず見る command
sf data capabilities --json sf companies search 7203 --json sf company observations jpx_7203 --limit 5 --json sf observations search "生成AI" --source edinet --json
見る key:
capabilities.sources[]capabilities.sources[].statuscompanies[].company.company_idresults[].matched_observations[]matched_observations[].sourcematched_observations[].evidencemeta.source_coveragemeta.warnings[]
source_coverage や warnings[] が弱い場合は、保存や export に進む前に人間へ制約を伝えます。
Source families
| Source family | 何を表すか | 主な surface | Credit boundary |
|---|---|---|---|
company_master | canonical company identity、listing membership、segment | companies search, profile, list estimate | read は無料 |
edinet_text_sections | 開示書類の本文 section / excerpt | observations search, filing show, company observations | read は無料 |
edinet_financial_facts | 財務 fact と period | list estimate, profile, filings | read / estimate は無料 |
listing_events | listing / delisting / market movement | list plan, list estimate | read / estimate は無料 |
website_enrichment | company website 由来の追加 column / evidence | list enrich --source website | found row だけ有料 |
user_source | CSV などユーザー持ち込み source | source import, inspect, map, resolve | import / map は無料、resolve は matched row 分 |
external_research | manual note や補助調査 item | research add, research ls | estimate に応じる |
parallel_enrichment | saved List 後の external enrichment summary | list enrich --source parallel | 実行対象 row 分 |
公開 docs では、source family を product claim ではなく evidence の出所として扱います。
Evidence states
| State | Meaning | Agent action |
|---|---|---|
present | claim に対応する source / evidence がある | 出力に含めてよい |
empty | 値が存在しない、または未保存 | claim にしない |
evidence_gap | claim はあるが根拠が足りない | 人間へ gap を返す |
weak | source coverage が弱い | 条件を分解して確認する |
unsupported | surface が対応していない | silent 0 件にしない |
needs_human | 自動判断すると誤確定し得る | 人間へ候補と理由を返す |
0 件 と unsupported は別です。source coverage が足りない時は、0 件成功として扱いません。
User-provided source
CSV や手元リストは、まず account-scoped source として保存します。
sf source import ./companies.csv --name "展示会リード" --json sf source inspect <sourceId> --json sf source map <sourceId> --entity company --column name=会社名 --column domain=URL --json sf source resolve <sourceId> --execute --max-credits <n> --json
credit boundary:
importは保存だけです。credit は使いません。inspectは headers / sample rows の確認です。credit は使いません。mapは source column と company field の対応付けです。credit は使いません。resolveは canonicalcompany_idへ確定した matched row 分だけ Basic credit を使います。multiple_candidatesは agent が勝手に確定しません。
見る key:
source.source_idsource.headers[]source.mappingsource.resolve_summary.matchedsource.resolve_summary.multiple_candidatesrun.resolved_countrun.multiple_candidates_countrun.not_found_countrun.review_required_countrows[].resolve_candidatesbilling.credits_used
EDINET evidence
EDINET 由来の text section と financial fact は、company observations、filings、cross-company search の根拠になります。
sf company filings jpx_7203 --limit 5 --json sf filing show jpx_7203 <filingId> --section-key business_risks --json sf observations search --technology generative_ai --source edinet --json
見る key:
filings[].filing_idfilings[].doc_idsections[].section_keysections[].excerptresults[].matched_observations[]meta.technology_aliasesmeta.source_coverage
section excerpt は根拠確認用です。raw filing text を UI に長く表示しません。
Website enrichment
website enrichment は saved List に追加 column と evidence を作ります。
sf list enrich <listId> --source website --estimate --json sf list enrich <listId> --source website --execute --max-credits <n> --json
見る key:
estimate.estimated_max_creditsestimate.reusable_existing_companiespreview_rows[]run.run_idrun.found_countrun.not_found_countrun.no_data_countbilling.credits_used
found になった row だけ credit を使います。not_found / no_data / skipped は課金対象ではありません。
Coverage boundary
| Boundary | 扱い |
|---|---|
| v0 entity | company-first。product definition は entity workspace |
| Local exchange / niche universe | coverage gap として扱う |
| Ambiguous company name | companies search で候補を固定する |
| Unsupported condition | list plan の unsupported_conditions[] を返し、人間に確認する |
| External private URL | 保存しない。public source URL か manual note に分ける |
| Raw transcript / API key / customer secret | 保存しない |
coverage が弱い場合は、sf data capabilities --json と該当 workflow の復旧手順へ戻ります。
次に読むページ
- source workflow: Source Import Workflow
- observations: Market Research
- credit contract: Credit Schedule
- API map: OpenAPI Endpoint Inventory