Search API

The Search API provides hybrid search capabilities combining vector similarity (pgvector) and full-text search (tsvector) across MRT example chunks.

Hybrid Search Test

Search across MRT example chunks using hybrid search combining vector similarity and full-text search.

POST /api/v1/search/hybrid-test

Request Body

{
  "document_set_key": "project-2024-001",
  "query": "safety findings and adverse events",
  "limit": 20,
  "vector_k": 50,
  "document_filters": ["Protocol*", "Safety*"],
  "only_text_search": false
}

Request Parameters

Parameter	Type	Required	Default	Description
`document_set_key`	string	Yes	-	Connector data ID for scoping search
`query`	string	Yes	-	Search query text (non-empty)
`limit`	integer	No	20	Max results (1-100)
`vector_k`	integer	No	50	Vector candidates (10-200)
`document_filters`	array	No	-	Document names to filter (wildcard support)
`only_text_search`	boolean	No	false	Skip vector search if true

Request Example

curl -X POST "https://api.artosai.com/api/v1/search/hybrid-test" \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "document_set_key": "project-2024-001",
    "query": "safety findings",
    "limit": 20,
    "document_filters": ["Protocol*"]
  }'

Python Example

import requests

url = "https://api.artosai.com/api/v1/search/hybrid-test"
headers = {
    "Authorization": "Bearer YOUR_TOKEN",
    "Content-Type": "application/json"
}

payload = {
    "document_set_key": "project-2024-001",
    "query": "safety findings",
    "limit": 20,
    "vector_k": 50,
    "document_filters": ["Protocol*"]
}

response = requests.post(url, headers=headers, json=payload)
results = response.json()
print(f"Found {results['total_results']} results")
for chunk in results['chunks']:
    print(f"- {chunk['content']} (score: {chunk['score']})")

Response

{
  "query": "safety findings",
  "document_set_key": "project-2024-001",
  "total_results": 3,
  "search_type": "hybrid",
  "chunks": [
    {
      "id": "chunk-uuid-1",
      "content": "Safety findings from the study include...",
      "score": 0.95,
      "rank": 1,
      "document_name": "Protocol_v2.pdf",
      "document_type": "CSR",
      "section_name": "Safety Analysis",
      "page_number": 42
    },
    {
      "id": "chunk-uuid-2",
      "content": "Adverse events were documented as follows...",
      "score": 0.89,
      "rank": 2,
      "document_name": "Safety_Report.pdf",
      "document_type": "CSR",
      "section_name": "Adverse Events",
      "page_number": 15
    }
  ]
}

Response Fields

Field	Type	Description
`query`	string	Search query executed
`document_set_key`	string	Document set key used
`total_results`	integer	Number of results
`search_type`	string	”hybrid” or “text”
`chunks`	array	Result chunks
`chunks[].id`	string	Chunk identifier
`chunks[].content`	string	Chunk text content
`chunks[].score`	number	Relevance score (0-1)
`chunks[].rank`	integer	Result ranking
`chunks[].document_name`	string	Source document name
`chunks[].document_type`	string	Document type
`chunks[].section_name`	string	Section within document
`chunks[].page_number`	integer	Page number (if available)

Status Codes

200 OK: Search completed successfully
400 Bad Request: Invalid request parameters (empty query, invalid limits)
401 Unauthorized: Missing or invalid Bearer token
500 Internal Server Error: Search operation failed

Search Types

The API supports two search modes: Hybrid Search (default):

Combines vector similarity (semantic search) and full-text search
Best for finding contextually relevant content
Slower but more accurate

Text-Only Search:

Uses only full-text search (tsvector)
Faster but less semantic understanding
Set only_text_search: true to use

Document Filtering

Filter results by document name using wildcard patterns:

# All documents starting with "Protocol"
"document_filters": ["Protocol*"]

# Multiple filters (OR logic)
"document_filters": ["Protocol*", "Safety*", "Report*"]

# Exact match
"document_filters": ["protocol.pdf"]

Relevance Scoring

Scores range from 0 to 1:

0.9+: Highly relevant
0.7-0.9: Relevant
0.5-0.7: Somewhat relevant
<0.5: Low relevance

Results are sorted by score (highest first).

Search Status

Get search service status and configuration (no authentication required).

GET /api/v1/search/status

Request Example

curl -X GET "https://api.artosai.com/api/v1/search/status"

Response

{
  "status": "healthy",
  "search_index": "mrt_example_chunks",
  "search_types": ["hybrid", "text"],
  "features": {
    "vector_search": true,
    "text_search": true,
    "document_filtering": true,
    "wildcard_filters": true
  },
  "defaults": {
    "limit": 20,
    "vector_k": 50
  }
}

Response Fields

Field	Type	Description
`status`	string	Service status
`search_index`	string	Index name
`search_types`	array	Available search types
`features`	object	Enabled features
`defaults`	object	Default parameters

Status Codes

200 OK: Service is healthy
503 Service Unavailable: Search service is down

Example Workflows

curl -X POST "https://api.artosai.com/api/v1/search/hybrid-test" \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "document_set_key": "project-2024",
    "query": "adverse events and safety concerns",
    "limit": 10,
    "document_filters": ["Safety*"]
  }'

Fast Text-Only Search

curl -X POST "https://api.artosai.com/api/v1/search/hybrid-test" \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "document_set_key": "project-2024",
    "query": "methodology",
    "limit": 50,
    "only_text_search": true
  }'

Search Across Specific Documents

curl -X POST "https://api.artosai.com/api/v1/search/hybrid-test" \
  -H "Authorization: Bearer $TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "document_set_key": "project-2024",
    "query": "statistical analysis",
    "document_filters": ["Protocol_v2.pdf", "Protocol_v1.pdf"]
  }'

Getting Started

API Reference

Core Concepts

SDK Reference

Cookbooks

Integrations

Deployment

Search API

Search API

Hybrid Search Test

Request Body

Request Parameters

Request Example

Python Example

Response

Response Fields

Status Codes

Search Types

Document Filtering

Relevance Scoring

Search Status

Request Example

Response

Response Fields

Status Codes

Example Workflows

Fast Text-Only Search

Search Across Specific Documents

Getting Started

API Reference

Core Concepts

SDK Reference

Cookbooks

Integrations

Deployment

​Search API

​Hybrid Search Test

​Request Body

​Request Parameters

​Request Example

​Python Example

​Response

​Response Fields

​Status Codes

​Search Types

​Document Filtering

​Relevance Scoring

​Search Status

​Request Example

​Response

​Response Fields

​Status Codes

​Example Workflows

​Find Safety-Related Content

​Fast Text-Only Search

​Search Across Specific Documents

Search API

Hybrid Search Test

Request Body

Request Parameters

Request Example

Python Example

Response

Response Fields

Status Codes

Search Types

Document Filtering

Relevance Scoring

Search Status

Request Example

Response

Response Fields

Status Codes

Example Workflows

Find Safety-Related Content

Fast Text-Only Search

Search Across Specific Documents