Skip to content

Emory OMOP

Tips for Writing Queries Against OMOP

Emory OMOP

Emory Enterprise OMOP
Applications
Applications
- Code
  Code
- GUI
  GUI
Blog
Blog
- Tags
- Archive
  Archive
  - March 2026
- Categories
  Categories
Contact Us
Contact Us
Data in Enterprise OMOP
Data in Enterprise OMOP
- Data Mapping
  Data Mapping
  - Custom Concepts
    
    Custom Concepts
    
    Contributing Vocabularies
    
    Network Study Bifurcation
    
    Requesting Mappings
    
    Custom Vocabulary Strategy
  - Extract Load Transform (ELT)
    
    Extract Load Transform (ELT)
    
    Era Algorithms
    
    Era Algorithms
  - Vocabulary Mapping Coverage
    
    Vocabulary Mapping Coverage
- Data Quality
  Data Quality
  - Data Quality Design
    
    Data Quality Design
    
    Subsampling (Canaries)
    
    Subsampling (Canaries)
  - Data Quality Results
    
    Data Quality Results
  - DBT Tests
    
    DBT Tests
  - Known Issues
    
    Known Issues
- NLP Infrastructure
  NLP Infrastructure
- Observed Conventions
  Observed Conventions
  - Documented Adherence
    
    Documented Adherence
  - Emory Conventions
    
    Emory Conventions
  - OHDSI Conventions
    
    OHDSI Conventions
- Releases
  Releases
  - V0.2.x
    
    V0.2.x
    
    V0.2.1
    
    V0.2.1
    
    V0.2.2
    
    V0.2.2
    
    V0.2.3
    
    V0.2.3
    
    V0.2.4
    
    V0.2.4
  - V1.x
    
    V1.x
    
    V1.0.0
    
    V1.0.0
    
    V1.1.0
    
    V1.1.0
Divisions
Divisions
- BrainHealth
  BrainHealth
- Nursing
  Nursing
- Winship
  Winship
OMOP Primers
OMOP Primers
- Standardized Categories
  Standardized Categories
  - Clinical Data
    
    Clinical Data
    
    Conditions
    Conditions
    
    Condition Occurrence
    
    Condition Occurrence
    
    Derived Condition Era
    
    Derived Condition Era
    
    Death
    
    Death
    
    Derived Elements
    
    Derived Elements
    
    Device Exposure
    
    Device Exposure
    
    Drugs
    Drugs
    
    Derived
    
    Derived
    
    Dose Era
    
    Dose Era
    
    Drug Era
    
    Drug Era
    
    Drug Exposure
    
    Drug Exposure
    
    Episodes
    Episodes
    
    Episode
    
    Episode
    
    Episode Event
    
    Episode Event
    
    Fact Relationship
    
    Fact Relationship
    
    Measurement
    
    Measurement
    
    Notes
    Notes
    
    Note
    
    Note
    
    Note NLP
    
    Note NLP
    
    Observation
    
    Observation
    
    Person
    
    Person
    
    Procedure Occurrence
    
    Procedure Occurrence
    
    Specimen
    
    Specimen
    
    Visits
    Visits
    
    Visit Detail
    
    Visit Detail
    
    Visit Occurrence
    
    Visit Occurrence
  - Health Economics
    
    Health Economics
    
    Cost
    
    Cost
    
    Payer Plan Period
    
    Payer Plan Period
  - Health System
    
    Health System
    
    Care Site
    
    Care Site
    
    Location
    
    Location
    
    Provider
    
    Provider
  - Other
    Other
    
    Metadata
    
    Metadata
    
    Results
    
    Results
  - Vocabularies
    
    Vocabularies
- When to Use OMOP
  When to Use OMOP
Project and Product Management
Project and Product Management
- DevOps Philosophy
  DevOps Philosophy
- LLM Use Disclosure
  LLM Use Disclosure
- Product Roadmap
  Product Roadmap
  - Detailed Product Roadmap
Support
Support
- Access Requests
  Access Requests
  - ATLAS
    
    ATLAS
  - Databases
    
    Databases
Training
Training
- Emory
  Emory
  - ATLAS
    
    ATLAS
  - General Session Tools and Tips
    
    General Session Tools and Tips
  - R
    
    R
  - SQL
    
    SQL
    
    Query Library
    
    Query Library
- External Educational Resources
  External Educational Resources
  - OHDSI General
    
    OHDSI General

Tips for Writing Queries Against OMOP

Emory's OMOP data lake runs on Amazon Redshift. These tips will help you write efficient, correct queries against the OMOP Common Data Model.

Schema Layout

All standard OMOP CDM tables live in the cdm schema. Common tables you'll query:

Table	Contains
`cdm.person`	Demographics — one row per patient
`cdm.visit_occurrence`	Encounters (inpatient, outpatient, ER, etc.)
`cdm.condition_occurrence`	Diagnoses
`cdm.drug_exposure`	Medications
`cdm.procedure_occurrence`	Procedures
`cdm.measurement`	Labs, vitals, and other measurements
`cdm.observation`	Other clinical observations
`cdm.concept`	Vocabulary lookup — maps `concept_id` to human-readable names

Key Patterns

Always Join to `concept` for Readable Output

Raw OMOP tables store integer concept_id values. Join to cdm.concept to get names:

SELECT
    p.person_id,
    c.concept_name AS condition_name,
    co.condition_start_date
FROM cdm.condition_occurrence co
JOIN cdm.person p ON co.person_id = p.person_id
JOIN cdm.concept c ON co.condition_concept_id = c.concept_id
WHERE c.concept_name ILIKE '%diabetes%'
LIMIT 100;

Use Standard Concepts

Filter on standard_concept = 'S' when searching the vocabulary to get the canonical OMOP concept:

SELECT concept_id, concept_name, vocabulary_id
FROM cdm.concept
WHERE concept_name ILIKE '%hemoglobin a1c%'
  AND standard_concept = 'S'
  AND domain_id = 'Measurement';

Concept Hierarchies with `concept_ancestor`

Find all descendants of a high-level concept to capture related conditions or drugs:

SELECT DISTINCT descendant_concept_id
FROM cdm.concept_ancestor
WHERE ancestor_concept_id = 201826  -- Type 2 diabetes
;

Redshift-Specific Tips

Use ILIKE for case-insensitive text searches (Redshift-specific, not standard SQL)
Avoid SELECT * — Redshift is columnar; selecting only needed columns is significantly faster
Use LIMIT during exploration to avoid pulling millions of rows
Date functions — use DATEDIFF(day, start_date, end_date) for date arithmetic

Additional Resources