Загрузка данных в OpenSearch

Добавление отдельных документов. Массовая загрузка документов. Использование Data Prepper.

Существует несколько способов импорта данных:

  1. Добавление отдельных документов
    См. раздел Индексация документов

  2. Массовая загрузка документов
    См. раздел Пакетная индексация

  3. Использование Data Prepper
    Серверного сборщика данных OpenSearch для обработки перед анализом

  4. Другие инструменты
    См. Инструменты OpenSearch

Пакетная индексация

Для массовой загрузки используйте Bulk API:

POST _bulk
{ "create": { "_index": "students", "_id": "2" } }
{ "name": "Алексей Петров", "gpa": 4.2, "grad_year": 2025 }
{ "create": { "_index": "students", "_id": "3" } }
{ "name": "Мария Смирнова", "gpa": 4.8, "grad_year": 2024 }

Работа с тестовыми данными

OpenSearch предоставляет демонстрационный набор данных электронной коммерции.

Шаги для создания тестового индекса:

  1. Скачайте файлы:

    # Маппинг полей
    curl -O https://raw.githubusercontent.com/.../ecommerce-field_mappings.json
    
    # Данные для загрузки
    curl -O https://raw.githubusercontent.com/.../ecommerce.ndjson
    
  2. Примените схему полей:

    curl -H "Content-Type: application/json" -X PUT "https://localhost:9200/ecommerce" \
    -ku admin:ПАРОЛЬ --data-binary "@ecommerce-field_mappings.json"
    
  3. Загрузите данные:

    curl -H "Content-Type: application/x-ndjson" -X POST "https://localhost:9200/ecommerce/_bulk" \
    -ku admin:ПАРОЛЬ --data-binary "@ecommerce.ndjson"
    

Пример поиска:

GET ecommerce/_search
{
  "query": {
    "match": {
      "customer_first_name": "Светлана"
    }
  }
}

Визуализация данных

Инструкции по работе с визуализациями см. в руководстве по OpenSearch Dashboards.

Дополнительные материалы

Следующие шаги

Изучите раздел Поиск по данным для получения информации о возможностях поиска.