<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>https://doc.ruscomtech.ru/index.php?action=history&amp;feed=atom&amp;title=Kong_AI_Gateway</id>
	<title>Kong AI Gateway - История изменений</title>
	<link rel="self" type="application/atom+xml" href="https://doc.ruscomtech.ru/index.php?action=history&amp;feed=atom&amp;title=Kong_AI_Gateway"/>
	<link rel="alternate" type="text/html" href="https://doc.ruscomtech.ru/index.php?title=Kong_AI_Gateway&amp;action=history"/>
	<updated>2026-04-13T13:56:58Z</updated>
	<subtitle>История изменений этой страницы в вики</subtitle>
	<generator>MediaWiki 1.36.1</generator>
	<entry>
		<id>https://doc.ruscomtech.ru/index.php?title=Kong_AI_Gateway&amp;diff=6163&amp;oldid=prev</id>
		<title>IKuznetsov: Новая страница: «'''Kong AI Gateway''' — это набор функций, построенных на основе '''Kong Gateway''', разработанный для тог...»</title>
		<link rel="alternate" type="text/html" href="https://doc.ruscomtech.ru/index.php?title=Kong_AI_Gateway&amp;diff=6163&amp;oldid=prev"/>
		<updated>2026-02-04T16:39:22Z</updated>

		<summary type="html">&lt;p&gt;Новая страница: «&amp;#039;&amp;#039;&amp;#039;Kong AI Gateway&amp;#039;&amp;#039;&amp;#039; — это набор функций, построенных на основе &amp;#039;&amp;#039;&amp;#039;Kong Gateway&amp;#039;&amp;#039;&amp;#039;, разработанный для тог...»&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Новая страница&lt;/b&gt;&lt;/p&gt;&lt;div&gt;'''Kong AI Gateway''' — это набор функций, построенных на основе '''Kong Gateway''', разработанный для того, чтобы помочь разработчикам и организациям быстро и безопасно внедрять возможности искусственного интеллекта. Он предоставляет стандартизированный API-уровень, позволяющий клиентам использовать несколько сервисов ИИ из одной и той же клиентской кодовой базы.&lt;br /&gt;
&lt;br /&gt;
== Включить мониторинг ==&lt;br /&gt;
Убедитесь, что плагин '''Kong Prometheus'''﻿ включен и предоставляет метрики AI LLM.&lt;br /&gt;
&lt;br /&gt;
=== Kubernetes ===&lt;br /&gt;
Для мониторинга вашего кластера следуйте руководству по [[Настройка Ключ-АСТРОМ в Kubernetes|настройке Ключ-АСТРОМ в Kubernetes]].&lt;br /&gt;
&lt;br /&gt;
После этого добавьте следующие аннотации к вашим развертываниям '''Kong''':&lt;br /&gt;
&lt;br /&gt;
* &amp;lt;code&amp;gt;metrics.astromkey.com/scrape: &amp;quot;true&amp;quot;&amp;lt;/code&amp;gt;&lt;br /&gt;
* &amp;lt;code&amp;gt;metrics.astromkey.com/port: &amp;quot;8100&amp;quot;&amp;lt;/code&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== OpenTelemetry Collector ===&lt;br /&gt;
Для развертывания коллектора следуйте инструкциям по [[Развертывание Collector|установке OpenTelemetry Collector]]. При следующей конфигурации коллектор будет собирать метрики '''AI LLM''' каждые 10 секунд с конечной точки &amp;lt;code&amp;gt;kong-metrics.kong:8100&amp;lt;/code&amp;gt;.&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|receivers:&lt;br /&gt;
&lt;br /&gt;
  prometheus:&lt;br /&gt;
&lt;br /&gt;
    config:&lt;br /&gt;
&lt;br /&gt;
      scrape_configs:&lt;br /&gt;
&lt;br /&gt;
      - job_name: kong&lt;br /&gt;
&lt;br /&gt;
        scrape_interval: 10s&lt;br /&gt;
&lt;br /&gt;
        honor_labels: false&lt;br /&gt;
&lt;br /&gt;
        static_configs:&lt;br /&gt;
&lt;br /&gt;
          - targets:&lt;br /&gt;
&lt;br /&gt;
              - kong-metrics.kong:8100&lt;br /&gt;
&lt;br /&gt;
processors:&lt;br /&gt;
&lt;br /&gt;
  cumulativetodelta:&lt;br /&gt;
&lt;br /&gt;
    max_staleness: 25h&lt;br /&gt;
&lt;br /&gt;
extensions:&lt;br /&gt;
&lt;br /&gt;
  health_check:&lt;br /&gt;
&lt;br /&gt;
exporters:&lt;br /&gt;
&lt;br /&gt;
  otlphttp:&lt;br /&gt;
&lt;br /&gt;
    endpoint: ${env:DT_ENDPOINT}&lt;br /&gt;
&lt;br /&gt;
    headers:&lt;br /&gt;
&lt;br /&gt;
      Authorization: &amp;quot;Api-Token ${env:DT_API_TOKEN}&amp;quot;&lt;br /&gt;
&lt;br /&gt;
service:&lt;br /&gt;
&lt;br /&gt;
  extensions: [health_check]&lt;br /&gt;
&lt;br /&gt;
    metrics:&lt;br /&gt;
&lt;br /&gt;
      receivers: [prometheus]&lt;br /&gt;
&lt;br /&gt;
      processors: [cumulativetodelta]&lt;br /&gt;
&lt;br /&gt;
      exporters: [otlphttp]&lt;br /&gt;
|}&lt;br /&gt;
Kong не предоставляет встроенную функцию сбора метрик &amp;lt;code&amp;gt;kong-metrics&amp;lt;/code&amp;gt;, поэтому вам необходимо создать её с помощью следующего определения сервиса:&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
|apiVersion: v1&lt;br /&gt;
&lt;br /&gt;
kind: Service&lt;br /&gt;
&lt;br /&gt;
metadata:&lt;br /&gt;
&lt;br /&gt;
  name: kong-metrics&lt;br /&gt;
&lt;br /&gt;
  namespace: kong&lt;br /&gt;
&lt;br /&gt;
spec:&lt;br /&gt;
&lt;br /&gt;
  type: ClusterIP&lt;br /&gt;
&lt;br /&gt;
  ports:&lt;br /&gt;
&lt;br /&gt;
    - name: metrics&lt;br /&gt;
&lt;br /&gt;
      port: 8100&lt;br /&gt;
&lt;br /&gt;
      targetPort: 8100&lt;br /&gt;
&lt;br /&gt;
      protocol: TCP&lt;br /&gt;
&lt;br /&gt;
  selector:&lt;br /&gt;
&lt;br /&gt;
    app.kubernetes.io/name: kong&lt;br /&gt;
&lt;br /&gt;
    app.kubernetes.io/instance: kong&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== Spans ==&lt;br /&gt;
Для '''GenAI Spans''' доступны следующие атрибуты.&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
!Атрибут&lt;br /&gt;
!Тип&lt;br /&gt;
!Описание&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.completion.0.content&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Полный ответ, полученный от модели GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.completion.0.content_filter_results&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Результаты фильтрации ответа, полученного от модели GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.completion.0.finish_reason&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Причина, по которой модель GenAI перестала выпускать токены.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.completion.0.role&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Роль, используемая моделью GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.openai.api_base&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Адрес сервера GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.openai.api_version&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Версия API GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.openai.system_fingerprint&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Отпечаток пальца ответа, сгенерированного моделью GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.prompt.0.content&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Полный текст запроса, отправленного модели GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.prompt.0.role&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Настройка роли для запроса GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.prompt.prompt_filter_results&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Результаты фильтрации запроса, отправленного модели GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.request.max_tokens&amp;lt;/code&amp;gt;&lt;br /&gt;
|integer&lt;br /&gt;
|Максимальное количество токенов, которое модель генерирует для запроса.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.request.model&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Название модели GenAI, к которой направляется запрос.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.request.temperature&amp;lt;/code&amp;gt;&lt;br /&gt;
|double&lt;br /&gt;
|Температурный параметр для запроса GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.request.top_p&amp;lt;/code&amp;gt;&lt;br /&gt;
|double&lt;br /&gt;
|Параметр выборки top_p для запроса GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.response.model&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Название модели, которая сгенерировала ответ.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.system&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Продукт GenAI, идентифицированный с помощью клиентского или серверного программного обеспечения.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.usage.completion_tokens&amp;lt;/code&amp;gt;&lt;br /&gt;
|integer&lt;br /&gt;
|Количество токенов, использованных в ответе GenAI (завершение).&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.usage.prompt_tokens&amp;lt;/code&amp;gt;&lt;br /&gt;
|integer&lt;br /&gt;
|Количество токенов, использованных во входных данных GenAI (подсказке).&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;llm.request.type&amp;lt;/code&amp;gt;&lt;br /&gt;
|string&lt;br /&gt;
|Тип выполняемой операции.&lt;br /&gt;
|}&lt;br /&gt;
&lt;br /&gt;
== Метрики ==&lt;br /&gt;
После выполнения описанных выше шагов станут доступны следующие метрики:&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
!Метрическая система&lt;br /&gt;
!Тип&lt;br /&gt;
!Единица&lt;br /&gt;
!Описание&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;ai_llm_requests_total&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Общее количество запросов ИИ на одного поставщика ИИ в Kong.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;ai_llm_cost_total&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Стоимость запросов ИИ на один поставщик ИИ/кэш в Kong&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;ai_llm_provider_latency_ms_bucket&amp;lt;/code&amp;gt;&lt;br /&gt;
|histogram&lt;br /&gt;
|ms&lt;br /&gt;
|Задержки ИИ на одного поставщика ИИ в Kong&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;ai_llm_tokens_total&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|integer&lt;br /&gt;
|Общее количество токенов ИИ на один поставщик ИИ/кэш в Kong&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;ai_cache_fetch_latency&amp;lt;/code&amp;gt;&lt;br /&gt;
|histogram&lt;br /&gt;
|ms&lt;br /&gt;
|Задержки кэширования ИИ для каждого поставщика ИИ/базы данных в Kong.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;ai_cache_embeddings_latency&amp;lt;/code&amp;gt;&lt;br /&gt;
|histogram&lt;br /&gt;
|ms&lt;br /&gt;
|Задержки встраивания кэша ИИ для каждого поставщика ИИ/базы данных в Kong.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;ai_llm_provider_latency&amp;lt;/code&amp;gt;&lt;br /&gt;
|histogram&lt;br /&gt;
|ms&lt;br /&gt;
|Задержки поставщиков ИИ для каждого поставщика ИИ/базы данных в Kong.&lt;br /&gt;
|}&lt;br /&gt;
Кроме того, предоставляются следующие метрики.&lt;br /&gt;
{| class=&amp;quot;wikitable&amp;quot;&lt;br /&gt;
!Метрическая система&lt;br /&gt;
!Тип&lt;br /&gt;
!Единица&lt;br /&gt;
!Описание&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.client.generation.choices&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|&amp;lt;code&amp;gt;none&amp;lt;/code&amp;gt;&lt;br /&gt;
|Количество вариантов выбора, возвращаемых в результате выполнения запроса на завершение чата.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.client.operation.duration&amp;lt;/code&amp;gt;&lt;br /&gt;
|histogram&lt;br /&gt;
|&amp;lt;code&amp;gt;s&amp;lt;/code&amp;gt;&lt;br /&gt;
|Продолжительность работы GenAI.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;gen_ai.client.token.usage&amp;lt;/code&amp;gt;&lt;br /&gt;
|histogram&lt;br /&gt;
|&amp;lt;code&amp;gt;none&amp;lt;/code&amp;gt;&lt;br /&gt;
|Количество используемых входных и выходных токенов.&lt;br /&gt;
|-&lt;br /&gt;
|&amp;lt;code&amp;gt;llm.openai.embeddings.vector_size&amp;lt;/code&amp;gt;&lt;br /&gt;
|counter&lt;br /&gt;
|&amp;lt;code&amp;gt;none&amp;lt;/code&amp;gt;&lt;br /&gt;
|Размер возвращаемого вектора.&lt;br /&gt;
|}&lt;/div&gt;</summary>
		<author><name>IKuznetsov</name></author>
	</entry>
</feed>